Warum ist valides HTML im Code wichtig?
Wenn man liest was diverse SEOs zum Thema valides HTML und valides XHTML schreiben, findet man da drunter sehr viel Spekulation, Mythen, Halbwahrheiten und auch ein wenig Wahres über das, was man tun und lassen sollte um eine gute Position bei den Suchergebnissen (SERPs) durch valides HTML im Zuge der Onpage Optimierung zu erlangen.
Eine der ersten Sachen die man zu hören bekommt, ist dass bei der Ausgabe der Webseite unbedingt auf valides HTML im Quellcode zu achten ist. Auf Argumente für valides XHTML möchte ich im Folgenden eingehen.
Valides HTML bedeutet in diesem Sinne syntaktisch korrekt nach der Spezifikation vom W3C. Aber wozu soll das gut sein? Reicht es nicht, wenn der Browser meine Seite so darstellt wie ich mir das Vorstelle? Klares Nein, denn der Google Bot hat nun mal keine Augen, um die Seite optisch zu analysieren und wird sich daher nach dem HTML Quellcode richten. So ähnlich wie korrekte Grammatik.
Man kann sich dies sehr gut anhand folgender Parallelen vorstellen. Nimmt man anstatt einem HTML-Dokument einen deutschen Satz, so kann man die Validität, mit der grammatischen Korrektheit des Satzes vergleichen. Wenn ein Satz nicht korrekt ist, versuchen die meisten Menschen dennoch zu verstehen was dieser bedeuten sollte. Das klappt auch häufig aber nicht immer. Man vergleiche einfach mal Folgende zwei Sätze.
Es gibt eine neue, kontroverse Richtlinie für valides XHTML.
Es gibt eine neue kontroverse Richtlinie für valides XHTML.
Obwohl sich diese nur um ein Komma unterscheiden, ist die Bedeutung eine ganz andere. So ähnlich ist das mit dem HTML-Quelltext und diversen Programmen — wie z.B. Browser oder Suchmaschinen — die damit umgehen müssen. Man braucht validen HTML Code haben, damit diese Programme nicht raten müssen was gemeint seien könnte, denn wenn sie raten, können sie auch falsch liegen.
Ein weiterer Aspekt für valides XHTML: Semantik
Wenn man nun ein Schritt weiter geht, kommt man zur Semantik. HTML bietet viele Möglichkeiten, den HTML Code beim Schreiben entsprechend zu kennzeichnen. Während man zum Beispiel mit einen <font>-Tag das Aussehen einer Überschrift imitieren kann, so sagt ein <h1>-Tag das es sich hier um eine Überschrift erster Ordnung handelt. Das ist für Suchmaschinen, aber auch für Screenreader — die für Blinde unentbehrlich sind — eine wichtige Information. Google gewichtet zum Beispiel Wörter die in Überschriften vorkommen deutlich mehr, als Wörter die in einem Absatz erscheinen, da Überschriften ja den darauffolgenden Text beschreiben (oder es zumindest sollten).
Man könnte die Semantik mit dem Inhalt eines Satzes vergleichen. Es gibt grammatikalisch perfekte Texte die aber keinen Sinn ergeben. Ein Satz der Sinn ergibt ist ein semantisch korrekter Satz. Bei Quelltext kann dies in vielerlei Hinsicht nützlich sein, aber ein syntaktisch korrekter Quelltext ist einunabdingbares Kriterium.