HTML Archives – Stefan David

Beim Hören der heute erschienenen Ausgabe 19 von SEO-House wurde ich mal wieder daran erinnert, dass ich noch was zum Thema HTML5 für SEOs schreiben wollte. Markus hat in der Sendung auf die HTML5-Session mit JohnMu auf der SMX hingewiesen und sich beklagt, dass dort wenig auf die neuen Elemente eingegangen wurde, die in HTML5 zur Verfügung stehen. Das habe ich zwar ebenso empfunden, ich denke aber auch, dass das beim anwesenden Publikum meist jenseits des Verständnisses gewesen wäre. Mir schien der Anteil an Frontend-Leuten eher klein zu sein. Um bei den HTML5-Elementen in die Tiefe zu gehen, bedarf es schon einigem technischem Vorwissen.

Trotzdem wäre ein Überblick über header, nav, footer, article, aside und section gar nicht schlecht gewesen. Das hätte man sicher in fünf Minuten anreißen können. Ich möchte aber hier auch gar nicht auf die einzelnen neuen Elemente eingehen, das haben andere schon ausführlich erledigt. Den Nutzen im Hinblick auf SEO sehe ich derzeit noch nicht, es gibt aber keinen Grund, die Elemente bei neuen Projekten oder Relaunchs auch jetzt schon zu verwenden. Wenn der Parser von Google die Elemente irgendwann verstehen sollte, ist es deutlich einfacher, den Unterschied zwischen Inhalten, Navigation und Fußbereich zu erkennen (nur als Beispiel), wobei ich aber denke, dass Google das auch jetzt schon sehr gut kann.

Überschriftenhierarchien in HTML5

Mir geht es viel eher um eine andere Möglichkeit, die uns die Spezifikation an die Hand gibt: Das Ermitteln von Überschriftenebenen aus der Document-Outline. Jetzt fragen sich die meisten vermutlich „Was möchte der komische Mann von uns?“, daher mal ein Beispiel:

Eine Seite hat eine H1-Überschrift, ein Bereich der Seite wird mit einer H2-Überschrift eingeleitet, ein Artikel darin beginnt mit einer H3 und Abschnitte des Artikels tragen dann folgerichtig sogar noch eine H4 (z. B. „Einleitung“, „Fazit“). Damit wird sowohl in alten Versionen von (X)HTML als auch in HTML5 eine korrekte Hierarchie von Überschriften dargestellt.

Die Spezifikation von HTML5 ermöglicht aber nun die automatische Erkennung dieser Hierarchie unabhängig vom angegebenen Element (H1–H6). Die Hierarchie wird hierbei allein durch die Position in der Document-Outline festgelegt. Der Vorteil liegt darin, dass man beim Anlegen des Dokuments ausschließlich H1-Überschriften verwenden kann, die vom Parser dann der richtigen Ebene zugeordnet werden. Gerade bei Content-Syndication ist das natürlich von Vorteil. Wenn ich einen Artikel an mehreren Stellen verwende, z. B. komplett auf der Artikelseite und als Auszug auf einer Start- oder Übersichtsseite, muss ich mir um die Verschachtelungstiefe der Überschriften keine Gedanken mehr machen. Ein riesiger Vorteil für Nachrichtenseiten!

Um beim Beispiel oben zu bleiben, haben wir also eine H4-Überschrift namens „Fazit“ innerhalb des Artikels. In der Outline (keine Ahnung, wie man die darstellt) haben wir also body h1 > section h2 > article h3 > section h4. Im erzeugten HTML steht aber an jeder der genannten Stellen eine H1! Ich hoffe, das ist inhaltlich halbwegs verständlich.

Geil, 40 mal H1 auf der Seite

Jetzt könnte man als unbedarfter (oder testender) SEO natürlich auf die Idee kommen, dass man tatsächlich jede Überschrift auf einer Startseite als H1 auszeichnet, um Google zu zeigen, wie wichtig das doch alles ist. Und weil es so in der Spezifikation steht und Google selbst ja schließlich vehement den sofortigen Einsatz von HTML5 empfiehlt, kann das ja wohl kaum als Spamming angesehen werden. Um genau das herauszufinden, habe ich nach der Session auf der SMX JohnMu direkt darauf angesprochen. Das hätte ich natürlich auch in der Fragerunde am Ende tun können, mir schien der Sachverhalt aber zu speziell und zu erklärungsbedürftig. Die Antwort war Google-typisch ausweichend: Ich sollte mir dabei keine allzu großen Sorgen machen und wahrscheinlich würde das kein Problem geben. Was er aber eindeutig sagte, war, dass der Google-Bot derzeit noch keinen HTML5-Parser hat. Die Überschriften kämen also in diesem Beispiel alle als H1 an, nicht in der gewollten Hierarchie.

Ich möchte nun natürlich nicht seine Aussage anzweifeln, für mich sieht das dann aber schon danach aus, als könnte das ein wenig spammy wirken. Man stelle sich die Startseite eines Nachrichtenportals vor, auf der dann 40–60 Überschriften erster Ordnung erkannt werden, jeweils gefolgt von zwei Zeilen Text. Selbst wenn dann ein Quality-Rater draufschaut, müsste der erst mal mit HTML5 ziemlich gut vertraut sein, um die Richtigkeit des Tuns zu erkennen. Mir wäre das Risiko eindeutig zu hoch. Zumindest habe ich für einen anstehenden Relaunch unseres Shops dieses Vorgehen weit von mir gewiesen. Die Gefahr, damit in einen Filter zu laufen, ist mir deutlich zu hoch.

Ganz nebenbei habe ich auch gelesen (die Quelle finde ich gerade nicht), dass Screenreader mit der hierarchischen Einordnung der Überschriften auch noch nicht umgehen können. Das sehe ich zumindest noch als weiteren wichtigen Grund, auf die Möglichkeiten zu verzichten. Die sonstigen Elemente sollte man aber verwenden, es spricht aus meiner Sicht nichts dagegen.

Sollte jemand mal einen Testballon Richtung H1-Häufung starten wollen, bin ich sehr am Ergebnis interessiert. Auch andere Hinweise im Bezug auf HTML5 und SEO sind hier gern gesehen. Sollte ich hier Quatsch geschrieben haben, sind die Hinweise natürlich ebenfalls willkommen.

Schlagwort: HTML

HTML5 – die Vorteile und Risiken für SEO

Überschriftenhierarchien in HTML5

Geil, 40 mal H1 auf der Seite

Hovereffekte mit CSS-Sprites

Webstandards verinnerlichen („How to Grok Web Standards“)

von Craig Cook