HTTP-Statuscodes für SEOs

Die neuen Tools wie strucr, OnPage.org oder der Sistrix Optimizer zeigen, dass der Fokus von SEOs wieder wesentlich stärker auf der Optimierung des OnPage Bereich liegt und das nicht ohne Grund. Nur mit einer vernünftigen, crawlbaren Seite macht SEO eigentlich so richtig Spaß 🙂

Ich habe mir mal den Bereich der HTTP-Statuscodes herausgesucht, den ich etwas näher beleuchten möchte. Hier gibt es sicherlich noch einige interessante Optimierungsmöglichkeiten, die bisher noch nicht besprochen wurden.

Was sind HTTP-Statuscodes?

Ein HTTP-Statuscode wird als Antwort auf eine Anfrage, beispielsweise durch einen Internetbrowser, vom angefragten Server zurückgeliefert. Der Statuscode liefert dabei Informationen über den Zustand der angeforderten Seite oder des Dokumentes und wird im HTTP-Header mitgeliefert.

Generell sind die Stati in 5 Statusklassen unterteilt. Die 1xx Statuscodes liefern Informationen zur Anfrage, die 2xx Statuscodes werden geliefert, wenn eine Anfrage erfolgreich war, die 3xx Stati werden gesendet, wenn das Dokument umgeleitet wurde, 4xx Statuscodes stehen für Client-Fehler und 5xx Statuscodes für Server-Fehler.

Eine Übersicht über alle Statuscodes findet sich unter anderem auch auf w3.org.

Welche Statuscodes sind für SEOs wichtig?

Google und andere Suchmaschinen werten diese Statuscodes und verwenden sie für die Indexierung. Der eigene Webserver sollte also stets die richtigen Statuscodes zurückliefern um eine korrekte Indexierung zu gewährleisten. Ich halte die folgenden Statuscodes für wichtig im Hinblick auf SEO.

200 OK

Sofern das Dokument fehlerfrei übermittelt werden kann, sollte der Statuscode 200 geliefert werden. Dieser zeigt Google während des Crawls an, dass das Dokument zur Verfügung steht. Sofern es keine weiteren Onpage Faktoren gibt, die eine Indexierung verhindern (noindex, robotx.txt, etc.) wird die Seite von Google in den Index aufgenommen.

Im Idealfall sollten 90% der Seiten oder sogar mehr einen 200ter Statuscode zurückliefern.

301 Moved permanently

Liegt ein Dokument nicht mehr unter der alten URL beispielsweise http://domain.tld/seite1.html sondern unter einer neuen http://domain.tld/seite2.html und wird dort auch für eine ganze Weile zur Verfügung stehen, sollte seite1.html auf seite2.html per 301 Statuscode weiterleiten. Google nimmt diese Information während des Crawlens auf, entfernt seite1.html aus dem Index und fügt seite2.html zum Index hinzu. Es wird also gewährleistet, dass der Index stehts auf dem neusten Stand ist und der Nutzer auch die neuen, aktuellen Dokumente finden kann.

301 Weiterleitungen können jedoch nicht unbegrenzt nacheinandergeschaltet werden. Sollte sich die Anzahl der der aufeinanderfolgenden 301er häufen, ist aufräumen Angesagt. Laut Matt Cutts sollten es nicht mehr als 4-5 aufeinanderfolgende Redirects sein.

302 Moved temporarily

Sofern der Redirect des oben genannten Beispiels fälschlicherweise per 302 Statuscode durchgeführt wurde, nimmt Google seite2.html nicht in den Index auf. Die Information taucht demnach nicht im Google Index auf, da seite1.html ja nicht mehr existiert. Auch hierrauf geht Matt Cutts im obigen Video ein.

304 Not modified

Ein Statuscode, der früher häufiger genutzt wurde um den Crawler effizienter zu steuern, ist der 304 Statuscode. Er wurde ausgeliefert, wenn sich der Inhalt eines Dokumentes seit dem letzten Crawlforgang nicht geändert hat. Der Crawler übersprang die Seite und fuhr mit dem nächsten Dokument fort.

Seit dem Caffeine Update gilt dieser Statuscode als veraltet und wird eigentlich nicht mehr verwendet.

404 Not found

Ist ein Dokument auf einem Server nicht mehr verfügbar, wird der Statuscode 404 geliefert. Er zeigt an, dass das Dokument nicht erreichbar ist. Stellt Google während des Crawls fest, dass ein Dokument nicht mehr verfügbar ist, wird es langfristig aus dem Index entfernt. Der Crawler versucht jedoch das Dokument wieder und wieder anzufragen, was zu einer schlechteren Performance des Crawlvorgangs führt.

Man geht davon aus, dass es einen negativen Einfluß auf das Ranking haben kann, wenn ein Großteil der Seiten einer Webseite einen 404 Status zurückliefern. Die Anzahl der Fehler sollte also stets über die Google Webmaster Tools beobachtet und auf das mindestmögliche reduziert werden.

Neben dem 404 Fehler finden sich in den GWT auch häufig die sogenannten Soft 404 Fehler. Diese entstehen, wenn der Server anstatt eines 404 Statuscode einen 200ter Status zurückliefert. Hier sollte die Konfiguration des Servers geprüft und verändert werden.

410 Gone

Sofern ein Dokument gezielt unwiederbringlich gelöscht ist, ist es sinnvoll einen 410 Statuscode anstatt eines 404 Status zurück zu liefern. Dieser teilt dem Crawler mit, dass das Dokument wirklich gelöscht ist. Der Vorteil dabei ist, dass der Crawler das Dokument nicht wieder und wieder anfragt. Die Crawlperformance wird somit erheblich positiv beeinflußt und der 404 Fehler verschwindet auch aus dem Google Webmaster Tools.

503 Service Unavailable

Ist ein Server aufgrund von Wartungsarbeiten zeitweilig nicht erreichbar, sollte der Statuscode 503 gesendet werden. Erreicht der Crawler während der Downtime die Seite, teilt ihm der Statuscode mit, dass die Seite nur zeitweilig nicht zu erreichen ist.

Fälschlicherweise wird statt des 503 Statuscode häufig der Status 200 oder 404 gesendet. Gerade bei längeren Systemausfällen kann dies jedoch fatal für das Ranking sein.

SEOmoz hatte im letzten Jahr diese Infografik veröffentlicht, die auch ein paar interessante Erkenntnisse beinhaltet und hier natürlich nicht fehlen darf 🙂

Tools um den Statuscode zu checken

Wer mit dem Firefox arbeitet, kann den Statuscode mit HttpFox oder LiveHttpHeaders prüfen. Weiter kann man mit dem Firebug im Bereich „Netzwerk“ einen Überblick über die Statuscodes jedes angefragten Dokumentes während des Seitenaufbaus.

Online kann man den Status beispielsweise über das Tool von SEOBook abfragen.

Die gängigen Statuscodes liefert auch der Screamingfrog nach dem Crawl.

Fazit

Das richtige Ausliefern der Statuscodes ist essentiell im SEO. Ein regelmäßiger Check der Serverkonfiguration und das Prüfen der Webmaster Tools hinsichtlich des Crawlings stellt einen wichtigen Teil unseres Jobs dar. Da der Einfluß, den wir im Offpage Bereich hatten, durch die neusten Google Updates wie Pinguin immer stärker schwindet, bietet der Onpage Bereich noch immer einiges an wirksames Optimierungspotential, das genutzt werden sollte.

2 Antworten auf „HTTP-Statuscodes für SEOs“

Hi Stefan,

sehr strukturierter und umfassender Artikel- alles wie immer. 🙂

Bis die Tage

Bernie

Schöner Artikel. Hier wird nochmal klar, dass man nicht nur eine Seite aufbauen soll, sondern sie auch prüfen muss. Viel zu oft treffe ich z. B. auf Seiten die angeblich eine 301 Weiterleitung haben sollen und in Wirklichkeit ist es eine 302 😉