Inhaltsverzeichnis
Was ist eine Sitemap?
- vollständige hierarchisch strukturierte Auflistung aller Unterseiten, Bilder, Videos und anderen Dateien einer Webseite
- Zusammenhänge zwischen diesen Dateien
- bietet den Bots der Suchmaschinen die Möglichkeit, eine Webseite schneller zu crawlen und zu verstehen
- Beispiele:
- enthält alle Unterseiten, die für die Indexierung vorgesehen sind
- auch eine Auflistung für User wird als Sitemap bezeichnet
- wird manuell oder über das CMS erstellt und über die Google Search Console eingereicht
- in robots.txt hinterlegen mit folgendem Code: “Sitemap: http://example.com/sitemap.xml”
- Google erlaubt nur Sitemaps, die maximal 50.000 URLs enthalten und 50 MB groß sind
Wann ist eine Sitemap essenziell?
- umfangreiche Webseiten mit vielen Seiten
- Vorteil: neue oder kürzlich aktualisierte Seiten werden beim Crawlen nicht übersehen
- Unterseiten verweisen nicht aufeinander
- mangelhafte interne Verlinkungen können dazu führen, dass die Suchmaschine Seiten übersieht
- Webseite ist neu und/oder wird extern nicht verlinkt
- fehlende externe Verlinkungen können dazu führen, dass die Suchmaschine Seiten übersieht
- Google sagt zwar, dass bei kleinen oder textlastigen Seiten sowie Webseiten mit einem guten Linkprofil eine Sitemap unter Umständen nicht notwendig ist, aber sicher ist sicher!
- Ziele: schnelle und vollständige Indexierung; Indexierung trotz fehlender Verlinkung; schnelle Erkennung von Änderungen
Was hat in der Sitemap nichts verloren?
- Duplikate: nur eine Version einer URL in die Sitemap aufnehmen. (Bspw. nicht “https://www.seo-nest.de/seo-blog/” mit Trail Slash und “https://www.seo-nest.de/seo-blog” ohne Trail Slash)
- Fehlerseiten mit Status-Code 404 bzw. 410
- Weiterleitungen: nur eindeutige URLs, da Weiterleitungen in der Sitemap den Bot verwirren können
- URLs mit Canonical-Tag, der eine andere Seite als kanonisch auszeichnet, und Noindex-Tag: Diese zeigen der Suchmaschine an, dass keine Indexierung erfolgen soll.