Suche Menü

XML-Sitemap für SEO: was sie bringt und worauf du achten musst

Geschrieben am: 30. August 2022 | Zuletzt aktualisiert: 30. August 2022 | Lesezeit: ca. 11 Min.

XML-Sitemap

XML-Sitemaps spielen bei der technischen Suchmaschinenoptimierung oft eine zentrale Rolle: sie präsentieren Google und anderen Suchmaschinen alle URLs einer Website im maschinenlesbaren XML-Format, sodass die Suchmaschinen die URLs nur noch crawlen und indexieren müssen.

Was du beim Erstellen einer XML-Sitemap beachten solltest, warum sie bezüglich SEO oft überschätzt wird und warum du sie trotzdem einsetzen solltest, erfährst du in diesem Beitrag.

Das Wichtigste in Kürze

  • XML-Sitemaps helfen Google und anderen Suchmaschinen neue URLs zu erkennen, um diese zu crawlen und zu indexieren
  • Eine Sitemap kann Informationen zu Seiten, Bildern oder Videos beinhalten.
  • Das Ranking wird durch eine Sitemap nicht beeinflusst
Inhaltsverzeichnis

Was sind XML-Sitemaps überhaupt?

Wie der Name schon sagt, handelt es sich bei einer Sitemap um eine “Karte” oder viel mehr einen Plan einer Website. Dabei muss zwischen zwei Arten von Sitemaps unterschieden werden.

HTML-Sitemaps und XML-Sitemaps

  • HTML-Sitemap: sie bilden die Struktur einer Website in Form eines HTML-Dokuments ab, sodass diese sowohl von Suchmaschinen als auch von Menschen gelesen werden können.
  • XML-Sitemap: sie sind im maschinenlesbaren XML-Format aufbereitet und können so in erster Linie von Suchmaschinen und anderen Websitecrawlern verarbeitet werden
HTML Sitemap zeit.de

HTML Sitemap auf zeit.de

Google hat im Jahr 2005 damit begonnen, Webmastern zu ermöglichen, die Struktur Ihrer Website als XML-Datei bei ihnen einzureichen, um das Crawling der Seite zu beschleunigen. Neben Verlinkungen sind XML-Sitemaps also ein Mittel, um eine URL bei Google indexiert zu bekommen.

Seit 2007 bietet auch Microsoft Bing an, die Struktur der Website als XML-Datei bei ihnen einzureichen.

Nachdem die Sitemap bei Google oder Bing eingereicht wurde, werden die darin enthaltenen URLs in die Liste der zu crawlenden URLs aufgenommen und sobald sie an der Reihe sind gecrawlt.

Auswirkungen von Sitemaps auf das Crawling, Indexierung und Ranking

Damit sind wir beim Punkt, warum Sitemaps häufig überschätzt werden, sie können zwar das Crawling beschleunigen, wirken sich aber nicht positiv auf das Ranking der Website in den Suchergebnissen aus. Das hat Google’s Gary Illyes im Jahr 2019 auf Twitter bestätigt:

Auch wenn der Einsatz einer XML-Sitemap kein Rankingfaktor ist, können sie trotzdem einiges an Mehrwert bringen:

  • Auffindbarkeit: Suchmaschinen können Unterseiten, die schlecht verlinkt sind, über die XML-Sitemap leicht auffinden und crawlen
  • Alternative Content-Formate: Sitemaps sind nicht darauf begrenzt, Verweise auf HTML-Seiten zu enthalten. Sie können auch Links zu Bildern und Videos enthalten
  • Sprachsteuerung: als Alternative zu hreflang-Attributen im HTML können auch XML-Sitemaps verweise auf alternative Sprachen der Website beinhalten

Wenn auch die Verweise aus einer Sitemap keinen PageRank vererben und auch sonst keinen Rankingvorteil bringen, können sie sich dennoch positiv auf die Performance einer Website in den Suchergebnissen auswirken. Denn: je schneller und umfassender deine Website indexiert wird, desto eher hast du Chancen, damit zu ranken.

Außerdem sind Sitemaps ein gutes Mittel, um einen Überberblick über alle relevanten URLs der Website zu bekommen. Das macht sie auch für kleinere Websites wertvoll.

Mit Hilfe einer Sitemap kann beispielsweie in der Search Console geprüft werden, wie viele der per Sitemap an Google geschickten URLs indexiert sind. Auch können Crawler wie Screaming Frog auf die Sitemap zugreifen, um beim Crawlen der Website alle wichtigen Seiten zu finden.

Sitemap Indexierungsstatus Search Console

Indexierungsstatus einer Sitemap in der Google Search Console

Das bringt uns zum nächsten Punkt:

Was sollte in einer XML-Sitemap enthalten sein (und was nicht)?

Grundsätzlich sollte jede URL, die indexiert werden soll, auch in der XML-Sitemap enthalten sein. Da Sitemaps in der Regel automatisiert erstellt werden, können folgende Anforderungen an die Entwickler gestellt werden:

Die Sitemap sollte Seiten beinhalten, die alle dieser Punkte erfüllen:

  • Alle URLs, die eine Meta Robots Angabe index haben
  • Alle URLs, die über ein selbst referenzierendes Canonical Tag verfügen
  • Alle URLs, die mit einem Status Code 200 antworten

Nicht enthalten sein sollten URLs, die nicht alle der oben genannten Punkte erfüllen oder

  • per Robobts.txt vom Crawling ausgeschlossen sind

Sitemaps manuell erstellen

Hinweis

Falls dein System keine automatisierten Sitemaps erstellen kann, findest du weiter unten im Beitrag ein paar Empfehlungen zu Sitemap-Generatoren.

Aufbau einer XML-Sitemap

Der Aufbau einer einfachen XML-Sitemap ist relativ simpel: zu Beginn steht immer ein XML-Tag, das die XML-Version und den Zeichensatz (Encoding) enthält:

<?xml version="1.0" encoding="UTF-8"?>

Gemäß den Spezifikationen von sitemaps.org muss der Zeichensatz UTF-8 sein.

Anschließend folgt ein urlset-Tag, das alle weiteren Inhalte umschließt und außerdem einen Verweis auf das Sitemap-Protokolls (den Namespace) enthält (in der Regel: https://www.sitemaps.org/schemas/sitemap/0.9/)

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
</urlset> 

In dieses urlset-Tag eingebettet werden nun die eigentlichen Verweise auf die in der Sitemap enthaltenen URLs. Diese wiederum sind in ein url bzw. loc-Tag eingebettet:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <url>
    <loc>http://www.domain.de/unterseite.html</loc>
  </url>
</urlset>

Für jeden weiteren Eintrag folgt eine weiteres url und loc-Tag innerhalb des urlset-Tags:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <url>
    <loc>http://www.domain.de/unterseite.html</loc>
  </url>
  <url>
    <loc>http://www.domain.de/unterseite-2.html</loc>
  </url>
</urlset>

Damit ist die Sitemap bereits einsatzfähig.

Es können auch zusätzliche informationen über einzelne URLs per Sitemap an Suchmaschinen übergeben werden:

  • lastmod: Das Datum der letzten Aktualisierung der URL im Format YYYY-MM-DD.
  • changefreq: Wie häuifig die URL aktualisiert wird, z. B. hourly oder daily
  • priority: Die Priorität der URL im Verlgleich zu den restlichen URLs der Website.

Attribute und ihre Bedeutung

Hinweis

In welcher Form diese Tags von Google genutzt werden ist umstritten. Bzw. es kursieren widersprüchliche Aussagen dazu im Netz. Im Podcast “Search off the Record” vom Mai 2022 sagt Gary Illyes, dass Google keines dieser Tags nutzen würde. Zwei Jahre zuvor meinte John Mueller noch, dass sie bei korrektem Einsatz kann Google das Tag lastmod heranziehen, um das Crawling zu priorisieren. (Quelle). Grundsätzlich kann davon ausgegangen werden, dass alle Angaben, die in der Sitemap gemacht werden durch Crawling verifiziert werden.

Wie bereits angedeutet können Sitemaps noch viel mehr als nur Verweise auf HTML-Dokumente enthalten:

Bilder-Sitemap

Sehr nützlich für die Indexierung von Bildern ist der Einsatz einer Bilder-Sitemap. Diese muss nicht separat erstellt werden, sondern kann strukturiert die Bilder auflisten, die zu einer bestimmten Seite gehören.

Dazu muss die Sitemap lediglich um ein öffnendes image:image und ein schließendes -Tag erweitert werden. Dieses Tag enhält dann in einem image:loc-Tag den Verweis auf die URL des Bildes:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9" xmlns:image="http://www.google.com/schemas/sitemap-image/1.1">
  <url>
    <loc>http://www.domain.de/unterseite.html</loc>
    <image:image>
      <image:loc>http://www.domain.de/bild.jpg</image:loc>
    </image:image>
  </url>
</urlset>

Wichtig ist, dass das urlset-Tag um den Bilder-Sitemap-Namespace “xmlns:image=”http://www.google.com/schemas/sitemap-image/1.1” erweitert wird.

So können bis zu 1.000 Bilder pro Sitemap an Google übermittelt werden. Auch ist es erlaubt, Bilder, die nicht auf der eigenen Domain liegen, auf diese Weise in die Sitemap zu integrieren. Davon profitieren Webseiten, die ihre Bilder auf einer externen Domain (z.B. einem CDN) gespeichert haben.

Video-Sitemap

Bei Video-Sitemaps besteht die Möglichkeit eine separate Sitemap zu erstellen, oder die Videos in der “normalen” Sitemap zu verlinken. Auch hier gibt es ein öffnendes und schließendes Tag, in das die Verlinkung zur Video-URL eingebettet ist: video:video und /video:video

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9" xmlns:image="http://www.google.com/schemas/sitemap-image/1.1">
  <url>
    <loc>http://www.domain.de/unterseite.html</loc>
    <image:image>
      <image:loc>http://www.domain.de/bild.jpg</image:loc>
    </image:image>
    <video:video>
      <video:content_loc>http://www.domain.de/video.mp4</video:content_loc>
      <video:thumbnail_loc>http://www.domain.de/videovorschaubild.jpg</video:thumbnail_loc>
      <video:title>Titel des Videos</video:title>
      <video:description>Beschreibung des Videos</video:description>
    </video:video>
  </url>
</urlset>

Auch für Video-Sitemaps gibt es zusätzliche Attribute, die auch von Google ausgelesen werden und auch erforderlich sind:

  • video:thumbnail_loc Ein Verweis auf ein Vorschaubild des Videos
  • video:title Für den Titel des Videos
  • video:description Für eine kurze Beschreibung des Videos
  • video:content_loc Der Link zur Mediendatei des Videos. Bei Videos, die per embed-Tag eingebunden werden kann video:player_loc verwendet werden, das auf den Wert im src-Element des embed-Tags verweist

Darüber hinaus gibt es eine vielzahl an optionalen Informatioen, die in der Video-Sitemap an Google geschickt werden können. Dieser findest du auf der Google-Seite zum Thema Video-Sitemaps.

Restriktionen

Warnung

Gemäß Google darf eine Sitemap nicht mehr als 50.000 URLs enthalten und dabei nicht größer als 50 MB sein. Außerdem sollte immer stets auf die kanonische URL verweiwsen werden. Solltest du für Desktop und Mobile unterschiedliche URLs verwenden, sollte es nur eine Sitemap für eine der beiden Versionen geben.

Index-Sitemap

Die Beschränkung auf maximal 50.000 URLs ist für große Websites (für die Sitemaps besonders wichtig sind) nicht ausreichend. Deshalb können auch mehrere Sitemaps bei Google eingereicht werden. Diese einzelnen Sitemaps können in einer einzelnen Index-Sitemap verlinkt werden.

Die Index-Sitemap ist wie folgt aufgebaut:

<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <sitemap>
    <loc>http://www.domain.de/sitemap1.xml</loc>
  </sitemap>
  <sitemap>
    <loc>http://www.domain.de/sitemap2.xml</loc>
  </sitemap>
</sitemapindex>

Dieses Prinzip kann man sich zunutze machen, um Teilbereiche der Website in einzelnen Sitemaps abzubilden. So kannst du in der Google Search Console sehen, wie es um die Indexierung dieser Bereiche bei Google bestellt ist:

<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <sitemap>
    <loc>http://www.domain.de/kategorien.xml</loc>
  </sitemap>
  <sitemap>
    <loc>http://www.domain.de/produktseiten.xml</loc>
  </sitemap>
  <sitemap>
    <loc>http://www.domain.de/content-seiten.xml</loc>
  </sitemap>
</sitemapindex>
Michael Göpfert - SEO in München
SEO Hilfe gesucht?

In einem kostenlosen Erstgespräch besprechen wir deine Situation und wie wir die SEO-Potenziale deiner Website nutzen können.


Jetzt unverbindlich Kontakt aufnehmen

Sitemap Generatoren

Wenn dein CMS nicht in der Lage ist, automatisiert Sitemaps zu generieren zu lassen diese sich auch manuell erstellen und (beispielsweise per FTP) auf den Server deiner Website hochladen.

Für das Erstellen der Sitemaps gibt es zahlreiche kostenlose Dienste, die deine Website crawlen und daraus eine XML-Sitemap erstellen. Diese sind jedoch häufig limitiert, so kann oft nur eine bestimmte Anzahl an URLs in die Sitemap aufgenommen werden.

Wenn auf ein kostenpflichtiges Tool gesetzt werden kann, empfehle ich den Screaming Frog SEO Spider. Er ist in Sachen Preis/Leistung unschlagbar und kann weit mehr als nur bei der Erstellung von Sitemaps unterstützen. Bei der Generierung der Sitemap besticht Screaming Frog auch mit zahlreichen Features:

  • hreflang-Unterstützung
  • Integration von Bildern
  • Manuelles ausschließen von einzelnen URLs aus der Sitemap
  • Zusatzinformationen wie lastmod, changefreq und priority

Außerdem ist es bei Screaming Frog möglich eine eigene Liste an URLs zu crawlen und daraus eine Sitemap erstellen zu lassen.

XML Sitemap Screaming Frog

XML-Sitemap Erstellung mit dem Screaming Frog

Sitemap für WordPress-Seiten

Viele Webseiten sind auf Basis von WordPress erstellt. Umso erstaunlicher ist es, dass WordPress trotz Ankündigung im Jahr 2020 nativ keine XML-Sitemaps erstellen kann. Was aber auch nicht schlimm ist, denn: solange WordPress keine Möglichkeit bietet Seiten auf Noindex zu setzen oder mit Canonicals zu arbeiten ist man ohnehin auf eine Erweiterung angewiesen.

Für WordPress User ist es also ohnehin sinnvoll auf ein SEO-Plugin zu setzen, die auch das Erstellen der Sitemap übernehmen. Erweiterungen, die das können, gibt es wie Sand am Meer. Ich habe sowohl mit Yoast als auch mit RankMath in Sachen Sitemaps gute Erfahrungen gemacht.

Sitemap bei Google Anmelden

Ist eine Sitemap generiert, muss diese noch bei Suchmaschinen bekannt gemacht werden. Dazu gibt es zwei simple Wege:

  1. Ein Verweis in der Robots.txt auf die Sitemap reicht aus, um die meisten Suchmaschinen zu triggern, die Sitemap zu crawlen
  2. Außerdem kann die Sitemap in der Google Search Console und den Bing Webmater Tools manuell einreicht werden

Ich empfehle stets beide Wege zu nutzen. Der Eintrag in der Robots.txt ist in der Regel schnell gemacht, die meisten SEO Plugins für WordPress machen dies ganz automatisch.

Der Eintrag in der Robots.txt erfolgt nach diesem Muster:

sitemap: http://www.domain.de/sitemap.xml

Der manuelle Eintrag in der Search Console ist wichtig, um die Sitemap auch in der Console beobachten zu können. Wenn Google die Sitemap über die Robots.txt findet, wird sie nicht in der Search Console angezeigt, auch wenn sie Google bekannt ist.

Hier findest du eine schnelle Anleitung, die Sitemap in der Search Console anzumelden.

Sitemaps können auch manuell an Google mit einem sogenannten Ping geschickt werden. Dazu muss im Browser folgende URL aufgerufen werden:

http://www.google.com/ping?sitemap=http://www.domain.de/sitemap.xml

Google News Sitemaps

Eine wesentlich größere Rolle spielt die Sitemap im News-Bereich. Wer in Google News gefunden werden möchte, kommt um eine News-Sitemap nicht herum. Deshalb bestehen an eine News-Sitemap auch mehr Anforderungen.

  • Die darf nur URLs zu Artikeln beinhalten, die in den letzten 48 Stunden veröffentlicht wurden
  • Eine einzelne News-Sitemap darf maximal 1.000 URLs beinhalten. Gibt es mehr News-Artikel, kann die Sitemap in mehrere Sitemaps gesplittet werden.

Auch bei der Syntax müssen einige Dinge beachtet werden. Innerhalb des url-Tags folgt ein news:news-Tag, das zusätzliche Informationen an Google News übermittelt:

Innerhalb des Tags news:publication werden mit weiteren Tags Informationen über den Publisher an Google News übermittelt.

  • news:name: Name des Publishers
  • news:language: Sprache, in der der Content veröfentlicht wurde als zwei oder dreistelliger Sprachcode (nach ISO 639).

Desweiteren gibt es noch die Tags

  • news:publication_date: Das Datum, an dem der Artikel veröffentlicht wurde im Format YYYY-MM-DD
  • news:title: Der Titel des News-Artikels

Beispiel für eine News-Sitemap

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
        xmlns:news="http://www.google.com/schemas/sitemap-news/0.9">
  <url>
   <loc>http://www.domain.de/newsArtikel.html</loc>
   <news:news>
   <news:publication>
     <news:name>Deine Zeitung</news:name>
     <news:language>de</news:language>
   </news:publication>
   <news:publication_date>2022-11-03</news:publication_date>
     <news:title>Alles wichtige zur Bundestagswahl</news:title>
    </news:news>
  </url>
</urlset>

Auch die Google News Sitemap sollte in der Googel Search Console eingereicht werden.

Anmeldung bei Google News nicht vergessen

Warnung

Eine News-Sitemap reicht alleine nicht aus, um bei Google News gelistet zu werden. Zusätzlich benötigt es eine Anmeldung im Google Publisher Center.

Alternative Sitemap-Formate

Was häufig etwas untergeht: Google unterstützt auch andere Formate als XML als Sitemap. Dazu gehören:

  • RSS & mRSS
  • Atom 1.0
  • Text (.txt)

Diese alternativen Sitemap-Formate sind aber nur eine B-Lösung. Viele Informationen, die eine XML-Sitemap übermitteln kann (Bilder, Videos etc.) können per RSS-Feed oder txt-Datei nicht übermittelt werden. Zudem sind im RSS-Feed häufig nur die neusten Artikel enthalten, sodass die Anzahl an eingereichten URLs nicht vollständig ist.

RSS Feed als Sitemap in der Google Search Console

Unvollständig: RSS Feed als Sitemap in der Google Search Console

Außerdem sorgt ein guter Sitemap-Mechanismus dafür, dass nur URLs an Suchmaschinen gesendet werden, die auch indexiert werden sollen.

Fazit

Auch wenn XML-Sitemaps kein Rankingfaktor sind, haben sie doch ihre Berechtigung. Vor allem Seiten mit mehr als 10.000 URLs und News-Publisher könnten durch den Einsatz von Sitemaps in Sachen Indexierung profitieren.

Für kleinere Seiten sind Sitemaps ein praktisches Tool, die Seite zu überwachen und einen Überblick über die wichtigsten URLs zu behalten.

Michael Göpfert - SEO in München
Geschrieben von: Michael Göpfert

Hat dir der Beitrag gefallen?

Schreibe einen Kommentar

Pflichtfelder sind mit * markiert.


Das könnte dich auch interessieren: