Stellen Sie sich vor, Sie ziehen um.
Vor Ihnen stapeln sich vierzig Kartons. Auf dem einen steht in dicker Filzschrift: Küche – Teller, bitte oben lassen. Auf dem anderen: nichts. Ein stummer brauner Würfel.
Welchen Karton wollen Sie beim Auspacken zuerst in der Hand halten?
Genau das ist XML. Ein Karton, der weiß, was in ihm steckt, und es jedem sagt, der zuhört.

XML beschreibt Daten mit eigenen Tags und macht Inhalte für Systeme, Schnittstellen und Suchmaschinen verständlich.
Was XML wirklich ist
XML steht für Extensible Markup Language, übersetzt: erweiterbare Auszeichnungssprache. Der Weltverband W3C hat sie 1998 veröffentlicht, abgeleitet von einer älteren, schwergewichtigen Verwandten namens SGML. Seitdem läuft sie im Maschinenraum des Internets, von fast niemandem beachtet, von fast allem benutzt.
Das Entscheidende vorweg, weil es so oft missverstanden wird: XML tut nichts.
Sie rechnet nicht. Sie zeigt nichts an. Sie blinkt nicht. Sie packt Daten in beschriftete Kartons und stellt sie für den Transport bereit. Mehr nicht. Und gerade das ist ihre Stärke.
Ein XML-Dokument ist im Kern reiner Text, lesbar für Menschen und für Maschinen. Es besteht aus selbst erfundenen Etiketten, sogenannten Tags, die in spitzen Klammern stehen. Ein Beispiel sagt mehr als drei Absätze Theorie:
<buch>
<titel>Die Kunst des Weglassens</titel>
<autor>Maria Lindner</autor>
<jahr>2024</jahr>
</buch>
Sie müssen kein Entwickler sein, um das zu verstehen. Hier ist ein Buch. Es hat einen Titel, einen Autor, ein Jahr. Jede Information sitzt in ihrem eigenen, beschrifteten Fach. Das nennt man selbstbeschreibend: Die Daten tragen ihre Bedeutung mit sich, wie der Filzstift-Schriftzug auf dem Umzugskarton.
Und das „erweiterbar“ im Namen? Es bedeutet: Sie erfinden die Etiketten selbst. Niemand schreibt Ihnen vor, dass ein Fach <titel> heißen muss. Es könnte auch <überschrift> heißen oder <name>. Solange Sender und Empfänger dieselbe Sprache sprechen, verstehen sich beide.
Der feine Unterschied zu HTML
Wer schon einmal von HTML gehört hat, wittert jetzt eine Verwechslung. Verständlich, denn beide stammen aus derselben Familie. Beide arbeiten mit Tags in spitzen Klammern. Beide leben im Web.
Doch hier ist der Unterschied:
HTML ist das Schaufenster. XML ist das Lager dahinter.
HTML hat eine feste, vom W3C festgelegte Menge an Etiketten, und jedes davon hat einen Auftrag: zeigen. Eine Überschrift soll groß erscheinen, ein Absatz soll fließen, ein Bild soll erscheinen. HTML kümmert sich darum, wie etwas aussieht.
XML interessiert sich nicht dafür, wie etwas aussieht. Sie kümmert sich darum, was etwas ist. Ihre Etiketten sind frei erfunden, und sie sagen nichts über Schriftgröße oder Farbe. Sie sagen nur: Das hier ist ein Titel. Das hier ist ein Preis. Das hier ist ein Datum.
Die Folge: XML kann Daten zwischen Systemen transportieren, die sonst nichts gemeinsam haben. Ihre Webseite speichert ein Datum als „04.06.2024″, Ihr Buchhaltungsprogramm als „2024-06-04″. XML ist der Übersetzer, der den Karton so beschriftet, dass beide Seiten ihn auspacken können.
Warum das Web ohne XML ärmer wäre
Vielleicht denken Sie jetzt: schön und gut, aber betrifft mich das überhaupt?
Mehr, als Sie ahnen. Sie sitzen vermutlich täglich auf XML, ohne es zu merken.
Die Word-Datei, die Sie gestern geschrieben haben, das .docx? Im Inneren ein gepacktes Bündel aus XML. Die Excel-Tabelle, das .xlsx? Dasselbe. Der Podcast, den Sie abonniert haben, wird über einen RSS-Feed ausgeliefert, und der ist XML. Die scharfgezeichneten Logos auf modernen Webseiten, die SVG-Grafiken, die bei jeder Bildschirmgröße knackig bleiben? Auch XML. Konfigurationsdateien, Datenschnittstellen, der Austausch zwischen Banken und Behörden: XML, XML, XML.
Es ist die stille Infrastruktur. Niemand bedankt sich bei ihr. Sie funktioniert einfach.
Eine kurze Pause für die ehrliche Einordnung: XML gilt heute als reifer Standard, nicht als heißes neues Ding. Für viele Anwendungen im Web hat sich das schlankere JSON durchgesetzt, weil es weniger Schreibarbeit verlangt. Trotzdem ist XML kein Museumsstück. Überall dort, wo Struktur, Strenge und Selbstbeschreibung zählen, ist sie weiter zu Hause.
Und an einer Stelle ist sie für die Suchmaschinenoptimierung schlicht unverzichtbar.
XML und SEO: die Inventarliste namens Sitemap
Kommen wir zu dem Punkt, an dem XML für Ihre Sichtbarkeit bei Google wirklich zählt.
Zurück zum Umzug. Sie haben alle Kartons beschriftet, der Wagen ist beladen, das Möbelpackerteam fährt los. Damit am Zielort niemand rätselt, was eigentlich alles geliefert wurde, geben Sie eine Liste mit: jeden Karton, jeden Inhalt, das Datum der letzten Änderung.
Diese Liste heißt im Web XML-Sitemap.
Eine XML-Sitemap, meist als sitemap.xml abgelegt, ist eine maschinenlesbare Auflistung aller Seiten, die eine Suchmaschine kennen soll. Sie sagt Google, Bing und den anderen Crawlern: Hier wohnen meine Inhalte. Hier. Und hier. Und diese Seite habe ich übrigens gestern aktualisiert.
Der Gedanke ist nicht neu. Schon 2005 führten Google, Yahoo und Microsoft gemeinsam das Sitemap-Format ein, der offene Standard liegt bis heute bei sitemaps.org. Seit 2007 zieht auch Bing mit. Eine winzige Datei, ein erstaunlich großer Effekt.
So sieht so eine Liste in ihrer schlanksten Form aus:
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>https://ihre-domain.de/leistungen</loc>
<lastmod>2024-06-04</lastmod>
</url>
</urlset>
<loc> ist die Adresse der Seite. <lastmod> der Tag der letzten echten Änderung. Sauber, knapp, unmissverständlich.
Was die Sitemap kann und was nicht
Jetzt der Satz, der Ihnen viel Frust erspart, wenn Sie ihn ernst nehmen:
Eine XML-Sitemap verbessert kein Ranking.
Sie ist keine Wunderwaffe, kein Trick, kein Hebel, der Sie auf Platz eins katapultiert. Wer das verspricht, verkauft Ihnen einen leeren Karton mit hübschem Etikett.
Was die Sitemap kann, ist anders, aber wertvoll: Sie hilft Suchmaschinen, Ihre Seiten überhaupt erst zu finden und effizient zu durchsuchen. Drei Situationen, in denen das den Unterschied macht:
- Frischer Start. Eine neue Webseite ist Google noch unbekannt. Die Sitemap klopft an und sagt: Es gibt mich.
- Tiefe Seiten. Inhalte, die in der Navigation fünf Klicks weit unten liegen oder schlecht intern verlinkt sind, werden über die Liste trotzdem entdeckt.
- Großer Bestand. Bei tausenden Unterseiten verhindert die Sitemap, dass einzelne Seiten im Crawling untergehen.
Die Sitemap sorgt also nicht dafür, dass Ihre Seite gewinnt. Sie sorgt dafür, dass Ihre Seite überhaupt mitspielen darf. Eintrittskarte, nicht Pokal.
Welche Ihrer wichtigen Seiten hat Google vielleicht noch nie zu Gesicht bekommen, weil sie zu tief vergraben liegt?
Was Google wirklich liest
Hier wird es konkret, und hier kursiert viel Halbwissen.
Über Jahre haben SEO-Ratgeber den Tag <priority> (wie wichtig eine Seite ist) und <changefreq> (wie oft sie sich ändert) als wichtige Stellschrauben gefeiert. Manche Tools tragen sie bis heute automatisch ein.
Die unbequeme Wahrheit: Google ignoriert beide. Vollständig.
Das ist keine Vermutung, das steht so in der offiziellen Dokumentation von Google. Ein Mitarbeiter aus dem Such-Team nannte diese beiden Angaben einmal sinngemäß einen Haufen Rauschen. Wer seine ganze Webseite auf Priorität 1.0 setzt, in der Hoffnung, Google sei beeindruckt, hat einfach nur die Datei aufgebläht.
Worauf Google tatsächlich achtet, ist <lastmod>, das Datum der letzten Änderung. Aber nur, wenn dieses Datum ehrlich ist. Setzen Sie bei jeder Seite stumpf das heutige Datum, lernt Google schnell, dass Ihre Angaben nichts wert sind, und schaut weg. Vertrauen verspielt man auch gegenüber einer Maschine nur einmal.
Die Lehre passt auf einen Bierdeckel: Adresse rein, ehrliches Änderungsdatum rein, den Rest weglassen.
Wie Sie das in der Praxis angehen
Die gute Nachricht für alle, die jetzt schwitzige Hände bekommen: Sie müssen keine einzige Zeile XML von Hand tippen.
Läuft Ihre Seite auf einem gängigen System wie WordPress, erledigen Erweiterungen wie Yoast SEO oder Rank Math die Sitemap automatisch im Hintergrund. Sie wächst und schrumpft mit Ihren Inhalten, ohne dass Sie etwas tun. Andere Systeme wie Shopify, TYPO3 oder Drupal bringen vergleichbare Lösungen mit.
Drei Handgriffe bleiben Ihnen trotzdem, und sie lohnen sich:
Erstens: Reichen Sie die Sitemap in der Google Search Console ein. Dort sehen Sie auch, welche Seiten Probleme machen.
Zweitens: Verweisen Sie in Ihrer robots.txt auf die Sitemap. Eine einzige Zeile, und jeder Crawler findet sofort den Weg.
Drittens: Behandeln Sie die Liste wie ein lebendiges Dokument, nicht wie eine Einbauküche. Tote Links, gelöschte Seiten, falsche Datumsangaben: Solcher Ballast macht Ihre Sitemap unglaubwürdig. Aufgeräumt schlägt vollständig.
Der letzte Gedanke
XML ist nichts, womit Sie angeben können. Niemand sieht sie. Kein Kunde wird Sie je auf Ihre saubere Sitemap ansprechen.
Aber das ist der Punkt. Die Dinge, die wirklich tragen, arbeiten meist im Verborgenen: das Fundament, die Verkabelung, die ehrliche Beschriftung auf dem Karton. Sie machen kein Geräusch. Sie sorgen nur dafür, dass am Ende alles dort ankommt, wo es hingehört.
Vielleicht ist das die eigentliche Lektion, die weit über Technik hinausreicht: Was beschrieben und geordnet ist, lässt sich finden. Was stumm im Stapel liegt, geht verloren.
Welche Ihrer Inhalte stehen gerade noch unbeschriftet im Raum?