Structured Data für KI-Agenten: So liest ChatGPT deine Website

Wie Structured Data 2026 funktioniert: JSON-LD, Schema-Typen und praktische Schritte, damit KI-Agenten deine Inhalte korrekt verstehen und zitieren.

Warum KI-Agenten anders lesen als Google-Bots

Wer seine Website für Suchmaschinen optimiert hat, kennt das Prinzip: Googlebot crawlt Seiten, bewertet Links, indexiert Inhalte. KI-Agenten wie ChatGPT, Perplexity oder Gemini funktionieren grundlegend anders — und das hat direkte Konsequenzen für die Art, wie du deine Inhalte strukturierst.

Google-Crawler arbeiten kontinuierlich. Sie bauen einen Index auf, der dann bei Anfragen durchsucht wird. KI-Agenten hingegen kombinieren zwei Quellen: ein vortrainiertes Sprachmodell und — in zunehmend vielen Fällen — eine Live-Websuche oder direkte Seitenabfragen. Was der Agent dabei aus einer Seite extrahiert, hängt stark davon ab, wie klar und eindeutig die Informationen maschinenlesbar vorliegen.

Das entscheidende Problem: Fließtext ist für Menschen gedacht. Ein Sprachmodell kann zwar Fließtext verstehen, aber es bevorzugt Struktur. Wenn ein Agent wissen will, ob dein Unternehmen in München sitzt, muss er das aus einem Absatz herauslesen — oder er findet es sofort im schema.org/address-Feld. Der Unterschied ist nicht akademisch, er bestimmt, ob dein Inhalt in einer KI-Antwort auftaucht oder nicht.

Dieses Konzept nennt sich Generative Engine Optimization (GEO) — die Optimierung von Inhalten speziell für generative KI-Systeme. Strukturierte Daten sind dabei keine nette Ergänzung, sondern das Fundament. KI-Agenten können Structured Data direkt und verlässlich parsen, ohne Interpretationsspielraum. Das macht sie zur präzisesten Kommunikationsform zwischen deiner Website und einem automatisierten System.

Die wichtigsten Schema-Typen für GEO 2026

Nicht jedes Schema ist für KI-Agenten gleich relevant. Vier Typen haben sich als besonders wirksam herausgestellt:

Organization

schema.org/Organization ist der grundlegende Datensatz über dein Unternehmen. Name, Adresse, URL, Logo, Gründungsdatum, Kontaktdaten — alles, was einen KI-Agenten in die Lage versetzt, Faktenfragen zu beantworten wie: „Wer steckt hinter dieser Website?" oder „Wo ist das Unternehmen ansässig?". Ohne diesen Schema-Typ bleibt dein Unternehmen für KI-Agenten eine Black Box.

Article

schema.org/Article — oder spezifischer BlogPosting, NewsArticle, TechArticle — gibt einem Artikel Kontext: Autor, Erscheinungsdatum, Änderungsdatum, Headline, Beschreibung. KI-Agenten müssen wissen, wann ein Inhalt entstanden ist, um ihn korrekt einzuordnen. Veraltete Informationen ohne Datum werden entweder ignoriert oder falsch attribuiert. Das Feld dateModified ist dabei mindestens so wichtig wie datePublished.

FAQPage

schema.org/FAQPage ist für GEO derzeit wahrscheinlich der wertvollste Schema-Typ überhaupt. Warum? Weil KI-Agenten exakt dieses Format reproduzieren — Frage, Antwort, fertig. Wenn du deine häufigsten Nutzerfragen als FAQPage strukturierst, lieferst du dem Agenten eine fertige Antworteinheit, die er direkt verwenden kann. Kein Interpretationsaufwand, keine Unsicherheit.

HowTo

schema.org/HowTo funktioniert ähnlich präzise für anleitungsbasierte Inhalte. Jeder Schritt wird separat als HowToStep ausgezeichnet, mit Namen und Beschreibung. Wenn ein Nutzer einen KI-Agenten fragt: „Wie installiere ich X?", und du hast eine korrekt strukturierte HowTo-Seite, steigen die Chancen erheblich, dass dein Inhalt als Quelle herangezogen wird — oder zumindest in die Antwort einfließt.

JSON-LD vs. Microdata vs. RDFa: Was KI-Modelle bevorzugen

Es gibt drei etablierte Methoden, Structured Data in HTML einzubetten. Die Unterschiede sind technisch relevant und beeinflussen, wie gut KI-Systeme die Daten verarbeiten können.

JSON-LD

JSON-LD (JavaScript Object Notation for Linked Data) wird im <script type="application/ld+json">-Tag im Head oder Body eingebettet. Es ist vollständig vom HTML-Markup getrennt — das ist sein größter Vorteil. Ein KI-Agent oder Crawler muss nicht das gesamte DOM parsen, sondern findet alle strukturierten Informationen an einer Stelle, in einem klar definierten Format.

Google empfiehlt JSON-LD ausdrücklich, und das aus demselben Grund, warum es für KI-Agenten optimal ist: Es ist robust, wartungsarm und leicht automatisch generierbar. Ein Parsing-Fehler im HTML-Markup beeinflusst JSON-LD nicht.

Microdata

Microdata bettet Attribute direkt in HTML-Tags ein (itemscope, itemtype, itemprop). Es ist eng mit dem sichtbaren Inhalt verknüpft — das kann ein Vorteil sein, wenn sichergestellt ist, dass Markup und Inhalt immer synchron sind. In der Praxis ist es aber wartungsintensiver und fehleranfälliger. KI-Systeme können Microdata verarbeiten, aber die engere Kopplung an das DOM macht es weniger zuverlässig.

RDFa

RDFa (Resource Description Framework in Attributes) ist das mächtigste, aber auch komplexeste Format. Es erlaubt sehr präzise semantische Auszeichnungen, ist aber in der Praxis selten richtig implementiert. Für die meisten Websites überwiegt der Aufwand den Nutzen deutlich.

Fazit: Für GEO 2026 gilt eindeutig JSON-LD. Es ist das Format, das von allen relevanten KI-Systemen am zuverlässigsten verarbeitet wird, am einfachsten zu implementieren und zu testen ist, und das Google sowie OpenAI in ihren Retrieval-Systemen bevorzugen.

Praxis-Checkliste: Structured Data in 30 Minuten implementieren und testen

Die folgende Checkliste ist priorisiert. Arbeite sie von oben nach unten ab — die ersten drei Punkte haben den größten Effekt.

  1. Organization-Schema auf der Startseite einbinden

    Erstelle ein JSON-LD-Snippet mit @type: "Organization" und fülle mindestens: name, url, logo, address, contactPoint. Platziere es im <head> deiner Startseite. Dieser Schritt dauert unter 10 Minuten und ist die Basis für alles weitere.

  2. Artikel-Schema auf allen Blog-Posts ergänzen

    Jeder Blogpost braucht @type: "BlogPosting" mit headline, author (als Person-Objekt mit name), datePublished und dateModified. Wenn du ein CMS nutzt, lässt sich das meist per Plugin oder Template-Anpassung einmalig für alle Posts erledigen.

  3. FAQPage-Schema für deine wichtigste FAQ-Seite erstellen

    Nimm die fünf häufigsten Fragen deiner Nutzer. Erstelle ein JSON-LD-Objekt mit @type: "FAQPage" und einem mainEntity-Array. Jeder Eintrag ist ein Question-Objekt mit name (die Frage) und acceptedAnswer (ein Answer-Objekt mit text).

  4. Testen mit dem Rich Results Test

    Rufe search.google.com/test/rich-results auf und gib deine URL ein. Das Tool zeigt dir sofort, ob dein JSON-LD syntaktisch korrekt ist und welche Schema-Typen erkannt wurden. Fehler werden mit Zeilennummern ausgegeben — behebe alle Errors (nicht nur Warnings) vor dem nächsten Schritt.

  5. Schema Markup Validator nutzen

    Unter validator.schema.org kannst du URL oder direkten Code prüfen. Dieser Validator ist schema.org-nativ und prüft strenger als das Google-Tool. Besonders nützlich, um fehlende empfohlene Properties zu finden.

  6. HowTo-Schema für Anleitungsseiten nachziehen

    Wenn du Schritt-für-Schritt-Inhalte hast: Jetzt HowTo implementieren. Mindestens: name (Titel der Anleitung), step-Array mit je name und text pro Schritt.

  7. Canonical URLs in Schema-Objekten setzen

    Jedes Schema-Objekt sollte eine url-Property enthalten, die auf die kanonische URL der Seite verweist. Das verhindert Zuordnungsprobleme, wenn Inhalte geteilt oder gecrawlt werden.

  8. Structured Data im Search Console überwachen

Nächster Schritt

GEO-Strategie für dein Unternehmen?

Gespräch anfragen →