AI-Systeme wie ChatGPT, Claude und Perplexity sammeln Web-Daten in mehreren Phasen. Um zu verstehen, ob und wie Schema Markup genutzt wird, müssen wir diese Phasen genauer betrachten:
Die AI-Datenverarbeitungs-Pipeline
Hinweis: Unsere Tests zeigen primär Phase 4 (Direct Fetch). Schema Markup könnte in den Phasen 1-3 sehr wohl genutzt werden – besonders von Google AI Overviews und Bing Copilot, die Zugriff auf Suchindizes haben.
Um herauszufinden, ob AI-Systeme Schema Markup beim direkten Fetch (Phase 4) nutzen, haben wir im Oktober 2025 umfassende Tests durchgeführt. Die Ergebnisse sind überraschend: Aktuelle AI-Chatbots nutzen JSON-LD Schema Markup NICHT beim direkten Abruf. Stattdessen extrahieren sie ausschließlich sichtbare HTML-Inhalte.
Schema Markup Formate: JSON-LD, Microdata und RDFa
Bevor wir untersuchen, wie AI-Systeme Schema Markup behandeln, ist es wichtig zu verstehen, dass es verschiedene Formate gibt, um strukturierte Daten zu implementieren. Jedes Format hat seine eigenen Vor- und Nachteile:
JSON-LD
JavaScript Object Notation für Linked Data - Das von Google empfohlene Format. Es ist von HTML getrennt und wird implementiert in <script> Tags.
✅ Vorteile:
- Einfach zu implementieren und zu warten
- Trennt Struktur von HTML-Code
- Keine Duplizierung von Inhalten notwendig
- Google's bevorzugtes Format 2025
⚠️ Nachteile:
- Inhalte müssen ggf. wiederholt werden
- Manuelle Updates nötig bei Änderungen
Microdata
HTML-Spezifikation für das Verschachteln strukturierter Daten innerhalb von HTML-Inhalten. Verwendet Attribute wie itemscope, itemtype, und itemprop.
✅ Vorteile:
- Direkt in HTML integriert
- Keine Duplizierung von Inhalten
- Historisch weit verbreitet
⚠️ Nachteile:
- Kann HTML-Code unübersichtlich machen
- Schwieriger zu warten
- Nicht mehr W3C-Standard
RDFa
Resource Description Framework in Attributes - Eine HTML-Erweiterung, die strukturierte Daten über Attribute einbettet wie vocab, typeof, und property.
✅ Vorteile:
- W3C-Standard
- Flexibel für komplexe Daten
- Mehrere Vokabulare möglich
⚠️ Nachteile:
- Steile Lernkurve
- Kann Code unübersichtlich machen
- Weniger verbreitet als JSON-LD
Test-Methodik: Nutzen AI-Systeme tatsächlich Schema Markup?
Um diese Frage definitiv zu beantworten, haben wir einen praktischen Test mit einer speziell entwickelten Testseite durchgeführt. Unser Ziel war es festzustellen, ob beliebte AI-Systeme wie ChatGPT, Perplexity und Gemini Informationen aus verschiedenen Quellen auf einer Webseite extrahieren können.
Design der Testseite
Wir haben eine Testseite für ein fiktives Produkt erstellt: "searchVIU Premium GEO Bärchen". Die Seite enthält drei Produktvarianten mit Preisinformationen, die über verschiedene Quellen verteilt sind:
🧪 Test-Szenarien im Detail
JSON-LD Tests
Test 1: Blaue GEO-Bären
Preis: €5.99
Format: Kein Schema (Baseline)
Quelle: Sichtbarer HTML-Inhalt – Produktinformationen, die in Standard-HTML angezeigt werden, das Nutzer auf der Seite sehen können
Ziel: Baseline-Test - alle AI-Systeme sollten dies finden können ✅.
Test 2: Einhorn Premium GEO Bären
Preis: €12.99
Format: Kein Schema (JavaScript Test)
Quelle: JavaScript-gerenderte Inhalte – Preise, die erst nach dem Laden der Seite über JavaScript ins DOM eingefügt werden
Ziel: Testen, ob AI-Systeme JavaScript ausführen oder Headless-Browser verwenden
Test 3: Rainbow Premium GEO Bärchen
Preis: €8.99
Format: JSON-LD (nur Schema)
Quelle: Nur Schema Markup – Preise ausschließlich im JSON-LD Schema Markup enthalten, aber nirgendwo auf der Seite sichtbar
Ziel: Kerntest – können AI-Systeme reine JSON-LD Schema-Daten extrahieren?
Test 4: Glitzer Premium GEO Bärchen
Preis: €15.99
Format: JSON-LD (dynamisch via JavaScript)
Quelle: Schema in JavaScript – JSON-LD, das dynamisch über JavaScript eingefügt wird
Ziel: Kombinierter Test für JavaScript-Ausführung UND Schema-Parsing
Microdata Tests
Test 5: Orange Premium GEO Bärchen
Preis: €7.49
Format: Microdata (versteckt mit -Tags)
Quelle: Microdata Schema mit itemscope, itemtype, itemprop – Preis nur in -Tags, nicht sichtbar auf der Seite
Ziel: Können AI-Systeme Microdata-Format parsen? Wird verstecktes Microdata erkannt?
Test 6: Kirsch Premium GEO Bärchen
Preis: €6.49
Format: Microdata (sichtbar in HTML)
Quelle: Microdata direkt in sichtbaren HTML-Elementen eingebettet
Ziel: Vergleich: Wird sichtbares Microdata besser erkannt als verstecktes?
RDFa-Tests
Test 7: Mint Premium GEO Bärchen
Preis RDFa: €11.99 | Preis JSON-LD: €9.99
Format: RDFa (versteckt) + JSON-LD
Quelle: Doppeltest – sowohl RDFa mit -Tags (€11.99) als auch JSON-LD Schema (€9.99) mit unterschiedlichen Preisen
Ziel: Welches Format wird bevorzugt? Welcher Preis wird genannt? Erkennt AI den Konflikt?
Test 8: Zitronen Premium GEO Bärchen
Preis: €5.49
Format: RDFa (sichtbar in HTML)
Quelle: RDFa mit vocab, typeof, property – direkt in sichtbaren HTML-Elementen
Ziel: Können AI-Systeme RDFa-Format parsen? Vergleich mit Microdata
Experimentelle Ergebnisse
Testprotokoll: Wir haben jedes AI-System 10 Mal abgefragt, um Konsistenz sicherzustellen und Anomalien zu vermeiden. Die Fragen wurden so gestaltet, dass sie speziell nach Preisen und Produktdetails fragen, die über die verschiedenen Content-Quellen verteilt waren.
Was AI-Systeme tatsächlich sehen
Testprotokoll: Jedes AI-System wurde 5 Mal mit der identischen Frage abgefragt: "Was sind die verfügbaren Produkte auf dieser Seite und was sind ihre aktuellen Preise (26.10.2025)?"
Test-Datum: 30. Oktober 2025 | Testseite: searchviu.com/de/geo-bears/
| Test | Produkt & Preis | Format/Quelle | ChatGPT | Claude | Gemini | Perplexity (vor Index) |
Perplexity (nach Index) |
Google AI Mode (vor Index) |
Google AI Mode (nach Index) |
|---|---|---|---|---|---|---|---|---|---|
| Test 1 | Blaue GEO Bärchen €5.99 |
Sichtbarer HTML-Inhalt | ✓ | ✗ | ✓ | ✗ | ✗ | ✗ | ✓ |
| Test 2 | Einhorn Premium €12.99 |
JavaScript-gerendert | ✗ | ✗ | ✓ | ✗ | ✓ | ✗ | ✓ |
| Test 3 | Rainbow Premium €8.99 |
JSON-LD Schema | ✗ | ✗ | ✗ | ✗ | ✗ | ✗ | ✗ |
| Test 4 | Glitzer Premium €15.99 |
JSON-LD via JavaScript | ✗ | ✗ | ✗ | ✗ | ✗ | ✗ | ✗ |
| Test 5 | Orange Premium €7.49 |
Versteckte Microdata | ✗ | ✗ | ✗ | ✗ | ✗ | ✗ | ✗ |
| Test 6 | Kirsch Premium €6.49 |
Sichtbare Mikrodata | ✓ | ✗ | ✓ | ✗ | ✗ | ✗ | ✗ |
| Test 7 | Minze Premium RDFa: 11,99 €. JSON-LD: 9,99 €. |
Versteckte RDFa + JSON-LD (Konflikt) | ✗ | ✗ | ✗ | ✗ | ✗ | ✗ | ✗ |
| Test 8 | Zitronen Premium €5.49 |
Sichtbares RDFa | ✓ | ✗ | ✓ | ✗ | ✗ | ✗ | ✗ |
🔍 Detaillierte Erkenntnisse aus den Tests
▶ ChatGPT (GPT-4) - 3/8 Preise gefunden (37.5%)
- ✓ Gefunden: 5,99 € (Test 1 - Sichtbares HTML), 6,49 € (Test 6 - Sichtbare Microdata), 5,49 € (Test 8 - Sichtbares RDFa)
- ✗ Nicht gefunden: 12,99 € (Test 2 - JavaScript), 8,99 € (Test 3 - JSON-LD), 15,99 € (Test 4 - JSON-LD+JS), 7,49 € (Test 5 - Versteckte Microdata), 11,99 €/ 9,99 € (Test 7 - Versteckter RDFa/JSON-LD-Konflikt)
- Fazit: Analysiert nur sichtbare HTML-Inhalte, keine JavaScript-Unterstützung, ignoriert versteckte Schema-Daten vollständig
- Alle 7 Produktnamen und -beschreibungen richtig gefunden
▶ Gemini (Google) - 4/8 Preise gefunden (50%) ⭐ BESTES ERGEBNIS
- ✓ Gefunden: 5,99 € (Test 1 - Sichtbares HTML), 12,99 € (Test 2 - JavaScript ⚡), 6,49 € (Test 6 - Sichtbare Microdata), 5,49 € (Test 8 - Sichtbare RDFa)
- ✗ Nicht gefunden: 8,99 € (Test 3 - JSON-LD), 15,99 € (Test 4 - JSON-LD+JS), 7,49 € (Test 5 - Versteckte Microdata), 11,99 €/ 9,99 € (Test 7 - Versteckter RDFa/JSON-LD-Konflikt)
- Besonderes Merkmal: Einziges System mit JavaScript-Rendering-Unterstützung! Einziges, das den dynamisch geladenen Preis von 12,99 € findet
- Fazit: Die meisten modernen Parser mit JS-Unterstützung, aber selbst Gemini ignoriert JSON-LD und versteckte Schema-Daten
- Richtig erkannt, welche Produkte "auf Lager", aber ohne Preis auf der Seite waren (Regenbogen, Orange, Mint, Glitzer)
- Das Datum "Ab dem 26. Oktober 2025" in der Antwort ausdrücklich bestätigt
▶ Claude (Anthropic) - 0/8 Preise gefunden (0%)
- ✓ Gefunden: Alle 7 Produktnamen und -beschreibungen korrekt
- ✗ Nicht gefunden: ALLE 8 Preise - weder sichtbar noch versteckt
- Erklärung: "Ich konnte keine Preise finden, die auf der Seite angezeigt werden. Die Preisinformationen werden möglicherweise dynamisch geladen..."
- Fazit: Die aggressivste Inhaltsfilterung oder der restriktivste Parser. Selbst deutlich sichtbare Preise wurden nicht extrahiert
- Hypothese: Claude filtert möglicherweise Preisinformationen aus Sicherheitsgründen oder hat einen sehr konservativen HTML-Parser
▶ Perplexity AI - Vor Indexierung: 0/8, Nach Indexierung: 1/8 Preise gefunden (12,5%)
- Test 1 - Vor der Indexierung (30. Oktober 2025):
- Antwort: "Die Seite konnte in den letzten Suchergebnissen nicht direkt aufgerufen werden"
- Grund: Seite war zu neu, noch nicht im Index von Perplexity
- Test 2 - Nach der Indexierung:
- Query: "Geo Bears from searchviu.com refer to..."
- ✓ Gefunden: 12,99 € (Magische Einhorn-GEO-Bärchen - JavaScript-rendered)
- ✗ Nicht gefunden: Alle anderen 7 Produkte wurden NICHT im Index gefunden
- Aussage: "Es wurden keine anderen GEO-Bären-Produktvarianten oder Preise gefunden; nur die Einhorn-Edition ist aufgelistet"
- Verhalten: Durchsucht in erster Linie seinen eigenen Suchindex, kein direkter Live-Fetch
- Überraschend: Perplexity fand NUR das JavaScript-gerenderte Produkt, nicht einmal die prominent platzierten Blue GEO Bears (€5,99) in statischem HTML
- Fazit: Der Index von Perplexity ist sehr selektiv. Nach der Indexierung wurden nur die "prominentesten" Informationen erfasst. Das lässt auf ein selektives Crawling-Verhalten oder eine Priorisierung bestimmter Inhaltselemente schließen. Perplexity hat den niedrigsten Recall (1/8 = 12,5%).
▶ Google AI Mode (in Google Search) - Vor der Indexierung: 0/8, Nach der Indexierung: 2/8 gefundene Preise (25%)
- Test 1 - Vor der Indexierung (30. Oktober 2025):
- Antwort: "Für diese Suchanfrage ist keine Antwort verfügbar. Versuche eine andere Suchanfrage."
- Grund: Die Seite war zu neu, noch nicht vollständig im Google-Index
- Test 2 - Nach der Indexierung:
- Neue Anfrage: "Was sind searchviu.com geo bears - welche Produkte (bitte alle auflisten) sind verfügbar und wie sind die aktuellen Preise."
- ✓ Gefunden: 5,99 € (Blaue GEO-Bären), 12,99 € (Einhorn-GEO-Bären)
- Erkannte Regenbogen-GEO-Bären als verfügbar, aber ohne Preis
- ✗ Nicht gefunden: 4 weitere Produkte (Kirsche, Zitrone, Orange, Minze, Glitzer) wurden überhaupt nicht erwähnt
- Verhalten: Ähnlich wie Perplexity - durchsucht in erster Linie den Google-Suchindex anstelle des direkten Live-Fetch
- Interessant: Nach der Indizierung liefert der Google AI Mode Ergebnisse, aber nur für 3 von 7 Produkten
- Fazit: Der Google AI Mode funktioniert mit indexierten Seiten, extrahiert aber weniger vollständig als der Live-Fetch von Gemini (2/8 vs. 4/8 Preise). Wahrscheinlich werden gespeicherte Metadaten aus dem Index verwendet, nicht der aktuelle Live-Inhalt.
📈 Ranking nach Erfolgsquote:
Direct Fetch Systeme (Live-Abruf):
- 🥇 Gemini: 50% (4/8) - JavaScript-Support + Live-Fetch
- 🥈 ChatGPT: 37.5% (3/8) - Solide für sichtbare Inhalte
- 🥉 Claude: 0% (0/8) - Keine Preise extrahiert trotz Direct Fetch
Indexbasierte Systeme (Suche in gespeicherten Daten):
- Google AI Mode: 25% (2/8) - Fand 2 Preise nach Indexierung, aber nur 3 von 7 Produkten
- Perplexity: 12,5% (1/8) - Sehr selektiv: Fand NUR das JS-Produkt, nicht mal statisches HTML
⚠️ Wichtig: Direct Fetch (Live-Abruf) vs. Index-basiert sind unterschiedliche Ansätze. Index-Systeme arbeiten mit gespeicherten Daten und sind daher nicht direkt mit Live-Fetch vergleichbar. Beide Index-Systeme zeigen, dass ihre Crawler JavaScript ausführen (beide fanden €12.99), aber Perplexity's Index ist deutlich selektiver.
Überraschende Erkenntnisse
JSON-LD Schema Markup wird von KEINEM System beim direkten Fetch extrahiert – selbst wenn die Information nirgendwo sonst auf der Seite sichtbar ist. Kein einziges der 5 getesteten Systeme konnte versteckte Schema-Daten nutzen.
Gemini gewinnt bei Live Fetch: Als einziges System unterstützt Gemini JavaScript-Rendering beim direkten Abruf und fand 50% der Preise (4/8) vs. 37,5% bei ChatGPT (3/8).
Alle großen Crawler indexieren JavaScript: Sowohl Google AI Mode als auch Perplexity fanden nach Indexierung den JavaScript-gerenderten Preis (€12.99). Dies beweist, dass alle großen Crawler JavaScript während der Indexierung ausführen – wichtig für SEO!
Perplexity's Index ist extrem selektiv: Nach Indexierung fand Perplexity nur 1/8 Preise (12,5%) – und das war NUR das JavaScript-Produkt. Nicht einmal das prominent platzierte statische HTML-Produkt (Blue €5.99) wurde erfasst. Google AI Mode war mit 2/8 (25%) deutlich vollständiger.
Einschränkung: Schema Markup könnte in der Indexing-Phase, in LLM-Trainingsdaten oder bei suchmaschinenintegrierten AI-Systemen (Google AI Overviews, Bing Copilot) durchaus genutzt werden.
Schlussfolgerungen: Was bedeuten diese Ergebnisse?
Kernerkenntnisse
- JSON-LD Schema wird NICHT von AI-Chatbots gelesen beim direkten Fetch. Der Preis von €8.99 für die Rainbow GEO Bärchen (Test 3), der nur im JSON-LD Schema vorhanden war, wurde von keinem der 5 getesteten Systeme gefunden.
- Aber: Das Schema könnte in früheren Phasen genutzt werden. In der Indexing-Phase wird Schema Markup sehr wahrscheinlich extrahiert. Google's AI Overviews und Bing's Copilot haben Zugriff auf diese strukturierten Daten aus ihren Suchindizes.
- Gemini unterstützt JavaScript. Als einziges System fand Gemini den JavaScript-gerenderten Preis von €12.99 (Test 2) beim Live-Fetch. Mit 4 von 8 gefundenen Preisen (50%) schneidet Gemini besser ab als ChatGPT (37,5%) und alle anderen Systeme.
- Google AI Mode findet JavaScript-Preise nach Indexierung. Überraschend: Google AI Mode fand ebenfalls den JavaScript-gerenderten Preis von €12.99 (Test 2), obwohl es index-basiert arbeitet. Das beweist, dass Google's Crawler JavaScript während der Indexierung ausführen. Jedoch werden nur 3 von 7 Produkten im Index erfasst (2/8 Preise gefunden).
- Sichtbare Inhalte sind essentiell für die meisten Chatbots. ChatGPT und Gemini fanden erfolgreich alle Preise, die im sichtbaren HTML-Code vorhanden waren.
- JavaScript-Rendering: Unterschied zwischen Live-Fetch und Indexierung. Gemini unterstützt JavaScript beim Live-Fetch (fand €12.99). Google AI Mode fand denselben JS-Preis nach Indexierung, was beweist: Google's Crawler führen JavaScript aus. ChatGPT, Claude und Perplexity können JS-Inhalte beim Live-Fetch nicht erfassen.
- Versteckte strukturierte Daten werden ignoriert. Weder verstecktes Microdata (€7.49) noch verstecktes RDFa (€11.99) wurden von irgendeinem System erkannt.
- Perplexity und Google AI Mode haben einen anderen Ansatz. Beide durchsuchen zuerst ihren Index statt Seiten direkt zu fetchen. Nach Indexierung: Google AI Mode fand 2/8 Preise (25%), Perplexity nur 1/8 (12,5%). Überraschend: Perplexity fand NUR das JavaScript-Produkt, nicht mal das statische HTML-Produkt (Blue €5.99). Dies deutet auf sehr selektives Crawling-Verhalten hin.