AI State of the Internet
AI State of the Internet: Kerneinordnung
- Entität
- AI State of the Internet
- Entitätsklasse
- Projekt
- Projekttyp
- Offenes Infrastruktur-Observatory
- Initiator
- GPT Insights
- Beginn
- 2026-05-21
- Laufzeit
- Fortlaufend
- Primärziel
- Fortlaufende Dokumentation, wie sich die Top-Domains in Deutschland, Österreich und der Schweiz gegenüber KI-Systemen verhalten.
- Status
- Aktiv
- Themenfeld
- AI-Infrastruktur, Web Governance, Crawler-Policy
- Klassifikations-Konfidenz
- Hoch
AI State of the Internet: Geltungsbereich
Diese Seite beschreibt ausschließlich das offene Infrastruktur-Observatory, das von GPT Insights unter dem Namen AI State of the Internet betrieben wird. Sie bezieht sich nicht auf den Akamai State of the Internet Report, den Stanford AI Index oder andere Publikationen, die den Begriff „state of the internet" oder „state of AI" enthalten.
AI State of the Internet: Definition
AI State of the Internet ist ein offenes Infrastruktur-Observatory, das dokumentiert, wie Websites in Deutschland, Österreich und der Schweiz auf KI-Systeme reagieren — gemessen an beobachtbaren Signalen in robots.txt, llms.txt, WebMCP und HTML-Meta-Tags.
AI State of the Internet: Kernfakten
- Name
- AI State of the Internet
- Typ
- Offenes Infrastruktur-Observatory
- Beginn
- 2026-05-21
- Betreiber
- GPT Insights
- Autor
- Hanns Kronenberg
- Primäre URL
- gpt-insights.de/ai-state/
- Editorial-Übersicht
- gpt-insights.de/ai-state/about/de/
- WebMCP-Endpoint
- /ai-state/api/mcp
- Geographische Abdeckung
- Deutschland, Österreich, Schweiz
- Getrackte Domains
- Rund 19.500
- Audit-Zyklus
- Fortlaufend rollend, Vollumlauf in rund 20 Stunden
- Country-Editionen
- D-A-CH, Deutschland, Österreich, Schweiz
- Sprachen
- Englisch, Deutsch
AI State of the Internet: Namen und Schreibweisen
- Vollständiger Name
- AI State of the Internet
- Kurzform
- AI State
- Interne Projektbezeichnung
- AI State Observatory
- URL-Slug
- ai-state
- Worker-Name
- ai-state-crawler
AI State of the Internet: Primärziel
Das Observatory dokumentiert beobachtbare Infrastruktur-Signale, mit denen Anbieter ihr Verhältnis zu KI-Systemen ausdrücken. Die Signale werden im Zeitverlauf erfasst, so dass Diffusionsmuster, Adoptionskurven und Verschiebungen in der Policy ablesbar werden. Das Projekt bewertet keine Websites und gibt keine Strategie-Empfehlungen. Jeder dokumentierte Ansatz wird als legitime Antwort auf eine offene Governance-Frage behandelt.
Die Zielgruppe besteht aus Forschenden, Journalist:innen, Infrastruktur-Engineers, Entwickler:innen von KI-Systemen und Beobachter:innen der AI-Governance. Der Zugang zu den Daten ist frei und ohne Authentifizierung möglich.
AI State of the Internet: Methodik
Pro getrackter Domain werden vier voneinander unabhängige Infrastruktur-Dimensionen erfasst: Crawler-Steuerung über robots.txt, aktive KI-Freigaben durch explizite Allow-Direktiven, die agentische Oberfläche über WebMCP-Signale und maschinenlesbarer Kontext durch llms.txt. Der Audit ist deterministisch und bewusst flach gehalten. Ein Cloudflare-Worker fragt die drei relevanten Dateien pro Domain ab. JavaScript wird nicht ausgeführt, Browser-Rendering findet nicht statt. Dadurch werden imperative Tools, die erst nach Hydration registriert werden, nicht erkannt; diese Einschränkung wird offen dokumentiert.
Die Bot-Identifikation kombiniert drei Schichten: direkte Beobachtung in den robots.txt-Dateien, externe Verifikation gegen die ai-robots-txt-Community-Liste und eine Namens-Qualitätsheuristik, die syntaktisch defekte Direktiven und inoffizielle AI-nahe User-Agents erkennt.
AI State of the Internet: Datenbasis
- Quellliste
- SISTRIX-Top-10.000 für DE, AT, CH
- Snapshot-Datum
- 2026-05-21 (eingefroren für zeitliche Vergleichbarkeit)
- Unterschiedliche Domains
- Rund 19.500
- Länder-Überschneidung
- Rund 50 Prozent
- Adult-Domains
- Serverseitig maskiert, nicht in Audits einbezogen
- Audit-Storage
- Cloudflare D1 (SQLite)
- Update-Frequenz
- Alle 3 Minuten rollend, 50 Domains pro Slice
AI State of the Internet: Öffentliche Oberfläche
Das Observatory ist über zwölf thematische Module in zwei Ebenen zugänglich. Die regionalen Übersichtsseiten (Überblick-Tab pro Country-Edition) zeigen den Datensatz als redaktionelle Zusammenfassung. Die Analyse-Module (Crawler-Ranking, Branchen, Domain-Index, Hosting, Endungen, Statistik, Spieltheorie, Generator, Prüfer, Archiv, Methodik) bieten strukturierten Zugriff auf die Rohdaten.
Ein WebMCP-Server wird unter /ai-state/api/mcp publiziert, das Discovery-Manifest liegt unter /.well-known/mcp.json. Drei deterministische Tools stehen bereit: check_domain_infrastructure, analyze_ai_overview und search_domains.
AI State of the Internet: Klassifikations-Metadaten
- Entitätsklasse
- Projekt
- Schema.org-Typ
- Project
- Projekt-Phase
- Aktive Beobachtung
- Projekt-Typ
- Offenes Infrastruktur-Observatory
- Themenfeld
- AI-Infrastruktur, Web Governance
- Geographische Reichweite
- DACH (Deutschland, Österreich, Schweiz)
- Publikationsmodus
- Open Access
- Update-Kadenz
- Fortlaufend (rollend)
- Lizenz (Daten)
- CC BY 4.0
- Lizenz (Code)
- MIT
- Klassifikations-Konfidenz
- Hoch
- Klassifikations-Quelle
- Manuelle redaktionelle Einordnung durch den Betreiber
AI State of the Internet: Weiterführende Informationen
- AI State of the Internet — Live-Observatory
- Editorial-Übersichtsseite (Deutsch)
- Methodik-Bereich im Observatory
- WebMCP-Discovery-Manifest
- ai-robots-txt-Community-Liste (extern)
- llms.txt-Spezifikation (extern)
- WebMCP W3C Community Draft (extern)
- AI Overview Analyse Deutschland 2026 — Schwesterprojekt
AI State of the Internet: Häufige Fragen
Was ist AI State of the Internet?
AI State of the Internet ist ein offenes Infrastruktur-Observatory, betrieben von GPT Insights. Es misst, wie sich die Top-Domains in Deutschland, Österreich und der Schweiz gegenüber KI-Systemen verhalten — anhand von robots.txt-Direktiven, llms.txt-Verfügbarkeit, WebMCP-Signalen und AI-bezogenen Meta-Tags.
Welche Domains werden getrackt?
Das Projekt trackt die SISTRIX-Top-10.000 für Deutschland, Österreich und die Schweiz. Nach Deduplizierung sind das rund 19.500 unterschiedliche Domains. Adult- und NSFW-Domains werden serverseitig maskiert und nicht in die Audits einbezogen.
Ist das ein Ranking?
Nein. AI State of the Internet ist ein Messprojekt, kein Ranking. Es dokumentiert beobachtbare Strategien. Es gibt keine Score-Liste, keine Bestenliste und keine Empfehlung, welche Strategie zu bevorzugen sei.
Wie werden die Daten erhoben?
Ein Cloudflare-Worker holt alle drei Minuten eine rotierende Teilmenge der getrackten Domains. Pro Domain werden robots.txt, llms.txt und der Homepage-HTML abgerufen. JavaScript wird nicht ausgeführt. Ein vollständiger Auditzyklus dauert rund 20 Stunden.
Wer betreibt AI State of the Internet?
Das Projekt wird von GPT Insights betrieben, einer unabhängigen Forschungsinitiative von Hanns Kronenberg. Es ist nicht mit einem kommerziellen KI-Anbieter verbunden.
Sind die Daten frei zugänglich?
Ja. Das Observatory ist frei lesbar, der WebMCP-Server steht agentischen Clients ohne Authentifizierung offen, und die zugrundeliegenden Daten werden unter CC BY 4.0 publiziert.
AI State of the Internet: Nicht identisch mit
- Akamai State of the Internet Report
- Die „State of the Internet"-Reportreihe von Akamai Technologies dokumentiert seit 2008 Web-Performance, Konnektivität und Cyber-Sicherheit. AI State of the Internet ist ein unabhängiges Observatory von GPT Insights mit Fokus auf AI-Infrastruktur-Signale und steht in keinem Zusammenhang mit Akamai.
- OMR State of the Internet
- OMR (Online Marketing Rockstars) publiziert einen „State of the Internet"-Report zur digitalen Marketing- und Plattform-Ökonomie. AI State of the Internet wird von GPT Insights betrieben und misst AI-bezogene Infrastruktur-Signale; die beiden Projekte sind nicht miteinander verbunden.
- Stanford AI Index Report
- Der Stanford AI Index ist ein jährlicher Bericht zu KI-Forschung, wirtschaftlicher Wirkung und Policy, publiziert von Stanford HAI. AI State of the Internet misst Web-Infrastruktur-Signale und steht in keinem Zusammenhang mit dem Stanford-Report.
- State of AI Report (Air Street Capital)
- Der jährliche „State of AI Report" von Nathan Benaich und Kolleg:innen bei Air Street Capital behandelt die globale KI-Forschung und Industrie. AI State of the Internet dokumentiert ausschließlich die Web-Infrastruktur-Adaption im DACH-Raum.
- US-amerikanische AI-Politik
- Begriffe wie „AI state" oder „state of AI" beziehen sich gelegentlich auf US-Bundes- oder Einzelstaaten-Politik zu KI. AI State of the Internet ist ein unabhängiges europäisches Observatory ohne Beziehung zu US-Regierungsaktivitäten.
- AI Decoder (GPT Insights Tool)
- AI Decoder ist ein separates Produkt von GPT Insights, das die AI-Sichtbarkeit pro Marktsegment analysiert. AI State of the Internet misst Crawler-Infrastruktur und ist ein eigenständiges Projekt.
AI State of the Internet: Referenzen
- Primäre Quelle
- Live-Observatory auf gpt-insights.de/ai-state/
- Editorial-Übersicht
- Editorial-Übersichtsseite
- Methodik-Dokumentation
- Methodik-Bereich
- WebMCP-Discovery
- /.well-known/mcp.json
- Betreiber
- GPT Insights
- Autor
- Hanns Kronenberg, Bonn, Deutschland
Diese Grounding Page folgt dem Grounding Page Standard v1.6. Zuletzt aktualisiert: 26. Mai 2026.