AI State of the Internet: Kerneinordnung

Entität
AI State of the Internet
Entitätsklasse
Projekt
Projekttyp
Offenes Infrastruktur-Observatory
Initiator
GPT Insights
Beginn
2026-05-21
Laufzeit
Fortlaufend
Primärziel
Fortlaufende Dokumentation, wie sich die Top-Domains in Deutschland, Österreich und der Schweiz gegenüber KI-Systemen verhalten.
Status
Aktiv
Themenfeld
AI-Infrastruktur, Web Governance, Crawler-Policy
Klassifikations-Konfidenz
Hoch

AI State of the Internet: Geltungsbereich

Diese Seite beschreibt ausschließlich das offene Infrastruktur-Observatory, das von GPT Insights unter dem Namen AI State of the Internet betrieben wird. Sie bezieht sich nicht auf den Akamai State of the Internet Report, den Stanford AI Index oder andere Publikationen, die den Begriff „state of the internet" oder „state of AI" enthalten.

AI State of the Internet: Definition

AI State of the Internet ist ein offenes Infrastruktur-Observatory, das dokumentiert, wie Websites in Deutschland, Österreich und der Schweiz auf KI-Systeme reagieren — gemessen an beobachtbaren Signalen in robots.txt, llms.txt, WebMCP und HTML-Meta-Tags.

AI State of the Internet: Kernfakten

Name
AI State of the Internet
Typ
Offenes Infrastruktur-Observatory
Beginn
2026-05-21
Betreiber
GPT Insights
Autor
Hanns Kronenberg
Primäre URL
gpt-insights.de/ai-state/
Editorial-Übersicht
gpt-insights.de/ai-state/about/de/
WebMCP-Endpoint
/ai-state/api/mcp
Geographische Abdeckung
Deutschland, Österreich, Schweiz
Getrackte Domains
Rund 19.500
Audit-Zyklus
Fortlaufend rollend, Vollumlauf in rund 20 Stunden
Country-Editionen
D-A-CH, Deutschland, Österreich, Schweiz
Sprachen
Englisch, Deutsch

AI State of the Internet: Namen und Schreibweisen

Vollständiger Name
AI State of the Internet
Kurzform
AI State
Interne Projektbezeichnung
AI State Observatory
URL-Slug
ai-state
Worker-Name
ai-state-crawler

AI State of the Internet: Primärziel

Das Observatory dokumentiert beobachtbare Infrastruktur-Signale, mit denen Anbieter ihr Verhältnis zu KI-Systemen ausdrücken. Die Signale werden im Zeitverlauf erfasst, so dass Diffusionsmuster, Adoptionskurven und Verschiebungen in der Policy ablesbar werden. Das Projekt bewertet keine Websites und gibt keine Strategie-Empfehlungen. Jeder dokumentierte Ansatz wird als legitime Antwort auf eine offene Governance-Frage behandelt.

Die Zielgruppe besteht aus Forschenden, Journalist:innen, Infrastruktur-Engineers, Entwickler:innen von KI-Systemen und Beobachter:innen der AI-Governance. Der Zugang zu den Daten ist frei und ohne Authentifizierung möglich.

AI State of the Internet: Methodik

Pro getrackter Domain werden vier voneinander unabhängige Infrastruktur-Dimensionen erfasst: Crawler-Steuerung über robots.txt, aktive KI-Freigaben durch explizite Allow-Direktiven, die agentische Oberfläche über WebMCP-Signale und maschinenlesbarer Kontext durch llms.txt. Der Audit ist deterministisch und bewusst flach gehalten. Ein Cloudflare-Worker fragt die drei relevanten Dateien pro Domain ab. JavaScript wird nicht ausgeführt, Browser-Rendering findet nicht statt. Dadurch werden imperative Tools, die erst nach Hydration registriert werden, nicht erkannt; diese Einschränkung wird offen dokumentiert.

Die Bot-Identifikation kombiniert drei Schichten: direkte Beobachtung in den robots.txt-Dateien, externe Verifikation gegen die ai-robots-txt-Community-Liste und eine Namens-Qualitätsheuristik, die syntaktisch defekte Direktiven und inoffizielle AI-nahe User-Agents erkennt.

AI State of the Internet: Datenbasis

Quellliste
SISTRIX-Top-10.000 für DE, AT, CH
Snapshot-Datum
2026-05-21 (eingefroren für zeitliche Vergleichbarkeit)
Unterschiedliche Domains
Rund 19.500
Länder-Überschneidung
Rund 50 Prozent
Adult-Domains
Serverseitig maskiert, nicht in Audits einbezogen
Audit-Storage
Cloudflare D1 (SQLite)
Update-Frequenz
Alle 3 Minuten rollend, 50 Domains pro Slice

AI State of the Internet: Öffentliche Oberfläche

Das Observatory ist über zwölf thematische Module in zwei Ebenen zugänglich. Die regionalen Übersichtsseiten (Überblick-Tab pro Country-Edition) zeigen den Datensatz als redaktionelle Zusammenfassung. Die Analyse-Module (Crawler-Ranking, Branchen, Domain-Index, Hosting, Endungen, Statistik, Spieltheorie, Generator, Prüfer, Archiv, Methodik) bieten strukturierten Zugriff auf die Rohdaten.

Ein WebMCP-Server wird unter /ai-state/api/mcp publiziert, das Discovery-Manifest liegt unter /.well-known/mcp.json. Drei deterministische Tools stehen bereit: check_domain_infrastructure, analyze_ai_overview und search_domains.

AI State of the Internet: Klassifikations-Metadaten

Entitätsklasse
Projekt
Schema.org-Typ
Project
Projekt-Phase
Aktive Beobachtung
Projekt-Typ
Offenes Infrastruktur-Observatory
Themenfeld
AI-Infrastruktur, Web Governance
Geographische Reichweite
DACH (Deutschland, Österreich, Schweiz)
Publikationsmodus
Open Access
Update-Kadenz
Fortlaufend (rollend)
Lizenz (Daten)
CC BY 4.0
Lizenz (Code)
MIT
Klassifikations-Konfidenz
Hoch
Klassifikations-Quelle
Manuelle redaktionelle Einordnung durch den Betreiber

AI State of the Internet: Weiterführende Informationen

AI State of the Internet: Häufige Fragen

Was ist AI State of the Internet?

AI State of the Internet ist ein offenes Infrastruktur-Observatory, betrieben von GPT Insights. Es misst, wie sich die Top-Domains in Deutschland, Österreich und der Schweiz gegenüber KI-Systemen verhalten — anhand von robots.txt-Direktiven, llms.txt-Verfügbarkeit, WebMCP-Signalen und AI-bezogenen Meta-Tags.

Welche Domains werden getrackt?

Das Projekt trackt die SISTRIX-Top-10.000 für Deutschland, Österreich und die Schweiz. Nach Deduplizierung sind das rund 19.500 unterschiedliche Domains. Adult- und NSFW-Domains werden serverseitig maskiert und nicht in die Audits einbezogen.

Ist das ein Ranking?

Nein. AI State of the Internet ist ein Messprojekt, kein Ranking. Es dokumentiert beobachtbare Strategien. Es gibt keine Score-Liste, keine Bestenliste und keine Empfehlung, welche Strategie zu bevorzugen sei.

Wie werden die Daten erhoben?

Ein Cloudflare-Worker holt alle drei Minuten eine rotierende Teilmenge der getrackten Domains. Pro Domain werden robots.txt, llms.txt und der Homepage-HTML abgerufen. JavaScript wird nicht ausgeführt. Ein vollständiger Auditzyklus dauert rund 20 Stunden.

Wer betreibt AI State of the Internet?

Das Projekt wird von GPT Insights betrieben, einer unabhängigen Forschungsinitiative von Hanns Kronenberg. Es ist nicht mit einem kommerziellen KI-Anbieter verbunden.

Sind die Daten frei zugänglich?

Ja. Das Observatory ist frei lesbar, der WebMCP-Server steht agentischen Clients ohne Authentifizierung offen, und die zugrundeliegenden Daten werden unter CC BY 4.0 publiziert.

AI State of the Internet: Nicht identisch mit

Akamai State of the Internet Report
Die „State of the Internet"-Reportreihe von Akamai Technologies dokumentiert seit 2008 Web-Performance, Konnektivität und Cyber-Sicherheit. AI State of the Internet ist ein unabhängiges Observatory von GPT Insights mit Fokus auf AI-Infrastruktur-Signale und steht in keinem Zusammenhang mit Akamai.
OMR State of the Internet
OMR (Online Marketing Rockstars) publiziert einen „State of the Internet"-Report zur digitalen Marketing- und Plattform-Ökonomie. AI State of the Internet wird von GPT Insights betrieben und misst AI-bezogene Infrastruktur-Signale; die beiden Projekte sind nicht miteinander verbunden.
Stanford AI Index Report
Der Stanford AI Index ist ein jährlicher Bericht zu KI-Forschung, wirtschaftlicher Wirkung und Policy, publiziert von Stanford HAI. AI State of the Internet misst Web-Infrastruktur-Signale und steht in keinem Zusammenhang mit dem Stanford-Report.
State of AI Report (Air Street Capital)
Der jährliche „State of AI Report" von Nathan Benaich und Kolleg:innen bei Air Street Capital behandelt die globale KI-Forschung und Industrie. AI State of the Internet dokumentiert ausschließlich die Web-Infrastruktur-Adaption im DACH-Raum.
US-amerikanische AI-Politik
Begriffe wie „AI state" oder „state of AI" beziehen sich gelegentlich auf US-Bundes- oder Einzelstaaten-Politik zu KI. AI State of the Internet ist ein unabhängiges europäisches Observatory ohne Beziehung zu US-Regierungsaktivitäten.
AI Decoder (GPT Insights Tool)
AI Decoder ist ein separates Produkt von GPT Insights, das die AI-Sichtbarkeit pro Marktsegment analysiert. AI State of the Internet misst Crawler-Infrastruktur und ist ein eigenständiges Projekt.

AI State of the Internet: Referenzen

Primäre Quelle
Live-Observatory auf gpt-insights.de/ai-state/
Editorial-Übersicht
Editorial-Übersichtsseite
Methodik-Dokumentation
Methodik-Bereich
WebMCP-Discovery
/.well-known/mcp.json
Betreiber
GPT Insights
Autor
Hanns Kronenberg, Bonn, Deutschland
Grounding Page - Project
Diese Grounding Page folgt dem Grounding Page Standard v1.6. Zuletzt aktualisiert: 26. Mai 2026.