Kontextfenster

von Nicole Angela Buck

Warum Claude irgendwann vergisst, was Du am Anfang gesagt hast

Wenn Du länger mit einer KI arbeitest, an einem Projekt, in einem langen Chat, kommt irgendwann der Moment: Du schreibst „Mach das so wie vorhin besprochen" – und die KI weiß plötzlich nicht mehr, was vorhin besprochen war. Sie antwortet ausweichend, halluziniert sich was zurecht, oder fragt nochmal nach. Das ist meistens kein Bug. Das ist das Kontextfenster.

Was ist ein Kontextfenster?

Das Kontextfenster ist die Menge an Text, die eine KI gleichzeitig „im Kopf" haben kann. Alles, was Du im Chat geschrieben hast, alles, was die KI geantwortet hat, alle hochgeladenen Dokumente – das alles zusammen muss in dieses Fenster passen. Gemessen wird es in Token (siehe Woche 4).

Bei modernen Modellen sind das beeindruckende Größen. Claude kann gerade in einem einzelnen Chat etwa 500 Seiten Text gleichzeitig verarbeiten, GPT-5 ähnliches, Gemini noch mehr. Klingt nach unendlich, ist es aber nicht.

Wenn Du das Limit überschreitest, hat die KI zwei Möglichkeiten. Entweder sie bricht ab und sagt „das ist zu lang". Oder sie wirft heimlich den ältesten Teil des Gesprächs raus, um Platz für Neues zu machen. Dann „vergisst" sie, was am Anfang stand.

Was Du wirklich wissen musst

Das Kontextfenster ist kein Gedächtnis. Es ist ein Arbeitsspeicher. Was darin ist, ist verfügbar. Was rausfällt, ist weg. Auch wenn der Chat noch offen ist, auch wenn die KI fünf Minuten vorher etwas „wusste".

Das hat drei praktische Folgen.

Erstens: Lange Chats werden unzuverlässig. Wenn Du seit zwei Stunden im selben Fenster bist, mit 30 Nachrichten hin und her, ist die Wahrscheinlichkeit hoch, dass die KI Anfangsinformationen verloren hat. Du merkst es oft erst, wenn die Antworten ungenauer werden.

Zweitens: Hochgeladene Dokumente konkurrieren um Platz. Wenn Du fünf PDFs hochlädst und dann lange darüber diskutierst, fressen die PDFs einen Großteil des Fensters auf. Für das eigentliche Gespräch bleibt weniger Raum.

Drittens: Jedes Modell hat ein anderes Fenster. ChatGPT, Claude, Gemini, sie alle haben unterschiedliche Größen. Wer komplexe Arbeit macht (lange Dokumente analysieren, lange Recherchen), sollte wissen, welches Modell für diese Aufgabe das größere Fenster bietet.

Und ja, es gibt seit Kurzem Modelle mit Kontextfenstern, die ein ganzes Buch fassen. Aber „passt rein" heißt nicht „wird auch zuverlässig genutzt". Studien zeigen, dass KI bei sehr großen Eingaben oft das aus der Mitte vergisst, während Anfang und Ende präsenter bleiben. Wer also ein 500-Seiten-Dokument hochlädt und Detailfragen aus Seite 247 stellt, sollte nicht erwarten, dass die Antwort verlässlich ist.

Was Du damit machst

Drei Gewohnheiten, die helfen.

Wenn Du an einem wichtigen Projekt arbeitest, fang lieber einen neuen Chat an, statt endlos im alten weiterzumachen. Fass die wichtigsten Punkte aus dem alten Chat in eine kurze Zusammenfassung, kopier die rein, weitermachen. Klingt umständlich, ist aber zuverlässiger.

Wenn Du lange Dokumente hochlädst, mach sie so klein wie möglich. Nicht das ganze PDF, sondern nur die relevanten Kapitel. Nicht die ganze Webseite, sondern der Text, den Du brauchst. Spart Token und macht die KI fokussierter.

Wenn die Antworten plötzlich ungenauer werden, frag die KI selbst: „Was weißt Du noch über das, was wir am Anfang besprochen haben?" Wenn sie schwammig wird oder ausweicht, ist das Kontextfenster vermutlich voll. Dann: Neustart.

 

Verwandte Begriffe: Token, Token-Limit, Prompt
Stand: Mai 2026

 

← Zurück: Token | Prompt Engineering: Weiter →

← Zurück zur Übersicht