Eine rückblickende Notiz aus 2023, geschrieben, als die erste Welle der Large Language Models die Erwartungen verschob. Sie hält den Moment fest, in dem die lange umkreiste Frage — was es hieße, dass ein System sich erinnert — eine schärfere Form fand.
Eine neue Fähigkeit, eine alte Lücke
2023 hörte die Frage, die wir seit Jahren umkreisten, auf, abstrakt zu sein. Large Language Models konnten Text mit einer Geläufigkeit lesen, zusammenfassen und über ihn schlussfolgern, die frühere Systeme nie hatten. Und doch waren sie auffällig vergesslich, sobald sie ein Gespräch über Tage hinweg führen oder behalten sollten, was eine Person ihnen im Vormonat gesagt hatte.
Das Standard-Heilmittel kam schnell: alles in Vektoren einbetten, die Vektoren speichern und zur Anfragezeit die nächstgelegenen abrufen. Retrieval-Augmented Generation funktionierte — und tut es für viele Aufgaben weiterhin. Doch der tägliche Gebrauch machte etwas deutlich, das im Demo leicht zu übersehen ist. Ein nahezu perfektes Retrieval ist kein Gedächtnis.
Was ein Vector Store nicht kann
Man stelle sich einen Verstand vor, der arbeitet wie ein Vektor-Index. Er könnte Passagen zutage fördern, die der Frage ähnlich klingen. Er könnte nicht sagen, wann er etwas gelernt hat, nicht bemerken, dass zwei Fakten einander widersprechen, nicht verstärken, was er oft nutzt, und nicht loslassen, was er nie berührt. Er könnte eine am Dienstag begegnete Idee nicht mit einer im März begegneten verknüpfen, es sei denn, die Worte ähnelten sich zufällig. Er könnte nicht schlafen und mit neu geordneter Erfahrung des Tages zurückkehren.
Er wäre eine ausgezeichnete Suchmaschine über die eigene Vergangenheit. Er wäre kein System, das Dinge weiß.
Die Lücke ist strukturell, keine Frage der Skalierung. Mehr Dokumente im Index erzeugen keine der fehlenden Verhaltensweisen, denn keine von ihnen ist Retrieval. Es sind Operationen darauf, wie Wissen über die Zeit organisiert ist: Vergessenskurven, Konsolidierung, Assoziation, die Revision einer Überzeugung beim Eintreffen neuer Evidenz. Ein flacher Speicher hat keinen Ort dafür.
Wo die fehlende Struktur zu suchen ist
Wenn das fehlende Stück Struktur ist, wird die interessante Frage: welche Struktur? Hier weisen Praktikerinstinkt und Literatur in dieselbe Richtung. Menschliches Gedächtnis ist nicht ein System, sondern mehrere spezialisierte — eine Unterscheidung zwischen konkreter Erfahrung und abstraktem Wissen, die auf Tulving zurückgeht; eine exponentielle Vergessenskurve, von Ebbinghaus 1885 dokumentiert, die sich als Merkmal und nicht als Mangel erweist; Konsolidierung im Schlaf; Assoziation durch Ko-Aktivierung.
Nichts davon ist neue Wissenschaft. Unausgeschöpft schien die Idee, sie als Engineering-Spezifikation ernst zu nehmen — nicht als Metapher für Marketing-Texte, sondern als ein Set von Mechanismen, das ein System tatsächlich umsetzen und an dem es sich messen lassen kann.
Diese Umdeutung trugen wir ins Folgejahr. Das Ziel war nicht, ein Modell größer zu machen. Es war, einem System die Struktur des Gedächtnisses zu geben: Layer mit unterschiedlichen Rollen, prinzipielles Vergessen, Konsolidierung als geplanter Prozess statt als nachträglicher Einfall. Wir wussten noch nicht, ob es zusammenhalten würde. Es aufzuschreiben war der erste Schritt, das herauszufinden.