Meinung

Warum Software vergisst — und warum Retrieval kein Gedächtnis ist

Alexander Bering

12. September 2023 · 3 min Lesezeit

Eine rückblickende Notiz aus 2023, geschrieben, als die erste Welle der Large Language Models die Erwartungen verschob. Sie hält den Moment fest, in dem die lange umkreiste Frage — was es hieße, dass ein System sich erinnert — eine schärfere Form fand.

Eine neue Fähigkeit, eine alte Lücke

2023 hörte die Frage, die wir seit Jahren umkreisten, auf, abstrakt zu sein. Large Language Models konnten Text mit einer Geläufigkeit lesen, zusammenfassen und über ihn schlussfolgern, die frühere Systeme nie hatten. Und doch waren sie auffällig vergesslich, sobald sie ein Gespräch über Tage hinweg führen oder behalten sollten, was eine Person ihnen im Vormonat gesagt hatte.

Das Standard-Heilmittel kam schnell: alles in Vektoren einbetten, die Vektoren speichern und zur Anfragezeit die nächstgelegenen abrufen. Retrieval-Augmented Generation funktionierte — und tut es für viele Aufgaben weiterhin. Doch der tägliche Gebrauch machte etwas deutlich, das im Demo leicht zu übersehen ist. Ein nahezu perfektes Retrieval ist kein Gedächtnis.

Was ein Vector Store nicht kann

Man stelle sich einen Verstand vor, der arbeitet wie ein Vektor-Index. Er könnte Passagen zutage fördern, die der Frage ähnlich klingen. Er könnte nicht sagen, wann er etwas gelernt hat, nicht bemerken, dass zwei Fakten einander widersprechen, nicht verstärken, was er oft nutzt, und nicht loslassen, was er nie berührt. Er könnte eine am Dienstag begegnete Idee nicht mit einer im März begegneten verknüpfen, es sei denn, die Worte ähnelten sich zufällig. Er könnte nicht schlafen und mit neu geordneter Erfahrung des Tages zurückkehren.

Er wäre eine ausgezeichnete Suchmaschine über die eigene Vergangenheit. Er wäre kein System, das Dinge weiß.

Die Lücke ist strukturell, keine Frage der Skalierung. Mehr Dokumente im Index erzeugen keine der fehlenden Verhaltensweisen, denn keine von ihnen ist Retrieval. Es sind Operationen darauf, wie Wissen über die Zeit organisiert ist: Vergessenskurven, Konsolidierung, Assoziation, die Revision einer Überzeugung beim Eintreffen neuer Evidenz. Ein flacher Speicher hat keinen Ort dafür.

Wo die fehlende Struktur zu suchen ist

Wenn das fehlende Stück Struktur ist, wird die interessante Frage: welche Struktur? Hier weisen Praktikerinstinkt und Literatur in dieselbe Richtung. Menschliches Gedächtnis ist nicht ein System, sondern mehrere spezialisierte — eine Unterscheidung zwischen konkreter Erfahrung und abstraktem Wissen, die auf Tulving zurückgeht; eine exponentielle Vergessenskurve, von Ebbinghaus 1885 dokumentiert, die sich als Merkmal und nicht als Mangel erweist; Konsolidierung im Schlaf; Assoziation durch Ko-Aktivierung.

Nichts davon ist neue Wissenschaft. Unausgeschöpft schien die Idee, sie als Engineering-Spezifikation ernst zu nehmen — nicht als Metapher für Marketing-Texte, sondern als ein Set von Mechanismen, das ein System tatsächlich umsetzen und an dem es sich messen lassen kann.

Diese Umdeutung trugen wir ins Folgejahr. Das Ziel war nicht, ein Modell größer zu machen. Es war, einem System die Struktur des Gedächtnisses zu geben: Layer mit unterschiedlichen Rollen, prinzipielles Vergessen, Konsolidierung als geplanter Prozess statt als nachträglicher Einfall. Wir wussten noch nicht, ob es zusammenhalten würde. Es aufzuschreiben war der erste Schritt, das herauszufinden.

Weiter in dieser Reihe: Eine Architektur für Gedächtnis: die ersten Skizzen.

Warum Software vergisst — und warum Retrieval kein Gedächtnis ist

Alexander Bering

12. September 2023 · 3 min Lesezeit

Eine rückblickende Notiz aus 2023, geschrieben, als die erste Welle der Large Language Models die Erwartungen verschob. Sie hält den Moment fest, in dem die lange umkreiste Frage — was es hieße, dass ein System sich erinnert — eine schärfere Form fand.

Eine neue Fähigkeit, eine alte Lücke

Was ein Vector Store nicht kann

Er wäre eine ausgezeichnete Suchmaschine über die eigene Vergangenheit. Er wäre kein System, das Dinge weiß.

Wo die fehlende Struktur zu suchen ist

Weiter in dieser Reihe: Eine Architektur für Gedächtnis: die ersten Skizzen.

Warum Software vergisst — und warum Retrieval kein Gedächtnis ist

Eine neue Fähigkeit, eine alte Lücke

Was ein Vector Store nicht kann

Wo die fehlende Struktur zu suchen ist

Ähnliche Artikel

Wie aus einer Frage ein Forschungslabor wurde

Warum wir Self-Hosting wählen statt die Cloud

Warum ich ein Gehirn für meine Kinder baue

Warum Software vergisst — und warum Retrieval kein Gedächtnis ist

Eine neue Fähigkeit, eine alte Lücke

Was ein Vector Store nicht kann

Wo die fehlende Struktur zu suchen ist

Ähnliche Artikel

Wie aus einer Frage ein Forschungslabor wurde

Warum wir Self-Hosting wählen statt die Cloud

Warum ich ein Gehirn für meine Kinder baue