Analyse

Die KI ist nicht das Problem. Die Einführung ist es.

Alexander Bering

26. Juni 2026 · 14 min Lesezeit

Stellen Sie sich einen Mittelständler vor, der alles richtig zu machen scheint. Er kauft KI-Lizenzen für die halbe Belegschaft. Er startet ein Pilotprojekt mit der IT. Die Präsentation im Vorstand ist stolz, die Stimmung gut, die Folien sind voller Versprechen. Sechs Monate später fragt der Geschäftsführer in die Runde: Was hat uns das gebracht? Es wird still. Man sei ja noch in der Pilotphase.

Diese Szene wiederholt sich gerade tausendfach, in fast jeder Branche. Und sie hat fast nie den Grund, den alle vermuten.

Die Zahlen dazu sind inzwischen unmissverständlich. Die Boston Consulting Group hat 2025 rund 1.250 Unternehmen untersucht. Nur fünf Prozent holen aus KI Wert in der Breite. Sechzig Prozent holen gar keinen materiellen Wert. McKinsey kommt im selben Jahr bei knapp 2.000 Firmen zum gleichen Bild. Über achtzig Prozent spüren keinen Effekt auf das Ergebnis. McKinsey nennt das nüchtern das „gen-AI-Paradoxon": Fast alle setzen KI ein, fast niemand verdient daran.

Vielleicht haben Sie die noch drastischere Schlagzeile gelesen, dass fünfundneunzig Prozent der KI-Piloten scheitern. Sie stammt aus einem MIT-Bericht. Ich verwende sie hier bewusst nicht als Beweis. Sie ist vorläufig, nicht begutachtet, und der Absender verkauft die passende Lösung gleich mit. Der saubere Anker ist die BCG-Studie. Sie sagt im Kern dasselbe, nur belastbar: Der Wert kommt nicht an.

Bleibt die eigentliche Frage. Nicht ob. Sondern warum. Und die Antwort verschiebt das ganze Spielfeld.

Wir reden über das Modell. Es liegt fast nie am Modell.

Die bequeme Erklärung wäre: Die Technik ist noch nicht reif. Sie ist falsch. Die Modelle sind leistungsfähig und billig geworden, und für fast jeden Anwendungsfall steht ein passendes bereit. Wer heute scheitert, scheitert nicht an der Rechenkraft.

McKinsey hat über fünfundzwanzig mögliche Erfolgsfaktoren gegeneinander gerechnet. Der mit Abstand stärkste Hebel auf das Ergebnis ist nicht das Modell. Es ist die Neugestaltung der Arbeitsabläufe, von vorne bis hinten. BCG bringt dasselbe Prinzip auf eine Faustregel, die man sich einrahmen sollte. Sie heißt 10-20-70. Zehn Prozent der Wirkung kommen aus den Algorithmen. Zwanzig aus der Technik. Siebzig aus Menschen und Prozessen.

Lesen Sie diese Verteilung zweimal. Sie bedeutet: Das, worüber alle reden, also welches Modell, welcher Anbieter, welche Funktion, ist der kleinste Teil. Das, worüber kaum jemand redet, also wie Arbeit organisiert ist und wie Menschen mitgenommen werden, ist der größte.

Es gibt einen alten Satz aus der Datenwelt, der das auf den Punkt bringt. „Shit in, shit out." Wer ein brillantes Modell auf einen schlecht verstandenen Prozess und auf ungepflegte Daten setzt, bekommt teuren Stillstand. Die KI lässt den Engpass darunter nicht verschwinden. Sie macht ihn nur sichtbar und teuer.

Ein Bergwerk in Durham, und warum bessere Technik schlechter sein kann

Dass man eine neue Technik einführen und damit das Falsche optimieren kann, ist keine Erkenntnis des KI-Zeitalters. Sie ist über siebzig Jahre alt, und sie kommt aus einem Kohlebergwerk.

In den späten 1940er Jahren mechanisierten britische Zechen den Abbau. Vorher hatten kleine Gruppen von Bergleuten weitgehend selbstständig gearbeitet. Sie konnten mehrere Aufgaben, stützten sich gegenseitig, organisierten sich selbst. Die neue Maschinen-Methode zerschlug das. Aus den kleinen, vielseitigen Teams wurden große, in starre Einzelschichten zerlegte Trupps. Jeder machte nur noch einen Handgriff. Die Technik war moderner. Das Ergebnis war schlechter: weniger Förderung, mehr Fehltage, mehr Konflikt.

Ein Forscher des Londoner Tavistock-Instituts, Eric Trist, beschrieb 1951, was passiert war. Man hatte das technische System optimiert und das soziale dabei zerstört. Erst als man die Arbeit neu zuschnitt, sodass Maschine und selbstorganisierte Teams zusammenpassten, stiegen Produktivität und Zufriedenheit wieder. Trist nannte das Prinzip die gemeinsame Optimierung von Mensch und Technik. Es wurde zur Geburtsstunde des sozio-technischen Denkens.

Die Parallele zu heute ist fast unheimlich. Auch jetzt überholt die neue Fähigkeit der Maschinen das Tempo, in dem Organisationen ihre Arbeit umdenken. Die Maschine ist selten das Problem. Das ungelöste Drumherum ist es.

Kein Versagen, sondern ein bekanntes Muster

Es kommt sogar noch tröstlicher. Dass der Wert anfangs ausbleibt, ist nicht nur erklärbar, es ist vorhersehbar.

Die Ökonomen Erik Brynjolfsson, Daniel Rock und Chad Syverson haben dafür ein Modell, die Produktivitäts-J-Kurve. Der Gedanke ist einfach. Eine grundlegende Technologie verlangt große begleitende Investitionen: neue Abläufe, neue Organisation, neue Fähigkeiten. Diese Investitionen sind unsichtbar. Sie stehen in keiner Bilanz. Also sieht man zuerst nur die Kosten und noch keinen Ertrag. Die gemessene Produktivität sinkt, bevor sie steigt. Das ergibt die Form eines J.

Die Produktivitäts-J-Kurve: Der gemessene Wert sinkt zuerst während des unsichtbaren Aufbaus aus Prozessen, Organisation und Kompetenzen und steigt dann über das erwartete Niveau. Nach Brynjolfsson, Rock und Syverson.

Stellen Sie sich einen Obstgarten vor. Sie roden, pflanzen, gießen, beschneiden. Jahrelang zeigen die Bücher nur Aufwand. Die Ernte kommt später, und dann üppig. Brynjolfsson und Kollegen haben das beziffert. Berücksichtigt man die unsichtbaren Investitionen, lag die wahre Produktivität der US-Wirtschaft Ende 2017 fast sechzehn Prozent über dem, was offiziell gemessen wurde. Der Wert war da. Er war nur noch im Boden, nicht in der Frucht.

Ob KI demselben Zeitplan folgt, ist 2026 offen, und ich behaupte es nicht. Aber das Prinzip steht über jedem Zweifel. Der Wert einer Basistechnologie entsteht nicht im Werkzeug. Er entsteht in der Arbeit, die man darum herum neu organisiert. Die Wertlücke ist deshalb kein Beweis gegen KI. Sie ist der erwartbare Frühzustand, solange diese Arbeit nicht getan ist.

Reife schlägt Größe

Gilt das auch für den deutschen Mittelstand, der selten Konzern-Budgets hat? Hier sind die Daten überraschend klar, und sie kommen von Quellen, die niemand der Schwärmerei verdächtigt.

Die KfW hat Anfang 2026 ihr repräsentatives Mittelstandspanel ausgewertet. Zwanzig Prozent der Mittelständler nutzen inzwischen KI, eine Verfünffachung in wenigen Jahren. Bei größeren Firmen sind es laut Bitkom sogar sechsunddreißig Prozent. Aber die Nutzung bleibt an der Oberfläche. Im Schnitt sind es zwei Anwendungen pro Unternehmen, und nur knapp ein Viertel hat überhaupt feste Regeln dafür. Viel Anfang, wenig Tiefe.

Das Muster endet nicht an der deutschen Grenze. In der Schweiz nutzen laut der AXA-KMU-Studie 2025 inzwischen vierunddreißig Prozent der kleinen und mittleren Firmen aktiv KI, ein Anstieg um mehr als die Hälfte binnen eines Jahres. In Österreich meldet die Wirtschaftskammer für die wissensnahen Branchen vierundvierzig Prozent. Die Zahlen schwanken mit der Definition, das Bild dahinter ist überall dasselbe: schnelle Verbreitung, geringe Tiefe.

Der wichtigste Befund steckt im Kleingedruckten der KfW-Analyse. In den rohen Zahlen nutzen große Firmen mehr KI als kleine. Rechnet man aber die betriebliche Wissensbasis heraus, also Akademikeranteil, Forschung, eine Digitalstrategie, dann verschwindet der Größeneffekt vollständig. Statistisch bedeutungslos. Nicht die Größe entscheidet, sondern der Reifegrad.

Dahinter steckt ein gut belegtes Prinzip aus der Organisationsforschung. Schon 1990 zeigten die Ökonomen Wesley Cohen und Daniel Levinthal, dass ein Unternehmen Neues nur in dem Maß aufnehmen kann, in dem es bereits verwandtes Wissen besitzt. Sie nannten es Absorptionsfähigkeit. Ohne Anschlussstellen kein Andocken. Eine Organisation ohne digitale Reife kann KI nicht einfach einkaufen. Sie muss erst die Stellen bauen, an denen das Neue greifen kann. Das erklärt, warum dieselbe Software in der einen Firma zündet und in der anderen verpufft.

Die KfW zieht daraus einen Schluss, den ich fast wörtlich unterschreiben würde. KI dürfe „nicht nur punktuell eingesetzt werden, sondern muss breit und intensiv in Prozesse, Produkte und Geschäftsmodelle integriert werden", ergänzt um Investitionen „insbesondere in die Qualifizierung der Beschäftigten". Das ifo-Institut sagt im selben Jahr dasselbe in anderen Worten. Ob KI am Ende nützt oder schadet, hänge „entscheidend von der betrieblichen Umsetzung" ab. Wenn die Förderbank und das führende Wirtschaftsinstitut unabhängig zum selben Ergebnis kommen, sollte man zuhören. Der Erfolgsfaktor ist die Einführung.

Der Mensch ist nicht das Hindernis, für das man ihn hält

Damit sind wir beim heikelsten Teil, dem Menschen. Und hier muss man zuerst zwei beliebte Geschichten entsorgen.

Die erste lautet: „Siebzig Prozent aller Veränderungsprojekte scheitern." Diese Zahl ist ein Mythos. Der Forscher Mark Hughes hat 2011 die fünf üblichen Quellen dafür geprüft und in jeder einzelnen keinen Beleg gefunden. Nur eine Kette von Zitaten, die voneinander abschreiben. Wer den KI-Hype kritisiert, sollte selbst keine erfundenen Zahlen benutzen. Ich lasse sie weg.

Die zweite Geschichte lautet: „Die Menschen wollen KI nicht." Auch das stimmt so nicht. In den Experimenten der Forscherin Jennifer Logg vertrauen Menschen demselben Rat sogar mehr, wenn sie glauben, er komme von einem Algorithmus. Gleichzeitig zeigt eine deutsche Studie: Geht es um eine riskante Entscheidung mit echter Verantwortung, übergeben nur dreiundzwanzig Prozent die Wahl an die Maschine. Beides ist wahr. Es kommt auf den Kontext an, nicht auf eine angebliche Technikfeindlichkeit.

Was wirklich zählt, ist konkreter und besser steuerbar, als die Angst-Schlagzeilen nahelegen. Es sind drei Dinge: Vertrauen, Kontrolle und Erfahrung.

Vertrauen muss richtig dosiert sein, nicht maximal. Zu wenig, und ein gutes System bleibt ungenutzt. Zu viel, und niemand merkt, wenn es danebenliegt. In der deutschen Bevölkerung nennen siebenundsiebzig Prozent der Nicht-Nutzer fehlendes Vertrauen als Hauptgrund.

Kontrolle ist der vielleicht stärkste Hebel überhaupt, und ein Experiment macht das schön anschaulich. Forscher um Berkeley Dietvorst an der Universität Chicago zeigten Probanden einen Algorithmus, der nachweislich besser war als sie selbst, aber eben nicht perfekt. Durften die Leute das Ergebnis nicht anfassen, wollten ihn nur zweiunddreißig Prozent nutzen. Durften sie es ein kleines bisschen nachjustieren, waren es dreiundsiebzig. Dieselbe Technik, dieselbe Genauigkeit. Der einzige Unterschied war ein Lenkrad. Der Mensch im Entscheidungskreis ist also keine moralische Geste. Er ist die Bedingung dafür, dass das System überhaupt benutzt wird.

Und Erfahrung schlägt jedes Argument. Unter denen, die KI nutzen, sagen siebzig Prozent, sie mache das Leben leichter. Unter den Nicht-Nutzern überwiegen Angst und das Gefühl, abgehängt zu sein. Den Unterschied macht oft nur die erste eigene Berührung.

Das ist nicht mehr nur kluge Praxis, sondern Pflicht. Seit Februar 2025 verlangt Artikel 4 der EU-KI-Verordnung von jedem Unternehmen, das KI einsetzt, ein „ausreichendes Maß an KI-Kompetenz" der Beschäftigten. Ab August 2026 kommt zusätzlich die behördliche Aufsicht dazu. Bitkom zeigt die Lücke. Dreiundvierzig Prozent der Firmen schulen dazu gar nicht, siebzig Prozent der Beschäftigten bekommen kein Angebot. Selten zeigen der stärkste Hebel und das geltende Recht so deutlich in dieselbe Richtung.

Was kollektive Intelligenz wirklich bedeutet

Wir reden gern von „Mensch und Maschine gemeinsam". Es klingt nach Fortschritt. Aber funktioniert es?

Die ehrlichste Antwort kommt ausgerechnet von der Forschungsgruppe, die den Begriff der kollektiven Intelligenz geprägt hat, vom Team um Thomas Malone am MIT. 2024 fasste es in der Zeitschrift Nature Human Behaviour hundertsechs Studien zusammen. Das Ergebnis ist unbequem. Im Durchschnitt schneiden Mensch-KI-Kombinationen schlechter ab als der bessere der beiden allein. Den Menschen einfach neben die KI zu setzen, macht es im Mittel also nicht besser. Es macht es oft schlechter.

Synergie entsteht nur unter Bedingungen, und die kann man benennen. Sie entsteht bei schöpferischen Aufgaben, weniger bei reinen Entscheidungen. Und sie entsteht vor allem dann, wenn der Mensch der stärkere Partner ist. Ist der Mensch besser als die KI, schlägt das Team beide. Ist die KI besser, zieht der Mensch das Ergebnis nach unten. Das heißt im Klartext: Kollektive Intelligenz ist kein Automatismus, der entsteht, weil man zwei Dinge zusammenschaltet. Sie ist eine Konstruktionsaufgabe. Man muss entscheiden, welche Aufgabe an wen geht, wer führt und wo der Mensch eingreift.

Das passt zu allem, was wir über gute Teams wissen. Die Studien von Anita Woolley zeigen, dass Gruppen so etwas wie einen eigenen Intelligenzwert haben. Und der hängt weniger am IQ der Köpfe als am Wie der Zusammenarbeit. Wer ausreden lässt, wer sozial wahrnehmungsfähig ist, wessen Redeanteile sich verteilen. In der großen Folgeanalyse ist dieser Prozess der Zusammenarbeit ungefähr doppelt so wichtig wie die Fähigkeiten der Einzelnen. Der Fairness halber: Der Befund ist in der Forschung umstritten, ich verkaufe ihn nicht als Naturgesetz. Aber die Richtung ist robust und sie deckt sich mit dem Bergwerk in Durham. Optimiere die Technik allein, und du machst es schlimmer. Optimiere Mensch und Technik gemeinsam, und es trägt.

Kollektive Intelligenz ist deshalb kein Werbewort. Es ist die genaue Beschreibung dessen, worum es geht. Das gestaltete Zusammenspiel von Mensch und Maschine auf einer gemeinsamen Struktur. In der Fachsprache trägt diese Struktur einen Namen, die kognitive Architektur. Das Modell ist austauschbar. Sie ist es nicht.

Anfangen, ohne sich die Zukunft zu verbauen

Wenn der Wert in der Einführung entsteht, dann entscheidet sich alles am Anfang. Und genau dort wird der häufigste Fehler gemacht. Man baut schnelle Pilotprojekte, die nirgendwohin führen. In der Forschung heißt dieser Zustand Pilot-Fegefeuer. Ein großer Teil der Vorhaben kommt nie über den ersten Test hinaus, nicht weil die Technik versagt, sondern weil niemand an den Tag danach gedacht hat. Die Zahlen sind drastisch. Gartner erwartet, dass mindestens jedes dritte Projekt nach dem ersten Test eingestellt wird. Eine Erhebung von S&P Global fand, dass Unternehmen 2025 im Schnitt sechsundvierzig Prozent ihrer Prototypen verschrotteten, bevor sie in Produktion gingen.

Der Ausweg ist kein größeres Modell, sondern ein klügerer erster Schnitt. Drei Prinzipien tragen.

Erstens, wenige tiefe Anwendungsfälle statt vieler flacher. Lieber einen Prozess, den man wirklich neu denkt, als zehn Werkzeuge, die unverbunden nebeneinander laufen.

Zweitens, messen, bevor man baut. Legen Sie die Kennzahl vor dem Piloten fest, nicht danach. Erstaunlich wenige Organisationen tun das. Und genau sie sind es, die hinterher keinen Wert nachweisen können.

Drittens, modular bauen statt als Wegwerf-Prototyp. Schon 2015 beschrieben Google-Forscher die „versteckte technische Schuld" in KI-Systemen. Ihr Kernsatz, sinngemäß: In solchen Systemen verändert das Ändern von irgendetwas alles. Wer den ersten Piloten als isolierte Insel baut, zahlt bei jeder Erweiterung drauf. Wer ihn als wiederverwendbaren Baustein anlegt, baut ein Fundament. Das gilt vor allem für die Schicht, in der das Wissen des Unternehmens lebt. Wenn das System aus dem Arbeitsalltag lernt und dieses Gelernte behält, wird der zweite Anwendungsfall billiger als der erste. Tut es das nicht, erklärt man der KI jeden Montag von Neuem dasselbe.

In sieben Sätzen, zum Mitnehmen:

Die Führung verankert eine Wertambition und trägt sie sichtbar. KI wird nicht nach unten delegiert.
Denken Sie 10-20-70. Der Fokus liegt auf Menschen und Prozessen.
Wenige tiefe Anwendungsfälle, jeder mit einer Kennzahl, die vor dem Start feststeht.
Datenreife und Wissenshoheit zuerst klären. Verfügbar ist nicht dasselbe wie souverän.
Gestalten Sie das Mensch-Maschine-Team bewusst. Geben Sie Menschen Kontrolle und eine erste eigene Erfahrung.
Bauen Sie Kompetenz auf. Das ist seit 2025 Pflicht und zugleich der stärkste Hebel.
Bauen Sie modular. Der erste Pilot soll den zweiten erleichtern, nicht erschweren.

Wem gehört die Schicht, die lernt?

Am Ende läuft alles auf eine Frage zusammen, die in den meisten Strategiepapieren fehlt. Nicht „welches Modell?". Sondern: Wem gehört die Schicht, in der das Wissen des Unternehmens lebt?

Denn dort entsteht der Wert, der bleibt. Ein Modell kann man wechseln wie einen Lieferanten. Das über Jahre gewachsene Prozesswissen einer Organisation kann man das nicht. Liegt diese Schicht in einer fremden Cloud, dann ist die Verantwortung im Haus, die Hoheit aber woanders. Regelkonform zu sein ist nicht dasselbe, wie es zu besitzen. Das eine schützt vor Bußgeld. Das andere schützt den Wert.

Die Verschiebung, die wir gerade erleben, ist deshalb keine vom kleineren zum größeren Modell. Sie geht von künstlicher zu kollektiver Intelligenz. Von der Frage, was das Werkzeug kann, zur Frage, wie Mensch und Maschine auf einer Struktur zusammenarbeiten, die das Unternehmen wirklich besitzt.

Die gute Nachricht steckt in derselben Erkenntnis wie die schlechte. Wenn KI scheitert, liegt es selten an der KI. Das heißt, es liegt an etwas, das Sie selbst in der Hand haben. Die Technik ist gelöst. Die eigentliche Arbeit beginnt jetzt.

Methodik und Quellen

Dieser Beitrag beruht auf drei systematischen Recherche-Pässen mit rund 80 Quellen, deren Kernaussagen mehrfach gegengeprüft wurden. Wichtige Belege (2024 bis 2026 sowie Klassiker): BCG „AI Value Gap" 2025; McKinsey „State of AI" 2025; KfW Fokus 533/2026; ifo Schnelldienst 8|2025; Bitkom KI-Studienbericht 2026; AXA KMU-Arbeitsmarktstudie Schweiz 2025; WKÖ-Branchenerhebung Österreich; Gartner 2024; S&P Global Market Intelligence 2025; Brynjolfsson, Rock und Syverson (AEJ:Macroeconomics 2021); Trist und Bamforth (1951); Woolley et al. (Science 2010) und Riedl et al. (PNAS 2021); Vaccaro, Almaatouq und Malone (Nature Human Behaviour 2024); Logg et al. (2019); Dietvorst et al. (2018); Lee und See (2004); Cohen und Levinthal (1990); Hughes (2011); Sculley et al. (NeurIPS 2015). Bewusst nicht als harte Statistik verwendet: die viel zitierte MIT-Zahl von „95 Prozent" und der „70 Prozent scheitern"-Wert.

Die KI ist nicht das Problem. Die Einführung ist es.

Wir reden über das Modell. Es liegt fast nie am Modell.

Ein Bergwerk in Durham, und warum bessere Technik schlechter sein kann

Kein Versagen, sondern ein bekanntes Muster

Reife schlägt Größe

Der Mensch ist nicht das Hindernis, für das man ihn hält

Was kollektive Intelligenz wirklich bedeutet

Anfangen, ohne sich die Zukunft zu verbauen

Wem gehört die Schicht, die lernt?

Methodik und Quellen

Ähnliche Artikel

Der Mensch behält das letzte Wort: unser Umgang mit KI

Vom ersten Prozess zum Betriebssystem: Wie KI-Einführung wirklich gelingt

Öffentliche Räume schützen, ohne sie zu überwachen

Die KI ist nicht das Problem. Die Einführung ist es.

Wir reden über das Modell. Es liegt fast nie am Modell.

Ein Bergwerk in Durham, und warum bessere Technik schlechter sein kann

Kein Versagen, sondern ein bekanntes Muster

Reife schlägt Größe

Der Mensch ist nicht das Hindernis, für das man ihn hält

Was kollektive Intelligenz wirklich bedeutet

Anfangen, ohne sich die Zukunft zu verbauen

Wem gehört die Schicht, die lernt?

Methodik und Quellen

Ähnliche Artikel

Der Mensch behält das letzte Wort: unser Umgang mit KI

Vom ersten Prozess zum Betriebssystem: Wie KI-Einführung wirklich gelingt

Öffentliche Räume schützen, ohne sie zu überwachen