Warum AI ROI schwer zu beweisen ist: Und was dagegen zu tun ist

Im Vendor-Pitch hat niemand erwähnt, dass der Nachweis des AI-Return on Investment (ROI) so schwer sein würde.
Die Demo war sauber. Die Case Studies waren überzeugend. Die erwarteten Renditen wurden in einer Tabelle berechnet, die der Sales Engineer des Vendors während des Discovery Calls erstellt hatte. „Sie haben 50 Reps, jeder spart 2 Stunden pro Woche, gemischter Satz von 55 Euro pro Stunde. Das sind 285.000 Euro pro Jahr. Das Tool kostet 180.000 Euro. ROI in 7,6 Monaten."
Ihr Board hat die Investition genehmigt. Sie haben das Tool eingeführt. Sechs Monate später läuft der Pilot, und Ihr Chief Financial Officer (CFO) fragt nach dem ROI-Bericht.
Sie schauen auf das, was Sie haben. Vielleicht eingesparte Zeit. Mitarbeiterzufriedenheit mit dem Tool, generell positiv. Einige Anekdoten von Reps, die sagen, ihr Workflow sei besser. Der Customer Success Manager des Vendors bietet an, Ihnen beim Schreiben der Case Study zu helfen.
Aber die harte Zahl, der klare Vorher-Nachher-Vergleich, der zeigt, dass die Investition zur versprochenen Rate zurückgezahlt hat, ist nicht da. Die Pipeline ist gestiegen, aber auch der Markt. Die Win Rate hat sich verbessert, aber Sie haben auch drei Senior Reps eingestellt. Sie haben Stunden gespart, können aber nicht zeigen, dass diese Stunden irgendwohin geflossen sind, was die Gewinn-und-Verlust-Rechnung (P&L) verändert hat.
Sie sind damit nicht allein. Und Sie machen nichts falsch.
Das ist der schwierigste Teil der AI-Transformation. Nicht die Technologie. Nicht das Change Management. Die Messung.
Die ehrliche Position des ACE Framework zum AI ROI
Das ACE Framework ist diesbezüglich explizit. Die Level-5-Governance-Dokumentation besagt es direkt: Die meisten AI-Piloten beweisen ROI nicht klar. Betrachten Sie das als den schwierigsten Teil der AI-Transformation, nicht als den einfachsten.
Key Facts: Die AI-ROI-Messlücke
- Nur 39 % der Unternehmen berichten über EBIT-Auswirkungen auf Unternehmensebene durch AI-Deployments, während die globalen Enterprise-AI-Investitionen 2025 644 Milliarden Dollar erreichen. (McKinsey / Gartner)
- Der Anteil der Unternehmen, die die meisten ihrer AI-Projekte abbrechen, ist 2025 auf 42 % gestiegen, gegenüber 17 % im Vorjahr, mit unklarem ROI und Gesamtkosten als Hauptgründen. (Master of Code)
- Die meisten Unternehmen benötigen zwei bis vier Jahre, um Renditen aus einem typischen AI-Use-Case zu realisieren, ein Muster, das Deloitte als „AI J-Kurve" bezeichnet. (Deloitte)
Das ist wichtig, weil die alternative Rahmung überall präsent ist. Vendor-Case-Studies beweisen ROI klar, weil sie von Vendors geschrieben werden. Konferenz-Keynotes beweisen ROI klar, weil der Sprecher das Beispiel gewählt hat, das funktioniert hat. Framework-Artikel, die versprechen, wie man AI ROI in 5 Schritten berechnet, glätten die strukturellen Probleme, die diese fünf Schritte in der Praxis unzuverlässig machen.
Die strukturellen Probleme sind real. Und sie zu benennen ist der Anfang davon, etwas dagegen zu tun.
Grund 1: Das Baseline-Problem
ROI erfordert einen Vorher-Nachher-Vergleich. Die meisten Unternehmen erfassen das „Vorher" nicht, bevor sie beginnen.
Wenn jemand ROI nachweisen möchte, ist die Pre-AI-Periode bereits vorbei. Man kann nicht zurückgehen und messen, wie die Win Rates der Reps vor dem Einsatz des AI-Sales-Assist-Tools waren, weil man nicht daran gedacht hat, diese spezifische Kennzahl vor der Einführung zu verfolgen.
Das Ergebnis: man misst aktuelle Performance gegen einen allgemeinen Eindruck der früheren Performance. Das ist keine Baseline. Das ist ein Eindruck.
MIT Sloan Management Review Forschung zu Messung des AI-Projektwerts ergab, dass Datenwissenschaftler Business-KPIs wie ROI und Umsatz als die wichtigsten Kennzahlen einstufen, aber technische Kennzahlen am häufigsten gemessen werden, weil Business-Baselines vor der Einführung nicht gesetzt wurden.
Das ist kein Ausführungsversagen. Es ist ein strukturelles Problem damit, wie Unternehmen AI einsetzen. Die Messarbeit muss vor der Einführung geschehen, nicht danach.
Grund 2: Das Attributionsproblem
AI wird nie isoliert eingesetzt. Wenn Sie ein AI-Tool einführen, aktualisieren Sie auch Ihre Prozesse, schulen Ihr Team im Umgang mit dem Tool und führen die Einführung oft parallel zu anderen Initiativen durch. Mehrere Dinge ändern sich gleichzeitig, und AI-Beitrag von allem anderen zu trennen ist wirklich schwierig.
Betrachten Sie ein reales Einsatz-Szenario: Im Q2 führen Sie ein AI-Lead-Scoring-Tool ein. Im selben Quartal stellen Sie auch zwei Senior Account Executives (AEs) ein, Ihr Marketing-Team lanciert eine neue Kampagne, die 30 % mehr Inbound-Leads generiert, und Ihr Produktteam liefert ein wichtiges Feature. Ihre Pipeline wächst im Q3 um 22 %.
Wie viel dieses 22%igen Wachstums kam vom AI-Lead-Scoring?
Eine saubere Antwort gibt es nicht. Eine ehrliche Studie von MIT Sloan/BCG ergab, dass 7 von 10 Unternehmen keinen Wert aus ihren AI-Investitionen berichteten, wobei die Autoren dies direkt auf fehlende Produktionsbereitstellung und fehlende rigorose Attributionsmethodik zurückführten.
Attribution ist strukturell schwierig. Der einzige Weg, sie zu reduzieren, sind kontrollierte Experimente, bei denen einige Nutzer die AI erhalten und andere nicht, mit zusammengepassten Kohorten und dem gleichen Zeitfenster. Diese Experimente sind schwer in der Praxis durchzuführen, weil niemand in der Kontrollgruppe sein möchte. Aber selbst ein unvollkommenes kontrolliertes Experiment ist besser als ein Vorher-Nachher ohne Kontrollen.
Grund 3: Das Lag-Problem
AI-Vorteile zeigen sich oft sechs bis achtzehn Monate nach der Einführung, nicht sechs Wochen danach.
Die ersten Wochen und Monate einer AI-Einführung sind die Lernphase. Nutzer finden heraus, wie man das Tool benutzt. Die Workflow-Integration ist noch holprig. Die Adoption ist ungleichmäßig. Frühe Kennzahlen spiegeln die Lernkurve wider, nicht den Steady-State-Wert.
Aber die meisten AI-ROI-Berichte erfolgen in den ersten zwei bis drei Monaten, weil das der Zeitpunkt ist, an dem das Board ein Status-Update möchte. Das Messfenster ist für das gemessene Phänomen falsch.
Das Lag-Problem bedeutet nicht, dass man in den ersten 90 Tagen gar nichts berichten sollte. Es bedeutet, dass man berichten soll, was für den Zeitplan angemessen ist: Adoption-Kennzahlen, frühe Frühindikatoren, qualitatives Nutzerfeedback und Time-Saved-Daten, wo sichtbar. Und man sollte klare Erwartungen setzen, dass Umsatzauswirkung und Qualitätsverbesserungskennzahlen 6 bis 18 Monate benötigen, um aussagekräftig zu werden.
Grund 4: Das falsche Kennzahlen-Problem
Die meisten Unternehmen messen, was einfach zu messen ist, statt was wichtig ist.
Eingesparte Stunden sind einfach zu messen. Ob diese Stunden zu inkrementellem Geschäftsoutput geführt haben, ist viel schwieriger. Mitarbeiterbefragungssentiment ist leicht zu erheben. Ob es mit Performanceverbesserung korreliert, ist unbekannt.
Das falsche Kennzahlen-Problem hat ein spezifisches Muster: Teams setzen AI ein, finden schnell eine Kennzahl, die Verbesserung zeigt, und berichten diese als ROI. Die Kennzahl ist real. Aber sie ist nicht die Kennzahl, die für das Geschäft wichtig ist.
Ein AI, das die Zeit-bis-Einstellung um 30 % reduziert, sieht nach einem starken HR-Ergebnis aus. Wenn aber die über den AI-gestützten Prozess eingestellten Kandidaten eine geringere 12-Monats-Retention haben, verdeckt die falsche Kennzahl (Zeit-bis-Einstellung) die richtige (Qualität der Einstellung).
Die Lösung besteht darin, die richtigen Kennzahlen vor der Einführung zu definieren, nicht danach. Das 5-Dimensionen-AI-ROI-Framework ist das praktischste Werkzeug zur Definition, welche Kennzahlen über Zeit, Kosten, Qualität, Umsatz und Risikodimensionen simultan zu baseline-messen sind.
Grund 5: Das versteckte Kostenproblem
AI kostet mehr als die Lizenzgebühr.
Jede AI-Einführung hat Kosten, die im Vendor-Vertrag nicht erscheinen:
Oversight-Zeit. Jemand muss AI-Outputs auf Qualität überwachen. Jemand muss Edge Cases überprüfen. Das ist echte Arbeit, und in den meisten Einführungen wird sie nicht verfolgt und nicht verbucht.
Fehlerbehebung. AI-Systeme machen Fehler. Wenn AI in einem folgenreichen Workflow einen Fehler macht, behebt ein Mensch ihn. Diese Zeitkosten sind selten im ROI-Modell enthalten. MIT Sloan Forschung zu versteckten Kosten der AI-Implementierung ergab, dass AI-generierte Outputs in technischen Umgebungen kumulative Wartungsschulden schaffen können, die selten im anfänglichen ROI-Modell erscheinen.
Integration und Wartung. Die anfänglichen Einführungskosten sind meist budgetiert. Die laufende Integrationswartung, das Prompt-Tuning, Modell-Updates, die Verhalten ändern, Datenpipeline-Änderungen, sind es oft nicht.
Workflow-Redesign. Die Einführung von AI in einen bestehenden Workflow erfordert oft einen Workflow-Redesign. Das kostet Zeit.
Training und Adoption. Mitarbeiter dazu zu bringen, das Tool tatsächlich gut zu nutzen, erfordert laufenden Aufwand.
Ein reales ROI-Kalkül schließt all das ein. Das Tabelle, die der Sales Engineer des Vendors während des Discovery Calls erstellt hat, schloss sie nicht ein.
Grund 6: Das Problem immaterieller Vorteile
Einige der bedeutendsten Vorteile von AI sind genuinst schwer zu quantifizieren.
Bessere Entscheidungen. Höhere Mitarbeiterzufriedenheit. Verbessertes organisationales Wissen. Diese Vorteile sind real. Sie widerstehen aber dem sauberen Vorher-Nachher-Vergleich, den Finance benötigt.
Der ehrliche Ansatz: beschreiben Sie sie klar, erklären Sie, warum sie wertvoll sind, und verpflichten Sie sich, wo möglich eine Proxy-Kennzahl zu finden. „Mitarbeiterzufriedenheit" kann durch Gallup-Stil-Engagement-Umfragen gemessen werden. Sie werden nicht alles quantifizieren. Aber einen Teil zu quantifizieren ist besser, als es entweder aufzublasen oder aus dem Bild zu lassen.
Grund 7: Confirmation Bias

Die Führung wollte, dass AI funktioniert. Das ist kein Charakterfehler. Es ist ein vorhersehbares menschliches Vorurteil in jedem Investitionsprogramm.
Confirmation Bias wirkt in jeder Phase der AI-ROI-Messung. Die ausgewählten Kennzahlen sind tendenziell die, die Verbesserung zeigen. Das ausgewählte Zeitfenster ist tendenziell das, das die besten Ergebnisse zeigt. Negative Ergebnisse werden untergewichtet.
Die Abhilfe ist strukturell: Ernennen Sie jemanden, dessen Aufgabe es ist, Belege dafür zu finden, dass die AI nicht funktioniert. Das könnte das Büro des CFO, eine interne Audit-Funktion oder ein designierter Skeptiker im Transformationsteam sein. Das CFO-Gespräch über das AI-Budget empfiehlt als strukturelle Gegenmaßnahme, Erfolgskennzahlen schriftlich festzulegen, bevor die Ergebnisse sichtbar sind, damit der Rahmen fixiert ist, bevor Confirmation Bias einsetzt.
Ein AI-Programm, das jemanden hat, der aktiv seine ROI-Ansprüche testet, ist glaubwürdiger als eines, das das nicht hat.
Die 7 ROI-Attribution-Gaps
Die 7 ROI-Attribution-Gaps sind ein Diagnose-Framework zum Verständnis, warum AI-ROI-Nachweise scheitern. Jede Lücke ist ein strukturelles Problem im Messdesign, kein Technologieversagen: (1) fehlende Pre-Deployment-Baseline, (2) Kontamination durch gleichzeitige Variablen, (3) Messzeitpunkt, der die ROI-Kurve verpasst, (4) falsche Kennzahlenauswahl, (5) versteckte Kostenauslassung, (6) immaterielle Nutzeninflation und (7) Confirmation Bias bei der Ergebnisinterpretation. Alle sieben vor der Einführung anzugehen ist die Grundlage eines glaubwürdigen AI-ROI-Falls.
Quotable: „MIT-Sloan- und BCG-Forschung ergab, dass 7 von 10 Unternehmen keinen Wert aus ihren AI-Investitionen berichteten, wobei die Ursache direkt auf fehlende Produktionsbereitstellung und fehlende rigorose Attributionsmethodik zurückgeführt wurde, nicht auf AI-Technologielimitierungen."
Quotable: „Die Tabelle, die während des Discovery Calls erstellt wurde, schloss keine Oversight-Zeit, Fehlerbehebung, Integrationswartung, Workflow-Redesign oder laufende Trainingskosten ein. Die Lücke zwischen dieser Tabelle und dem tatsächlichen ROI ist kein AI-Versagen. Es ist ein Kostenmodellierungsversagen."
Quotable: „Nur 5,5 % der Unternehmen berichten über mehr als 5 % EBIT, das AI zuzuschreiben ist, was bedeutet, dass jedes Board-Mitglied, das McKinseys State-of-AI-Forschung verfolgt hat, bereits weiß, dass die Vendor-Versprechen aufgeblasen waren, bevor Sie den Raum betreten." (McKinsey)
Quotable: „Die Unternehmen, die echte AI-Messfähigkeit aufbauen, tun das langsam, unvollkommen und ehrlich. Sie berichten, was sie beweisen können. Sie markieren, was sie nicht können. Diese intellektuelle Ehrlichkeit ist glaubwürdiger bei einem erfahrenen Board als jede Vendor-Tabelle."
Quotable: „Jemanden zu ernennen, dessen Aufgabe es ist, Belege dafür zu finden, dass die AI nicht funktioniert, ist kein Pessimismus. Es ist der strukturelle Check, der positive ROI-Ergebnisse glaubwürdig macht, wenn sie auftreten."
| Attribution-Gap | Was schief läuft | Prävention |
|---|---|---|
| Fehlende Baseline | Kein Pre-AI-Benchmark zum Vergleich | Alle Kennzahlen 2-4 Wochen vor Go-Live erfassen |
| Gleichzeitige Variablen | Andere Änderungen verdecken AI-Beitrag | Kontrolliertes A/B-Experiment durchführen oder alle Einflussfaktoren dokumentieren |
| Messzeitpunkt | Reporting in Woche 8, wenn ROI in Monat 12 erscheint | 6-Monats- und 18-Monats-Checkpoints im Voraus festlegen |
| Falsche Kennzahl | Zeit-bis-Einstellung berichten, wenn Qualität der Einstellung wichtig ist | Erfolgskennzahlen im Voraus mit Leadership-Zustimmung definieren |
| Versteckte Kosten | Nur Lizenzgebühr; Oversight, Wartung, Redesign ausgelassen | Vollständig einkalkuliertes Kostenmodell vor Genehmigung erstellen |
| Immaterielle Inflation | Nicht quantifizierte Vorteile als harten ROI anführen | Proxy-Kennzahlen verwenden; markieren, was geschätzt vs. gemessen ist |
| Confirmation Bias | Post-hoc Kennzahlen auswählen, die Verbesserung zeigen | Erfolgskriterien vorregistrieren; designierten Skeptiker ernennen |
Rework-Analyse: Basierend auf Enterprise-AI-Einführungsmustern berichten Unternehmen, die Erfolgskennzahlen vor der Einführung schriftlich vorregistrieren und einen designierten Skeptiker zur Überprüfung von ROI-Ansprüchen einsetzen, von deutlich höherem Board-Vertrauen in ihre AI-Programme, selbst wenn der gemessene ROI unter den Vendor-Prognosen liegt. Board-Glaubwürdigkeit kommt von Messdisziplin, nicht von optimistischen Zahlen.
Das ist der schwierigste Teil der AI-Transformation
Lassen Sie das einsinken. Nicht die Technologieauswahl. Nicht das Change Management. Nicht die Datenvorbereitung. Die Messung.
Jeder andere Teil der AI-Transformation hat einen Vendor, einen Berater, ein Framework und ein Playbook. Aber niemandes ROI-Modell erfasst die volle Komplexität dessen, was passiert, wenn ein AI-System über die Zeit mit einem realen Unternehmen interagiert.
Die Unternehmen, die echte AI-Messfähigkeit aufbauen, tun das langsam, unvollkommen und ehrlich. Sie berichten, was sie beweisen können. Sie markieren, was sie nicht können. Sie bauen die Baseline-Infrastruktur vor der nächsten Einführung auf. Und sie teilen dem Board mit, dass AI ROI schwer zu beweisen ist -- nicht weil die AI nicht funktioniert, sondern weil Messung schwer ist. Diese Art von intellektueller Ehrlichkeit ist bei einem erfahrenen Board glaubwürdiger als jede Vendor-Tabelle.
Die 5-Schritte-ROI-Disziplin

Angesichts all dem oben Gesagten, hier ist, was wirklich funktioniert, um vertretbare AI-ROI-Messung aufzubauen.
Schritt 1: Baseline vor dem Start. Bevor Sie eine AI-Initiative einführen, erfassen Sie den aktuellen Zustand der Kennzahlen, die Sie messen wollen. Win Rate, durchschnittliche Bearbeitungszeit, Kundenzufriedenheitswerte, Fehlerquote, Kosten pro Lösung -- was auch immer relevant ist. Verwenden Sie die gleiche Methodik, die Sie nach der Einführung verwenden werden. Tun Sie das zwei bis vier Wochen vor Go-Live.
Schritt 2: Erfolgskennzahlen im Voraus definieren. Vereinbaren Sie, welche Kennzahlen zur Bewertung der Initiative verwendet werden, bevor die Ergebnisse bekannt sind. Schreiben Sie die Erfolgskriterien in ein Dokument, das das Leadership unterschreibt.
Schritt 3: Bei 6 Monaten und 18 Monaten messen. Frühe Messung (erste 60 bis 90 Tage) erfasst Adoption und Frühindikatoren. Mittelfristige Messung (6 Monate) zeigt, ob die Lernkurve abflacht. Langfristige Messung (18 Monate) erfasst den Steady-State-Wert.
Schritt 4: Ehrlich berichten, was man kann und was man nicht zuschreiben kann. Unterscheiden Sie zwischen „wir haben diese Verbesserung beobachtet" und „wir glauben, AI hat diese Verbesserung verursacht". „AI hat zu 8 % bis 15 % der Win-Rate-Verbesserung beigetragen, basierend auf kontrolliertem Vergleich" ist glaubwürdiger als „AI hat die Win Rate um 11 % verbessert".
Schritt 5: Alle Kosten einschließen. Lizenzgebühr, Oversight-Zeit, Fehlerbehebung, Integrationswartung, Workflow-Redesign, Training -- alles. Präsentieren Sie ein vollständig einkalkuliertes Kostenmodell und einen ehrlich geschätzten Nutzensbereich.
Die Infrastruktur-Investment-Analogie
Einige AI-Investitionen beweisen ROI im traditionellen Sinne nicht. Und das ist eine vertretbare Position.
Cloud-Migration hat keinen sauberen ROI nachgewiesen, als Unternehmen sie durchführten. Das Argument für den Wechsel zu AWS oder Azure war nicht „hier ist die 18-Monats-Amortisationsberechnung". Es war „das ist die Infrastruktur, die das Unternehmen benötigt, um in modernem Maßstab zu operieren". Die meisten Unternehmen tätigten die Investition und fanden Wege, sie als Infrastruktur zu rechtfertigen, nicht als Projekt mit messbarem ROI.
Einige AI-Investitionen gehören in dieselbe Kategorie. „Das ist Infrastruktur, und wir verpflichten uns, ROI bei den Use-Cases zu messen, die sie in den nächsten drei Jahren ermöglicht" ist ehrlich. „Vertrauen Sie uns, das wird sich auszahlen, wir können es nur noch nicht zeigen" ist es nicht.
Ehrlichkeit baut Board-Glaubwürdigkeit auf
Wenn Sie Ihrem Board sagen, dass AI ROI schwer zu beweisen ist, und dann eine rigorose Messmethodik mit angemessenen Vorbehalten zeigen, haben Sie Kompetenz demonstriert. Sie wissen, was Sie nicht wissen. Sie haben sorgfältig über Attribution nachgedacht. Sie haben einen Plan zur Verbesserung der Messung über die Zeit.
Intellektuelle Ehrlichkeit beim AI-ROI-Reporting ist keine Schwäche. Es ist das, was alles andere, was Sie sagen, glaubwürdig macht.
Lesen Sie Die 5 Dimensionen des AI ROI für das vollständige Messframework. Lesen Sie Eingesparte Zeit vs. Umsatzauswirkung für die spezifische Herausforderung, Zeiteinsparungen in einen Business Case umzuwandeln. Lesen Sie Das CFO-Gespräch über das AI-Budget dafür, wie man diese ehrliche Rahmung in eine Budgetverhandlung einbringt. Und sehen Sie sich ROI nach ACE-Fähigkeit an, wie jede ACE-Fähigkeit eine unterschiedliche Messschwierigkeit und einen unterschiedlichen ROI-Zeitplan trägt.
Sie können Ihren AI ROI wahrscheinlich gerade nicht vollständig beweisen. Die meisten Unternehmen in Ihrer Position können das nicht. Das ist kein Grund, aufzuhören zu messen oder aufzuhören zu investieren. Es ist ein Grund, die Messinfrastruktur aufzubauen, die es Ihnen ermöglicht, es -- unvollkommen aber ehrlich -- über die Zeit zu beweisen.

Co-Founder & CMO, Rework
On this page
- Die ehrliche Position des ACE Framework zum AI ROI
- Grund 1: Das Baseline-Problem
- Grund 2: Das Attributionsproblem
- Grund 3: Das Lag-Problem
- Grund 4: Das falsche Kennzahlen-Problem
- Grund 5: Das versteckte Kostenproblem
- Grund 6: Das Problem immaterieller Vorteile
- Grund 7: Confirmation Bias
- Die 7 ROI-Attribution-Gaps
- Das ist der schwierigste Teil der AI-Transformation
- Die 5-Schritte-ROI-Disziplin
- Die Infrastruktur-Investment-Analogie
- Ehrlichkeit baut Board-Glaubwürdigkeit auf