Stufe 3 zu 4: Von Scaled zu Integrated, Wenn KI zum Betriebsmodell wird

Sie haben KI im Produktionsbetrieb. Mehrere Use Cases. Das Team ist stolz, und das zu Recht. Stufe 3 ist eine echte Errungenschaft, die die meisten Organisationen 2026 noch nicht erreicht haben.
Aber fragen Sie sich: Wenn Sie morgen jedes KI-Tool abschalten würden, wie anders würde Ihr Betriebsmodell aussehen?
Wenn die ehrliche Antwort lautet „Wir würden etwas Effizienz verlieren, aber die Kernworkflows würden unverändert weiterlaufen", befinden Sie sich auf Stufe 3. KI ist eine Schicht darüber. Die Leute erledigen ihre Arbeit auf dieselbe Weise, mit KI-Unterstützung, wenn sie sich dafür entscheiden.
Stufe 4 ist anders. Auf Stufe 4 reduziert das Entfernen der KI nicht nur die Effizienz. Es bricht den Workflow. CRM-Datensätze werden nicht aktualisiert, weil die KI sie aktualisiert; Menschen erledigen diesen Schritt nicht mehr. Risikobewertungen werden nicht produziert, weil die KI sie produziert. Der Prozess wurde um KI herum neu gestaltet, nicht nur durch sie ergänzt.
Das ist eine deutlich schwierigere Sache zu bauen. McKinseys Rewired and Running Ahead-Forschung ergab, dass digitale und KI-Vordenker innerhalb von zwei bis drei Jahren EBIT-Verbesserungen von 10 bis 20% erzielen, aber nur wenn KI an operative KPIs innerhalb eines neu gestalteten Workflows gebunden ist, nicht wenn sie als Produktivitätsschicht über unveränderten Prozessen aufgesetzt wird. Und das ist der Grund, warum der Übergang von Stufe 3 zu Stufe 4 derjenige ist, den die meisten Unternehmen 2026 nicht abschließen werden. Wenn Sie noch auf Stufe 2 sind, beginnen Sie mit Stufe 2 zu 3: Vom Pilot zur Skalierung.
Was Integration tatsächlich bedeutet
Key Facts: Integration von Stufe 3 zu Stufe 4
- McKinseys Rewired and Running Ahead-Forschung ergab, dass digitale und KI-Vordenker innerhalb von zwei bis drei Jahren EBIT-Verbesserungen von 10 bis 20% erzielen, aber nur wenn KI an operative KPIs innerhalb eines neu gestalteten Workflows gebunden ist, nicht als Produktivitätsschicht über unveränderten Prozessen (McKinsey, 2025)
- Gartner prognostiziert, dass über 40% der agentischen KI-Projekte bis Ende 2027 abgebrochen werden, hauptsächlich weil Governance-Frameworks nicht mit dem Bereitstellungsehrgeiz Schritt gehalten haben (Gartner, 2025)
- Gartner stellte auch fest, dass nur 45% der Organisationen mit hohem KI-Reifegrad KI-Projekte drei oder mehr Jahre im Produktionsbetrieb halten, und in Organisationen mit hohem Reifegrad vertrauen 57% der Geschäftsbereiche KI-Lösungen aktiv und nutzen sie, gegenüber 14% in Organisationen mit niedrigem Reifegrad (Gartner, 2025)
Das Wort „Integration" wird locker verwendet. Im KI-Reifegrad-Kontext hat es eine spezifische Bedeutung.
Integration bedeutet, dass KI eine native Komponente eines Kernworkflow-Schritts ist, kein optionales Tool, das darüber gelegt wird.
Hier ist der konkrete Unterschied.
Stufe 3 (Scaled): Jedem neuen Customer Success Manager in Ihrem Unternehmen wird Zugang zu einem KI-Tool gegeben, das ihnen hilft, sich auf Quarterly Business Reviews (QBRs) vorzubereiten. Die meisten nutzen es. Einige nicht. Der QBR-Vorbereitungsprozess existiert noch als definierter Workflow; die KI ist eine Produktivitätsoption darin.
Stufe 4 (Integrated): Der QBR-Vorbereitungsprozess wurde neu gestaltet. Die KI generiert automatisch das QBR-Briefing, zieht aus CRM-Aktivitätsdaten, Support-Tickets, Produktnutzung und früheren Meeting-Notizen, 48 Stunden vor jedem QBR, und legt es in der Warteschlange des CSM ab. Der CSM prüft und bearbeitet; sie schreiben das Briefing nicht mehr selbst. Der alte QBR-Vorbereitungsworkflow existiert nicht mehr.
Der Unterschied liegt nicht in der KI-Fähigkeit selbst. Er liegt darin, ob der menschliche Workflow neu gestaltet wurde, um KI zum Standardpfad zu machen, oder ob KI als Option zu einem unveränderten Workflow hinzugefügt wurde.
Stufe-4-Integration erfordert Ersteres. Das bedeutet, Prozessdokumentation umzuschreiben, Teams umzuschulen, Leistungskennzahlen umzustrukturieren und in einigen Fällen das Organisationsdesign zu ändern. Die meisten Unternehmen unterschätzen das.
„Der Test der Stufe-4-Integration ist einfach: Wenn Sie morgen jedes KI-Tool abschalten würden, würde der Kernworkflow unverändert weiterlaufen oder würde er brechen? Stufe-3-Organisationen würden Effizienz verlieren. Stufe-4-Organisationen würden brechen. Der Unterschied liegt darin, ob der Workflow um KI als native Komponente herum neu gestaltet wurde, oder ob KI an einen Workflow angedockt wurde, der ohne sie noch auf dieselbe Weise läuft." (Rework)
Der Stage 3-to-4 Crossing Test
Eine Drei-Kriterien-Diagnose, die echte Stufe-4-Integration statt fortgeschrittenem Stufe-3-Tool-Layering bestätigt. Kriterium 1 (Workflow-Neugestaltung): mindestens eine Kernfunktion hat ihre Prozessdokumentation neu gestaltet, sodass KI der Standardpfad ist, kein optionales Tool in einem unveränderten Workflow. Kriterium 2 (Bidirektionale API-Integration): Das KI-System liest von operativen Systemen und schreibt auch zurück, ohne dass ein Mensch den Output kopiert und einfügt. Kriterium 3 (Governance-Parität): Audit-Trails, Bias-Monitoring und Incident-Response sind auf das Volumen und die Kritikalität der automatisierten Entscheidungen der KI skaliert. Organisationen, die Kriterium 1, aber nicht Kriterium 2 erfüllen, haben den Workflow auf dem Papier neu gestaltet, ihn aber technisch nicht ermöglicht. Jene, die Kriterien 1 und 2, aber nicht Kriterium 3 erfüllen, sind technisch auf Stufe 4, aber in der Governance auf Stufe 3, was Gartners Forschung als Hauptursache für Abbrüche agentischer KI-Projekte identifiziert.
Die Architekturanforderungen für Stufe 4

Stufe-3-KI läuft auf Anfrage. Ein Nutzer öffnet ein Tool, stellt eine Frage, bekommt eine Antwort. Stufe-4-KI läuft auf Ereignisse. Der Workflow löst die KI automatisch aus, wenn Bedingungen erfüllt sind.
Diese Unterscheidung hat technische Implikationen, die vor Stufe 4 adressiert werden müssen.
Echtzeit-Datenpipelines. Ereignisgesteuerte KI erfordert aktuelle Daten. Wenn die KI ein QBR-Briefing aus CRM-Daten generiert, die 48 Stunden alt sind, kann das Briefing veraltete Account-Informationen enthalten. Stufe 4 erfordert Datenpipelines, die kontinuierlich oder nahezu kontinuierlich aktualisieren, keine nächtlichen Batch-Exporte.
API-Konnektivität zwischen KI und operativen Systemen. Die KI muss in der Lage sein, zurück in die Systeme zu schreiben, aus denen sie liest. Auf Stufe 3 liest KI typischerweise Daten und gibt Output an einen Menschen zurück. Auf Stufe 4 liest KI Daten, produziert Output und schreibt diesen Output in das operative System: den CRM-Datensatz aktualisieren, den Kalendereintrag erstellen, den Bericht einreichen. Bidirektionale API-Integration ist eine architektonische Anforderung. Das ist die Execute-Fähigkeit in voller Tiefe, und es ist der Grund, warum die Generate-vs.-Execute-Grenze auf Stufe 4 zu einer Governance-Anforderung wird.
Orchestrierungsschicht. Mehrere KI-Agenten, die verschiedene Teile eines Workflows handhaben, benötigen Koordination. Welcher Agent läuft zuerst? Was passiert, wenn einer ausfällt? Wie werden Ergebnisse zwischen den Schritten weitergegeben? Das erfordert ein Workflow-Orchestrierungssystem, ob das eine zweckgebaute KI-Orchestrierungsplattform, ein für KI erweitertes bestehendes Workflow-Tool oder Custom-Code ist. Die Wahl spielt weniger eine Rolle als eines zu haben.
Ereignisgesteuerte Auslöser. Der Wechsel von „Nutzer fordert KI an" zu „Ereignis löst KI aus" erfordert einen Event-Bus oder eine Workflow-Automatisierungsschicht, die Bedingungen überwacht (Deal-Phase geändert, Ticket erstellt, Vertrag hochgeladen) und den KI-Workflow automatisch auslöst.
Diese vier Architekturanforderungen sind keine Erweiterungen der Stufe-3-Infrastruktur. Sie stellen einen bedeutsamen Schritt in der technischen Komplexität dar. Unternehmen, die versuchen, Stufe 4 ohne ihre Berücksichtigung zu erreichen, werden feststellen, dass ihre KI-Workflows fragil, unzuverlässig und teuer in der Fehlersuche sind.
Die organisatorischen Anforderungen
Stufe 4 ist nicht nur eine architektonische Herausforderung. Es ist eine organisatorische. Und die organisatorischen Anforderungen sind schwieriger zu lösen als die technischen.
Funktionsübergreifende Ausrichtung zwischen KI-Team und Geschäftsbereichen. Auf Stufe 3 baut das KI-Team Dinge und liefert sie an Geschäftsbereiche. Auf Stufe 4 ist KI-Entwicklung eine gemeinsame Funktion. Das CSM-Führungsteam ko-gestaltet den QBR-Briefing-Workflow mit dem KI-Team. Es definiert, welche Datenquellen wichtig sind, welches Output-Format funktioniert, welcher menschliche Prüfschritt benötigt wird. Ohne diese gemeinsame Eigentümerschaft produziert die KI technisch funktionale Workflows, denen Geschäftsbereiche nicht vertrauen oder die sie nicht nutzen.
KI-Verantwortlichkeit in der Führungslinie verankert. Auf Stufe 4 ist der VP of Customer Success für den KI-gestützten QBR-Prozess verantwortlich, nicht nur für die Leistung des CSM-Teams. Das bedeutet, dass Funktionsleiter ausreichende KI-Kompetenz benötigen, um KI-gestützte Workflows zu besitzen. Sie müssen nicht die Modellarchitektur verstehen. Sie müssen die Inputs, Outputs, Ausfallmodi und Prüfanforderungen der KI-Systeme in ihrer Funktion verstehen.
Leistungskennzahlen, die KI-Beiträge einschließen. Wenn Sie CSM-Leistung nur an Ergebnissen messen (Kundenbindung, NPS, Expansion) ohne zu verfolgen, wie KI beiträgt, können Sie nicht diagnostizieren, was funktioniert. Stufe-4-Organisationen verfolgen KI-Nutzung, KI-Output-Qualität und die Korrelation zwischen KI-Workflow-Nutzung und Geschäftsergebnissen als operative Kennzahlen.
Umschulung im Maßstab. Wenn Workflows um KI herum neu gestaltet werden, ändert sich die Arbeit. Ein CSM, der früher 30% seiner Zeit mit QBR-Vorbereitung verbrachte, verbringt diese Zeit jetzt mit höherwertiger Beziehungsarbeit. Dieser Übergang erfordert strukturierte Unterstützung: neue Rollenklarheit, aktualisierte Stellenbeschreibungen und aktives Management des Mindshift von „Ich schreibe das Briefing" zu „Ich prüfe und verbessere das Briefing".
Das Governance-Upgrade für Stufe 4
Auf Stufe 3 läuft KI im Produktionsbetrieb über mehrere Use Cases hinweg. Auf Stufe 4 trifft KI folgenreiche Entscheidungen im Maßstab, automatisch, ohne menschliche Prüfung bei jeder Transaktion. Die Governance-Anforderungen sind qualitativ unterschiedlich.
Audit-Trail-Anforderungen werden institutionell. Jede Execute-Aktion, die von KI durchgeführt wird, muss in einer Weise protokolliert werden, die von Compliance-Teams, Rechtsberatern oder Regulatoren prüfbar ist. Das ist kein Nice-to-have. In regulierten Branchen ist es eine rechtliche Anforderung. Und selbst in unregulierten Branchen ist die Fähigkeit, nachzuvollziehen, was die KI getan hat und warum, die Grundlage der Incident-Untersuchung.
Bias-Monitoring. Wenn KI folgenreiche Entscheidungen im Maßstab trifft (Lead-Scoring, Kreditentscheidungen, Einstellungsscreenings, Ressourcenzuteilung), kann systematischer Bias Ergebnisse produzieren, die im Maßstab unfair oder diskriminierend sind. Stufe-4-Organisationen führen regelmäßige Bias-Audits bei hochriskanten Entscheidungs-Outputs durch. Nicht einmal beim Launch. Mindestens vierteljährlich.
Incident-Response wird eine formale Funktion. Auf Stufe 3 handhabt der AI-Operations-Lead Vorfälle. Auf Stufe 4 erfordert das Volumen und die Kritikalität potenzieller Vorfälle eine formale Incident-Response-Funktion mit definierten SLAs, Eskalationspfaden und Post-Incident-Review-Prozessen. Das ist ähnlich wie ausgereifte SaaS-Organisationen ihre Produktions-Engineering-Incident-Response betreiben, angewendet auf KI-Systeme.
Anbieter-Governance. Auf Stufe 4 haben Sie wahrscheinlich mehrere KI-Anbieterbeziehungen, jede mit ihren eigenen Datenverarbeitungsbedingungen, Modell-Update-Kadenzen und Ablaufplänen. Anbieter-Governance bedeutet, zu verfolgen, welche Modelle in welchen Workflows verwendet werden, Anbieterankündigungen zu überwachen auf Änderungen, die Ihre Workflows beeinflussen, und die vertraglichen Beziehungen (DPAs, Enterprise-Verträge) zu pflegen, die die Produktionsnutzung autorisieren.
Integrations-Misserfolgsarten

Stufe-4-Übergänge scheitern auf drei charakteristische Weisen.
Über-Integration. Entscheidungen automatisieren, die menschliches Urteilsvermögen erfordern. Ein häufiges Beispiel: die Eskalationsentscheidung für einen hochriskanten Kundenaccount automatisieren. Die KI kann Risikowarnzeichen kennzeichnen; Menschen sollten die Eskalationsentscheidung treffen. Wenn KI folgenreiche Entscheidungen trifft, die Kontext, Beziehungswissen oder ethisches Urteilsvermögen erfordern, schafft die Integration Risiko statt Wert. Die Regel: die Datenbeschaffung und -synthese automatisieren. Menschen in der Entscheidung behalten für alles mit erheblichen Folgen.
Unter-Integration. Das ist häufiger. Organisationen setzen KI ein, um bestehende Workflows zu verbessern, gestalten diese Workflows aber nie neu. Der KI-Entwurf der E-Mail sitzt im CRM neben der alten E-Mail-Vorlage. Reps wählen zwischen ihnen. Einige nutzen die KI. Einige nicht. Die Akzeptanz bleibt unter 60%. Geschäftsergebnisse verbessern sich leicht. Die Organisation kommt zu dem Schluss, dass „KI ganz okay funktioniert" und erkennt nie, dass eine vollständige Workflow-Neugestaltung die 3-fache Wirkung erzeugen würde. Unter-Integration ist das Stufe-3-Plateau, das sich als Stufe 4 verkleidet.
Governance-Lag. Integration überholt die Richtlinie. Die KI läuft in 15 Workflows und trifft täglich Tausende von automatisierten Entscheidungen, während die Governance-Infrastruktur noch für eine 3-Use-Case-Stufe-3-Bereitstellung ausgelegt ist. Audit-Trails sind unvollständig. Bias-Monitoring wurde nicht eingerichtet. Incident-Response ist noch eine Person. Gartner-Forschung ergab, dass über 40% der agentischen KI-Projekte bis Ende 2027 abgebrochen werden, hauptsächlich weil Governance-Frameworks nicht mit dem Bereitstellungsehrgeiz Schritt gehalten haben. Governance-Lag ist, wie Stufe-4-Organisationen die ernstesten KI-Vorfälle produzieren: nicht weil die Technologie versagt hat, sondern weil die Aufsichtsinfrastruktur nicht dem Bereitstellungsmaßstab entsprechend aufgebaut wurde.
Rework-Analyse: Der Übergang von Stufe 3 zu Stufe 4 scheitert konsistent nicht auf der Technologieebene, sondern auf der Organisationsebene. Die Architektur kann aufgebaut werden. Was die meisten Unternehmen unterschätzen, ist die Workflow-Neugestaltungsanforderung: jede Funktion, die auf Stufe 4 KI integriert, muss ihre Prozessdokumentation umgeschrieben, ihre Leistungskennzahlen neu kalibriert und ihre Manager umgeschult haben, um KI-gestützte Workflows zu besitzen statt nur KI-Tools zu nutzen. Ein 500-köpfiges Unternehmen, das Stufe-4-Integration über drei Funktionen gleichzeitig versucht, unterschätzt die Change-Management-Anforderungen typischerweise um 6 bis 12 Monate. Die Organisationen, die am schnellsten dorthin gelangen, integrieren eine Funktion vollständig, bevor sie die nächste starten, und nutzen die Lektionen aus Funktion 1, um Funktionen 2 und 3 zu beschleunigen.
Wie Stufe-4-Führung aussieht
Stufe 4 erfordert dedizierte KI-Führung auf der Führungsebene.
CIO oder CAIO-Rolle. Der CIO bei einem Stufe-4-Unternehmen hat KI-Integration als primäre Verantwortlichkeit, nicht als sekundäre. In einigen Organisationen trägt eine dedizierte CAIO-Rolle dies. In beiden Fällen gibt es eine namentlich genannte Führungskraft, die das KI-Betriebsmodell besitzt, dem Aufsichtsrat über KI-Risiko und -Leistung berichtet und die KI-Strategie gemeinsam mit Geschäftsbereichsleitern besitzt.
Funktionsübergreifender KI-Rat. Ein ständiges Gremium mit Vertretung aus jeder wichtigen Funktion (Sales, Customer Success, Product, Legal, Finance, Human Resources), das neue KI-Workflow-Vorschläge prüft, Integrationsleistung überwacht und Governance-Fragen eskaliert. Kein einmaliger Lenkungsausschuss. Ein permanenter Betriebsmechanismus.
Berichterstattung auf Board-Ebene. KI-Risiko, KI-Leistung und KI-Investitionen sind Board-Tagesordnungspunkte auf Stufe 4. Der Aufsichtsrat muss das Risikoexposure KI-integrierter Workflows, den ROI der KI-Investition und die Wettbewerbsimplikationen der KI-Strategie verstehen. Das ist eine Governance-Reife-Anforderung, keine bloße Transparenzfreundlichkeit.
Ein realistischer Zeitplan
Die meisten Mittelstandsunternehmen sind 2026 auf Stufe 1 oder Stufe 2. Eine gut geführte Organisation, die die Stufen korrekt durchläuft, könnte Ende 2026 oder 2027 Stufe 3 erreichen. Stufe 4 für die meisten Mittelstandsunternehmen ist frühestens ein Ziel für 2028 bis 2029.
Das ist kein Pessimismus. Es ist Realität. Stufe 4 erfordert Organisationsdesign, nicht nur Technologie-Deployment. Organisationsdesign bei einem 500- bis 1.000-köpfigen Unternehmen braucht Zeit, besonders wenn es die Umschulung von Hunderten von Mitarbeitern auf neu gestaltete Workflows beinhaltet.
Die Unternehmen, die Stufe 4 am schnellsten erreichen, sind nicht jene, die gehetzt haben. Sie sind jene, die in Stufe-2-Governance und Stufe-3-Infrastruktur korrekt investiert haben, sodass Stufe 4 eine Evolution war und kein Neuaufbau.
Ein 1.000-köpfiges SaaS-Unternehmen bietet ein nützliches Beispiel. Sie erreichten Stufe 3 Mitte 2025, mit KI im Produktionsbetrieb in Sales Ops, Support und Content Operations. 2026 gestalteten sie ihren Customer-Success-Workflow so um, dass jeder CSM standardmäßig KI-vorbereitete QBR-Briefings verwendet, KI Churn-Risikowarnzeichen kennzeichnet und KI Expansionsvorschläge entwirft. Der QBR-Vorbereitungsschritt steht auf keiner Aufgabenliste eines CSM mehr. Das ist Stufe 4 in der CS-Funktion, auch wenn Sales und Product auf Stufe 3 bleiben. Das ist in Ordnung. Stufe 4 erfordert nicht, dass jede Funktion gleichzeitig integriert. Es erfordert, dass mindestens eine Funktion den Übergang abschließt.
Was als Nächstes kommt
Sobald eine Funktion Stufe 4 erreicht, verlagert sich die Frage von „Wie integrieren wir KI in unsere Abläufe?" zu „Sollte KI verändern, was unser Produkt oder unsere Dienstleistung ist?" Das ist Stufe 5, und es ist eine andere Art von Entscheidung.
Lesen: Stufe 5: Wenn KI Ihr Produkt neu gestaltet, um zu verstehen, was das höchste Reifegrad-Level tatsächlich erfordert und wer realistisch dahin gelangt.
Lesen: Die 5 Stufen der KI-Reife für das vollständige Reifegradmodell mit Übergängen zwischen jeder Stufe.
Lesen: Audit-Trails für KI-Execute-Aktionen für die Governance-Infrastruktur, die Stufe 4 erfordert, bevor Sie Execute-fähige KI-Workflows skalieren.
Siehe auch:
- KI-Patterns in einer mehrjährigen Roadmap sequenzieren: wie Sie priorisieren, welche Workflows zuerst auf Stufe 4 integriert werden sollen
- Warum die meisten KI-Transformationen scheitern: die hier beschriebene Governance-Lag-Misserfolgsart in voller Ausführung
- Wie KI das SaaS-Betriebsmodell neu gestaltet: eine SaaS-spezifische Perspektive auf Stufe-4-Integration

Co-Founder & CMO, Rework