Stufe 1 zu 2: Von Ad-hoc zum Pilot, Der häufigste KI-Stockungspunkt

Ihr Team nutzt KI bereits. ChatGPT, Copilot, Gemini, Perplexity, vielleicht ein Dutzend andere. Niemand weiß genau welche. Es gibt keine Richtlinie. Es gibt keine Budgetlinie. Einiges läuft über private Accounts. Andere nutzen kostenlose Tiers. Und Sie haben keine Ahnung, was funktioniert, was das Unternehmen Risiken aussetzt, oder ob irgendetwas davon das Geschäft voranbringt. Das ist Stufe 1.
Es ist auch der Stand der meisten Unternehmen im Jahr 2026. McKinsey-Forschung ergab, dass nur 11% der Unternehmen Gen AI im Maßstab eingeführt haben, und fast zwei Drittel sind über einige Piloten nicht hinausgekommen. Sie sind nicht im Rückstand. Sie sind in der Mehrheit.
Der Übergang von Stufe 1 zu Stufe 2 ist nicht glamourös. Er beinhaltet nicht den Kauf einer neuen Plattform oder die Ankündigung einer KI-Initiative beim All-Hands-Meeting. Er beinhaltet eine einzige bewusste Entscheidung: einen Use Case auswählen, einen Eigentümer benennen, definieren, wie Erfolg aussieht, und ihn messen. Das ist es.
Aber genau diesen Schritt überspringen die meisten Unternehmen. Stattdessen kündigen sie weitere Piloten an, gründen eine Arbeitsgruppe oder warten weiter auf die „richtige" KI-Strategie. Das Ergebnis ist Stufe-1-Drift: Das Shadow-AI-Problem wächst, Compliance-Risiken häufen sich an, und 12 Monate später fragt der Aufsichtsrat, was das Unternehmen tatsächlich getan hat.
Dieser Artikel gibt Ihnen das konkrete Playbook für den Übergang.
Wie Stufe 1 tatsächlich aussieht
Key Facts: Die Stufe-1-Realität
- 78% der Wissensarbeiter nutzen persönliche KI-Tools am Arbeitsplatz ohne ausdrückliche Genehmigung des Arbeitgebers, und die meisten Organisationen wissen nicht, welche Tools in ihrer Belegschaft im Einsatz sind (Microsoft Work Trend Index, 2024)
- 60% der KI-Projekte ohne KI-bereite Daten werden bis 2026 aufgegeben, was das Datenbereitschafts-Audit zur wirksamsten Maßnahme auf Stufe 1 macht, bevor ein Pilot gestartet wird (Gartner, 2025)
- Nur 11% der Unternehmen haben generative KI im Maßstab eingeführt; fast zwei Drittel sind über einige Piloten nicht hinausgekommen, was den Übergang von Stufe 1 zu Stufe 2 zum häufigsten Stockungspunkt in der Unternehmens-KI macht (McKinsey, 2025)
Bevor Sie Stufe 1 verlassen können, müssen Sie erkennen, dass Sie sich darin befinden. Hier sind die diagnostischen Anzeichen.
Individuelle Tool-Nutzung ohne Inventar. Mitarbeiter verwenden KI-Tools, die Sie nicht genehmigt haben, einige, von denen Sie nicht einmal wissen, dass sie existieren. Einige zahlen aus eigener Tasche. Andere nutzen kostenlose Tiers. Niemanden wurde gesagt, es nicht zu tun, weil es keine Richtlinie gibt.
Keine formelle Budgetlinie für KI. Jegliche KI-Ausgaben sind in individuellen Spesenberichten, Software-Abonnements oder Abteilungsbudgets vergraben, die es nicht als KI bezeichnen. Der CFO kann Ihnen nicht sagen, was das Unternehmen für KI ausgibt.
IT und Legal sind besorgt, aber nicht handlungsbefähigt. IT hat von Daten gehört, die in ChatGPT eingefügt wurden. Legal hat eine vage Sorge wegen IP. Aber keines der Teams hat die Autorität, das Mandat oder die Richtlinien, um bis jetzt etwas dagegen zu tun.
Keine ROI-Daten. Einzelne Mitarbeiter werden Ihnen sagen, dass KI „Zeit spart", aber niemand kann quantifizieren, wie viel, oder es an Geschäftsergebnisse knüpfen. Die Produktivitätsgewinne sind anekdotisch.
Konkurrierende Tool-Abonnements. Mehrere Teams evaluieren oder nutzen leicht verschiedene Tools für dasselbe Problem. Sales prüft ein KI-Sales-Tool. Marketing hat sich gerade für ein anderes angemeldet. Sie sprechen nicht miteinander.
Keine Sicherheitsüberprüfung von KI-Tools. Anbieter wurden nicht durch den Standard-Beschaffungs-Sicherheits-Review geführt, der für Ihre anderen SaaS-Lösungen gilt. Sie haben einfach eine Mitarbeiter-Kreditkarte erhalten.
Wenn drei oder mehr dieser Punkte zutreffen, befinden Sie sich auf Stufe 1. Das ist in Ordnung. Die meisten Unternehmen 2026 sind es. Aber es ist kein stabiler Zustand.
Warum Stufe 1 sowohl normal als auch riskant ist
Stufe 1 ist kein Versagen. Es ist die Art und Weise, wie KI in jede Organisation einzieht. Mitarbeiter experimentieren, bevor die Führungsebene einen Rahmen hat. Das ist anfangs tatsächlich gesund. Das Problem ist, dort zu bleiben.
Das Risiko akkumuliert sich entlang dreier Dimensionen. Und das Risiko ist real: Gartner stellte fest, dass Organisationen 60% der KI-Projekte aufgeben werden, die nicht durch KI-bereite Daten gestützt werden, was bedeutet, dass Stufe-1-Unternehmen, die Governance und Datenarbeit überspringen, teure Misserfolge vorbereiten.
Datenexposure. Mitarbeiter fügen Inhalte in öffentliche KI-Tools ein, ohne zu wissen, ob diese Inhalte sensibel sind. Kundendaten, Finanzprojektionen, Vertragsentwürfe, interne Strategiedokumente. Jedes Einfügen ist eine potenzielle Datenexponierung. Ohne eine Richtlinie, die definiert, was in KI-Tools eingehen darf und was nicht, lautet der Standard „Alles geht hinein."
IP- und Compliance-Risiko. Wenn ein Mitarbeiter KI nutzt, um Inhalte, Code oder Analysen zu generieren, haben Fragen zur IP-Eigentümerschaft, Voreingenommenheit und regulatorischen Compliance keine vom Unternehmen sanktionierte Antwort. Der Mitarbeiter hat allein gehandelt. Das Unternehmen haftet.
Opportunitätskosten. Je mehr Teams ohne Koordination experimentieren, desto weniger organisationales Lernen akkumuliert sich. Jedes Team erfindet dieselben Prompts neu. Niemand teilt, was funktioniert. Das Unternehmen zahlt für KI-Aufwand, ohne KI-Wert zu erhalten.
Die gute Nachricht ist, dass Sie nicht all das lösen müssen, um zu Stufe 2 zu wechseln. Sie müssen genug lösen, um einen strukturierten Pilot möglich zu machen.
Stufe-2-Ausgangskriterien
Stufe 2 ist kein Ziel. Es ist ein neues Fundament. Hier sind die drei Anforderungen, um sich als Stufe-2-Organisation zu bezeichnen.
| Anforderung | Was es bedeutet | Was es nicht bedeutet |
|---|---|---|
| KI-Richtlinie existiert | Eine schriftliche Richtlinie zu akzeptabler Nutzung, Datenbeschränkungen und Genehmigungsprozess, mit allen Mitarbeitern geteilt | Eine perfekte, umfassende, rechtlich geprüfte Richtlinie. Ein funktionierender Entwurf reicht. |
| Mindestens ein definierter Pilot mit einem namentlich genannten Eigentümer | Ein Use Case mit einer Hypothese, einer Erfolgskennzahl, einer Zeitbegrenzung und einer für Ergebnisse verantwortlichen Person | Mehrere parallel laufende Piloten ohne Verantwortlichkeit oder Messung |
| Baseline-Messung vor Pilotbeginn | Sie kennen den aktuellen Stand: aufgewendete Stunden, entstandene Kosten oder Qualitätsniveau, bevor KI etwas verändert | Nachträgliche Rationalisierung von Ergebnissen |
Alle drei müssen zutreffen. Wenn Sie eine Richtlinie, aber keinen Pilot haben, befinden Sie sich auf Stufe 1 mit besserer Governance. Wenn Sie einen Pilot, aber keine Richtlinie haben, befinden Sie sich auf Stufe 1 mit besserer Experimentierfreudigkeit. Stufe 2 erfordert beides.
Wie Sie den ersten Pilot auswählen

Die Use-Case-Auswahl ist der Punkt, an dem die meisten Übergänge von Stufe 1 zu Stufe 2 scheitern. Teams wählen entweder den aufregendsten Use Case (kundenzugewandt, höchste Sichtbarkeit, schwerste Datenprobleme) oder sie lassen die lauteste Abteilung die Wahl treffen. Keiner der Ansätze funktioniert.
Das richtige Framework hat drei Filter. Wenden Sie diese der Reihe nach an.
Filter 1: Datenbereitschaft. Fragen Sie sich, bevor Sie einen Use Case auswählen, ob Sie saubere, zugängliche, richtlinienkonforme Daten haben, um ihn zu unterstützen. Datenbereitschaft ist der häufigste stille Killer von KI-Piloten. Ein Use Case mit großem Geschäftsappeal, aber schlechter Datenbereitschaft wird scheitern. Ein Use Case mit geringerem Appeal, aber starken Daten, wird Ihnen etwas Echtes lehren. Beginnen Sie mit den Daten, die Sie haben, nicht mit den Daten, die Sie sich wünschen.
Filter 2: Risikoprofil. Vermeiden Sie für Ihren ersten Pilot kundenzugewandte Execute-Fähigkeiten. Execute-Aktionen haben direkte, sichtbare Konsequenzen: gesendete E-Mails, aktualisierte Datensätze, geänderte Deals, gelieferte Antworten. Wenn im Pilot etwas schiefläuft, möchten Sie, dass die Auswirkung intern bleibt. Bewerten Sie jeden Use Case auf einer einfachen Risikoskala: niedrig (nur intern, Menschen prüfen Outputs), mittel (kundenzugewandt, KI entwirft, aber Mensch sendet), hoch (vollständig automatisierte Kundeninteraktion). Wählen Sie einen risikoarmen Use Case für Pilot 1.
Filter 3: Impact-Potenzial. Wählen Sie unter den risikoarmen, datenbereiten Optionen jene mit dem klarsten Geschäftsimpact: eingesparte Stunden, verbesserte Konversionsrate, reduzierte Fehlerquote. Das muss nicht riesig sein. Es muss messbar sein.
Ein konkretes Beispiel. Ein 50-köpfiges SaaS-Unternehmen wendet dieses Framework an und findet drei Kandidaten: (1) KI-gestütztes Lead-Scoring mit CRM-Daten, (2) KI-generierte Erstentwürfe für Outbound-E-Mail-Sequenzen für Sales Development Reps und (3) KI-gestützte Kategorisierung und Weiterleitung von Support-Tickets.
Lead-Scoring (Option 1) scheitert an Filter 1. Das CRM hat für 40% der Datensätze unvollständige Daten. Option 3 scheitert an Filter 2 für ihre Risikobereitschaft, da sie Kundenreaktionen berührt. Option 2 besteht alle drei Filter. Ihr CRM und E-Mail-System haben saubere Daten. Es ist intern auf das SDR-Team beschränkt. Und sie können Antwortrate und Anzahl gebuchter Meetings direkt messen. Pilot 1 ist KI-generierte SDR-E-Mail-Sequenzen.
Das ist das gesamte Auswahlframework.
Den Pilot-Charter aufbauen

Sobald Sie den Use Case ausgewählt haben, formalisieren Sie ihn. Der Pilot-Charter muss nicht lang sein. Er muss existieren.
Ein Stufe-2-Pilot-Charter hat fünf Elemente:
1. Die Hypothese. Formulieren Sie, was Sie glauben, was passieren wird und warum. „Wir glauben, dass KI-gestützte SDR-E-Mails die Antwortrate um 15% steigern werden, weil unsere Reps 40% ihrer Prospecting-Zeit mit E-Mail-Personalisierung verbringen, die KI schneller erledigen kann."
2. Die Erfolgskennzahl. Eine primäre Kennzahl. Nicht fünf. Eine. Für das SDR-Beispiel: Antwortrate auf KI-gestützte Sequenzen versus Kontrollgruppen-Sequenzen über 60 Tage.
3. Die Baseline-Messung. Der aktuelle Stand, gemessen bevor der Pilot startet. Wenn Sie vorher nicht messen, können Sie nachher nichts beweisen. Holen Sie die aktuellen Antwortraten-Daten, bevor Sie etwas verändern.
4. Die Zeitbegrenzung. Piloten ohne Enddatum laufen ewig. Setzen Sie 60 oder 90 Tage. Am Ende entscheiden Sie: skalieren, verlängern oder einstellen. Alle drei Ergebnisse sind valide. Auf unbestimmte Zeit laufen ist es nicht.
5. Der namentlich genannte Eigentümer. Eine Person ist für die Pilot-Ergebnisse verantwortlich. Keine Arbeitsgruppe. Keine Kommission. Eine Person, die am Ende der Zeitbegrenzung Ergebnisse präsentiert.
Wenn Sie nicht alle fünf Punkte ausfüllen können, sind Sie nicht bereit, den Pilot zu starten.
„Der Übergang von Stufe 1 zu Stufe 2 erfordert genau eine Sache: einen Pilot mit einer Hypothese, einer messbaren Baseline und einem namentlich genannten Eigentümer. Kein Strategie-Deck, keine Governance-Kommission, kein Enterprise-KI-Plattform-Vertrag. Ein abgegrenztes, messbares Experiment. Das ist die gesamte Anforderung." (Rework)
Der Stage 1-to-2 Crossing Test
Eine Vier-Fragen-Diagnose, die bestätigt, dass eine Organisation tatsächlich von Stufe 1 zu Stufe 2 übergegangen ist, anstatt ihre Stufe-1-Aktivitäten neu zu etikettieren. Frage 1: Existiert eine schriftliche KI-Nutzungsrichtlinie, und haben alle Mitarbeiter den Erhalt bestätigt? Frage 2: Gibt es genau einen namentlich genannten Pilot mit einer dokumentierten Hypothese und Erfolgskennzahl? Frage 3: Wurde die Baseline-Messung vor Pilotbeginn erfasst? Frage 4: Hat der Pilot einen namentlich genannten Eigentümer und ein definiertes Enddatum? Wenn eine Antwort „Nein" lautet, befindet sich die Organisation noch auf Stufe 1. Der Crossing Test ist bewusst streng: Es ist einfach, Stufe-2-Status basierend auf Aktivität zu beanspruchen. Der Crossing Test misst Governance und Struktur, nicht Aktivitätsvolumen.
Minimum Viable Governance für Stufe 2
Ihre KI-Richtlinie auf Stufe 2 muss kein 40-seitiges Rechtsdokument sein. Sie muss fünf Dinge abdecken.
Liste genehmigter Tools. Die spezifischen KI-Tools, die Mitarbeiter verwenden dürfen, mit den Bedingungen, unter denen sie erlaubt sind. Beginnen Sie mit dem, was die Leute bereits verwenden, und machen Sie das offiziell. Fügen Sie Genehmigungskriterien für neue Tools hinzu.
Datenbeschränkungen. Welche Datenkategorien ohne ausdrückliche Genehmigung nicht in externe KI-Tools eingegeben werden dürfen. Mindestanforderung: personenbezogene Daten (PII) von Kunden, Finanzprojektionen, fusionsbezogene Inhalte und vertrauliche Verträge. Diese einzige Entscheidung eliminiert den Großteil des Compliance-Risikos auf Stufe 1.
Prozess für neue Tool-Anfragen. Wie ein Mitarbeiter die Genehmigung für ein neues KI-Tool bekommt. Halten Sie es schlank: ein Formular, ein namentlich genannter Prüfer (IT oder Legal) und eine 5-Werktage-Bearbeitungszeit. Das Ziel ist nicht, die Einführung zu blockieren. Es ist, eine Aufzeichnung zu erstellen.
Störfallmeldung. Was Mitarbeiter tun sollen, wenn ein KI-Tool etwas falsch macht: falscher Output an einen Kunden gesendet, versehentlich exponierte Daten, Modell produziert diskriminierenden Inhalt. Schon ein einfaches „E-Mail an [Name] sofort" schafft Verantwortlichkeit.
Verbotszonen. Spezifische Entscheidungen, die KI nicht ohne menschliche Prüfung treffen darf. Regulierte Entscheidungen (Kredit, Einstellung, Medizin) sind das Minimum. Fügen Sie alles Spezifische für Ihre Branche hinzu.
Diese Richtlinie braucht keine rechtliche Freigabe, um nützlich zu sein. Sie muss existieren und geteilt werden. Sie verfeinern sie, während Sie lernen.
KI-Nutzungsrichtlinie aufbauen deckt dies in voller Detail mit abschnittweiser Anleitung ab.
Der Datenbereitschafts-Check vor der Verpflichtung
Die meisten Stufe-1-Unternehmen sind überrascht, wie unbereit ihre Daten für KI-Piloten sind. Führen Sie vor der Festlegung auf einen Use Case ein Fünf-Fragen-Audit durch.
- Können Sie auf die Daten zugreifen, die die KI heute benötigen würde, ohne ein mehrvöchiges IT-Projekt?
- Sind die Schlüsselfelder mindestens zu 70% befüllt, oder gibt es erhebliche Lücken?
- Sind die Daten aktuell genug, um die aktuelle Geschäftssituation widerzuspiegeln?
- Gibt es eine maßgebliche Quelle, oder konkurrierende Systeme mit widersprüchlichen Datensätzen?
- Hat Legal oder Security diese Datenkategorie für die Verwendung in externen KI-Tools freigegeben?
Wenn Sie zwei oder mehr Fragen mit „Nein" oder „Ich weiß nicht" beantworten, hat der Use Case eine Datenbereitschaftsabhängigkeit, die als Pilot-Misserfolg auftreten wird. Entweder beheben Sie die Daten zuerst oder wählen Sie einen anderen Use Case.
Häufige Misserfolgsarten beim Übergang von Stufe 1 zu Stufe 2
Misserfolgsart 1: Den falschen ersten Pilot wählen. Der sichtbarste, aufregendste Use Case ist fast nie der richtige erste Pilot. Kundenzugewandt, hohes Risiko, datenarm. Wählen Sie langweilig und messbar über aufregend und komplex.
Misserfolgsart 2: Die Baseline überspringen. „Wir werden den ROI nach dem Pilot herausfinden" produziert Argumente, keine Belege. Messen Sie immer, bevor Sie etwas verändern. Wenn Sie vergessen haben, vorher zu messen, und der Pilot läuft bereits, halten Sie an und messen Sie jetzt. Jede Baseline ist besser als keine.
Misserfolgsart 3: Richtlinien-Paralyse. Manche Organisationen versuchen, die perfekte KI-Richtlinie zu schreiben, bevor sie einen Pilot starten. Sie konsultieren Legal, IT, Compliance, HR. Die Richtlinienprüfung dauert sechs Monate. Währenddessen expandiert Shadow AI. Ein funktionierender Entwurf mit bekannten Lücken schlägt eine perfekte Richtlinie, die noch nicht existiert.
Misserfolgsart 4: Zu viele Piloten. „Wir sollten fünf Piloten parallel laufen, um schneller zu lernen." Nein. Fünf Piloten ohne einzelne Eigentümer, ohne Kontrollgruppen und ohne gemeinsame Infrastruktur produzieren fünf nicht schlüssige Datenpunkte. Ein gut geführter Pilot mit ordentlicher Messung produziert eine echte Antwort.
Misserfolgsart 5: Die Kennzahl während des Pilots ändern. Wenn der Pilot nicht die erhofften Ergebnisse produziert, ist die Versuchung, die Kennzahlen zu wechseln. Nicht tun. Die Kennzahl ist im Charter festgelegt. Wenn der Pilot nach der ursprünglichen Kennzahl scheitert, ist das nützliche Information. „Die KI-E-Mail-Sequenzen haben die Antwortrate nicht verbessert" ist ein echtes Ergebnis. Eine andere Kennzahl während des Laufs zu verfolgen, um einen scheiternden Pilot zu retten, produziert irreführende Daten.
Wie sich Stufe 2 tatsächlich anfühlt
Eine Stufe-2-Organisation hat eine irgendwo gepostete Richtlinie (gemeinsames Laufwerk, Unternehmenshandbuch), einen Pilot mit Charter und Eigentümer, ein Startdatum, einen geplanten Bericht und eine Baseline-Messung auf Datei. Das ist wirklich alles.
Es fühlt sich nicht wie eine Transformation an. Es fühlt sich wie ein kleines Projekt an, das korrekt verwaltet wird. Das ist der Punkt.
Die Transformation geschieht, weil dieser einzelne, gut geführte Pilot echte Daten produziert, die den Fall für Stufe 3 aufbauen. Unternehmen, die zu Stufe 3 sprinten, ohne Stufe-2-Fundament, finden sich mit mehreren KI-Tools, keiner gemeinsamen Infrastruktur und keinen Belegen, dass irgendetwas davon funktioniert. Sie haben Stufe-3-Komplexität auf einem Stufe-1-Datenfundament aufgebaut.
Rework-Analyse: Basierend auf Unternehmens-KI-Übergangsmuster beträgt die mediane Zeit zum Abschließen des Stage 1-to-2 Crossing Test für ein Mittelstandsunternehmen 8 bis 14 Wochen, wenn der CEO das Mandat gesetzt hat. Die häufigste Ursache für Verzögerungen ist die Baseline-Messanforderung: Teams, die feststellen, dass sie die Vor-Pilot-Kennzahl nicht einfach abrufen können, erkennen, dass sie ein Datenbereitschaftsproblem haben, das vor dem Pilotstart behoben werden muss. Diese Verzögerung ist tatsächlich wertvoll. Sie legt die Datenlücke frei, bevor sie den Pilot tötet, nicht danach.
Stufe 2 ist unspektakulär. Tun Sie es trotzdem.
Was als Nächstes kommt
Sobald Ihr erster Pilot abgeschlossen ist und Sie die Skalieren/Verlängern/Einstellen-Entscheidung getroffen haben, sind Sie bereit, über den Wechsel vom Pilot zur Produktion nachzudenken. Dieser Übergang (zu Stufe 3) hat seine eigenen Anforderungen, Infrastrukturentscheidungen und Misserfolgsarten. Der nächste Schritt ist der schwierigste in der gesamten Reifegradkurve.
Lesen: Stufe 2 zu 3: Vom Pilot zur Skalierung für die Checkliste zur Produktionsbereitstellung und Infrastrukturanforderungen.
Lesen: Die 5 Stufen der KI-Reife, um zu sehen, wo dieser Übergang in das vollständige Reifegradmodell passt.
Und wenn Sie sich fragen, ob Ihre Transformation Bestand haben wird: Warum die meisten KI-Transformationen scheitern deckt die strukturellen Gründe ab, warum die meisten Organisationen zwischen den Stufen stagnieren.
Siehe auch:
- Die 18-monatige CEO-KI-Agenda: wie Phase 1 (Bewertung und Governance) dem Übergang von Stufe 1 zu Stufe 2 entspricht
- Das ACE Framework: das Fähigkeitsvokabular, das Ihr Pilot-Charter verwenden sollte, wenn die KI-Aufgabe definiert wird

Co-Founder & CMO, Rework
On this page
- Wie Stufe 1 tatsächlich aussieht
- Warum Stufe 1 sowohl normal als auch riskant ist
- Stufe-2-Ausgangskriterien
- Wie Sie den ersten Pilot auswählen
- Den Pilot-Charter aufbauen
- Der Stage 1-to-2 Crossing Test
- Minimum Viable Governance für Stufe 2
- Der Datenbereitschafts-Check vor der Verpflichtung
- Häufige Misserfolgsarten beim Übergang von Stufe 1 zu Stufe 2
- Wie sich Stufe 2 tatsächlich anfühlt
- Was als Nächstes kommt