17.05.2026 • 7 Min. Lesezeit

‚Geht das mit KI?' ist die falsche Frage. ‚Lohnt sich das?' ist die richtige.

#KI#ROI#Strategie#FOMO#Vibe Coding

Vor zwei Wochen saß ein Kunde mir gegenüber und fragte ernsthaft:

„Geht das eigentlich, dass ich mir mit KI einen kompletten 3-Monats-Content-Plan schreiben lasse?”

Ich habe ihm wahrheitsgemäß geantwortet: Ja, geht. Wirst du am Ende rausschmeißen, aber technisch geht es.

Und dann habe ich ihm die viel wichtigere Frage zurückgegeben: „Lohnt sich das?”

Diese zwei Wörter – „lohnt sich” – haben sich für mich in den letzten 18 Monaten als der wichtigste Filter herauskristallisiert, um sinnvolle KI-Use-Cases von KI-Theaterstücken zu unterscheiden. Hier ist, warum.

„Geht das?” war 2024. „Lohnt sich das?” ist 2026.

2024 hatten wir alle berechtigterweise einen kollektiven Wow-Moment. Plötzlich ging Sachen, die zwölf Monate vorher noch undenkbar waren. Verträge zusammenfassen. Strategie-Drafts schreiben. Code für eine ganze App in einer Session generieren. Die richtige Frage damals war: „Was geht überhaupt mit KI?”

Diese Frage ist beantwortet. Spoiler: fast alles.

Die Frage, die 2026 zählt, ist eine andere: Ist das, was geht, auch wirklich sinnvoll – für mich, für diesen Use Case, an dieser Stelle, mit diesem Aufwand?

Und an dieser Frage scheitern gerade Reihen über Reihen von KI-Projekten. Mit teilweise erschreckenden Quoten.

Die Failure-Rate-Daten, die niemand zitieren will

MIT hat im August 2025 mit dem NANDA-Report einen kalten Eimer Wasser über die Branche gekippt. Kernbefund: 95 % der generativen KI-Pilotprojekte in Unternehmen scheitern, bringen also keinen messbaren ROI. Die Studie basiert auf 150 Leader-Interviews, 350 Mitarbeiter-Befragungen und 300 ausgewerteten KI-Deployments (Fortune über MIT NANDA).

Gartner kommt auf ähnliche Größenordnungen – mit etwas anderem Schnitt:

Bis Ende 2025 wurden 50 % der GenAI-Projekte nach dem Proof of Concept aufgegeben wegen schlechter Datenqualität, fehlender Risikokontrollen, steigender Kosten oder unklarem Business Value.
Gartner prognostiziert, dass Unternehmen bis Ende 2026 60 % der AI-Projekte aufgeben, die nicht durch AI-ready Data unterstützt sind (Gartner).

Und ITPro hat das ganze noch zugespitzt mit einer Statistik, die meine Diagnose perfekt trifft: 57 % der Unternehmen sagen, sie haben KI hauptsächlich deployed, weil ihre Wettbewerber es getan haben – nicht, weil sie eine Strategie hatten (ITPro). 78 % der Organisationen haben AI-Projekte, die entweder gescheitert sind (35 %) oder im Pilot-Stadium stecken bleiben.

Das ist nicht „die Technik ist noch nicht so weit”. Das ist „wir haben die falsche Frage gestellt”.

Die zwei häufigsten „Geht das?”-Sünden

In meinen Workshops sehe ich vor allem zwei Muster, die exakt diese Failure-Rate produzieren.

Sünde 1: Der 45-Minuten-Prompt für die 5-Minuten-Aufgabe

Menschen optimieren einen Prompt 45 Minuten lang, um eine Aufgabe zu erledigen, die sie selbst in 5 Minuten gemacht hätten. Das ist nicht produktiv. Das ist Beschäftigungstherapie mit Tech-Anstrich.

Der Test, den ich mit Kunden mache: „Stell die Stoppuhr. Wie lange würdest du diese Aufgabe ohne KI brauchen? Wenn die KI-Variante länger dauert, brichst du ab.”

Klingt banal. Ist es nicht – ich sehe Senior-Marketing-Leute, die 30 Minuten an einem LinkedIn-Post-Prompt rumdoktern, den sie selbst in 8 Minuten geschrieben hätten. Das ist „geht das?” ohne „lohnt sich das?”.

Sünde 2: Vibe-Coding für die kostenlose Lösung

Die zweite Sünde ist die teurere. Menschen verbringen Wochen damit, eine eigene Lösung zu vibe-coden, die als fertiges Produkt für 12 € im Monat existiert.

Andrej Karpathy hat den Begriff „Vibe Coding” im Februar 2025 geprägt – im Original-Tweet beschrieb er ihn als: „you fully give in to the vibes, embrace exponentials, and forget that the code even exists” (Karpathy). Die Idee: Du kommunizierst mit der KI, sie schreibt den Code, du schaust nicht mehr hin.

Karpathy selbst hat das inzwischen relativiert. Im November 2025 hat er erklärt, Vibe Coding sei passé – die Zukunft heiße eher „agentic engineering”, mit deutlich mehr Oversight und Code-Review durch den Menschen (The New Stack). Er selbst gibt zu, dass KI-generierter Code oft „bloaty” und „brittle” ist und dass er seine letzten Projekte wieder von Hand geschrieben hat.

Das ist nicht „KI ist schlecht”. Das ist: „Geht das, sich eine eigene Lösung bauen zu lassen?” – ja. „Lohnt sich das vs. ein bestehendes 12-€-Tool?” – fast nie.

Der HBR-Test: Experimentation Trap

Harvard Business Review hat dem Phänomen 2025 sogar einen eigenen Begriff gewidmet: die „AI Experimentation Trap” (HBR).

Die Falle: Unternehmen experimentieren wild herum, häufen Use Cases an, deployen 30, 40, 50 Pilots – und kommen aus dem Experimentier-Modus nie raus. Es fühlt sich nach Fortschritt an („wir machen viel mit KI!”), führt aber zu keinerlei P&L-Effekt.

Der HBR-Befund: Experimentation ist nicht das Gegenteil von Adoption – es ist nur dann produktiv, wenn jedem Experiment ein klares Ja/Nein folgt. „Lohnt sich der Skalierung? Wenn ja: in Produktion. Wenn nein: Stecker ziehen.”

Genau das passiert in 95 % der Fälle eben nicht. Stattdessen läuft Pilot Nummer 17 in derselben Schwebe wie Pilot Nummer 3 – immer mit Hinweis: „ja, geht ja schon irgendwie”.

Die vier Fragen, mit denen ich KI-Use-Cases filtere

Bevor ich heute eine KI-Lösung baue – für mich oder für einen Kunden – stelle ich vier Fragen. Die ersten drei sind „weiche” Filter, die vierte ist der harte FOMO-Test.

1. Spart das Zeit – wirklich, end-to-end? Nicht „die KI macht es in 30 Sekunden”. Sondern: Prompt schreiben + Output prüfen + nacharbeiten + ggf. korrigieren. Wenn die Summe unter der manuellen Variante liegt: weitermachen. Wenn nicht: vergessen.

2. Wird das Ergebnis besser? Manche Sachen werden mit KI gleich gut, aber schneller (legit). Manche werden besser, weil ich mehr Iterationen schaffe (super). Manche werden schlechter, weil ich Kontext verliere (nicht machen).

3. Ist die KI-Lösung robuster oder fragiler als die manuelle? Das ist der unterschätzte Filter. Eine KI-Pipeline, die einmal pro Woche aus unerklärlichen Gründen ausfällt, ist teurer als die manuelle Variante – weil ich jetzt eine Pipeline UND einen Backup-Prozess habe.

4. Mache ich das aus FOMO? Die ehrlichste Frage. Wenn niemand außerhalb meines LinkedIn-Feeds an dieser Lösung interessiert wäre – wenn ich es nur baue, um „mit KI gemacht” sagen zu können – Stecker ziehen.

ITPro’s Daten zeigen genau dafür den Beweis: 57 % der Enterprise-Deployments sind FOMO-getrieben (ITPro). Wer den FOMO-Filter konsequent anlegt, gehört automatisch zu den verbleibenden 43 %. Das ist – statistisch – schon ein Wettbewerbsvorteil.

Was die 5 % gewinner anders machen

Der MIT-NANDA-Report ist nicht nur ein Failure-Bericht. Er nennt auch die 5 %, bei denen es funktioniert. Die Erfolgsfaktoren:

Klare, abgegrenzte Use Cases statt „wir machen jetzt mal KI”.
Spezialisierte Partnerschaften / Vendor-Lösungen (67 % Erfolgsquote) statt „wir bauen das selbst” (~22 %).
Line Manager als Treiber statt nur zentrale AI Labs.
Tools, die tief integrieren statt Standalone-Lösungen, die in keinem Workflow vorkommen.

Das sind keine technischen Faktoren. Das sind Entscheidungs- und Auswahl-Faktoren – exakt das, was die „Lohnt sich das?”-Frage beantwortet.

Drei konkrete Beispiele aus meinem Alltag

Damit das nicht abstrakt bleibt:

„Geht das?” Ja: Mit KI einen Geschäftsbericht zusammenfassen lassen. „Lohnt sich das?” Ja, weil 30 Min vs. 3 Stunden, und das Ergebnis ist robust.
„Geht das?” Ja: Mit KI ein eigenes CRM bauen. „Lohnt sich das?” Nein, weil Pipedrive existiert und ich keine 4 Wochen Bauzeit habe.
„Geht das?” Ja: Mit KI einen LinkedIn-Post in einer Minute schreiben. „Lohnt sich das?” Jein – nur, wenn ich danach 5 Minuten überarbeite. Sonst poste ich Slop.

Du siehst: „Geht das?” ist immer „ja”. Die spannende Antwort steht immer in der zweiten Spalte.

Fazit

KI hat 2026 ein anderes Problem als 2024. Damals wussten wir nicht, was geht. Heute wissen wir es – und die meisten verbrennen jetzt Zeit und Geld daran, dass sie das, was geht, mit dem verwechseln, was sich lohnt.

Der nächste Schritt, wenn du KI in deinem Alltag oder deinem Unternehmen einsetzen willst, ist nicht ein weiterer Prompt-Engineering-Kurs. Es ist eine ehrliche Liste deiner letzten zehn KI-Use-Cases mit dieser einen Frage daneben: Lohnt sich das, oder mache ich das aus FOMO?

Wer die Liste ehrlich beantwortet, gehört in Kürze zu den 5 %, statt zu den 95.

Quellen

Benedikt Backhaus

Experte für KI, Automatisierung und die Zukunft der Arbeit. Ich helfe Unternehmen und Einzelpersonen dabei, die Potenziale neuer Technologien zu nutzen.

Mehr über mich → Termin buchen →

‚Geht das mit KI?' ist die falsche Frage. ‚Lohnt sich das?' ist die richtige.

„Geht das?” war 2024. „Lohnt sich das?” ist 2026.

Die Failure-Rate-Daten, die niemand zitieren will

Die zwei häufigsten „Geht das?”-Sünden

Sünde 1: Der 45-Minuten-Prompt für die 5-Minuten-Aufgabe

Sünde 2: Vibe-Coding für die kostenlose Lösung

Der HBR-Test: Experimentation Trap

Die vier Fragen, mit denen ich KI-Use-Cases filtere

Was die 5 % gewinner anders machen

Drei konkrete Beispiele aus meinem Alltag

Fazit

Quellen

Quellen

Benedikt Backhaus

Das könnte dich auch interessieren

Deloitte: Stell dir vor, KI würde wirklich funktionieren – Warum Enterprise-AI meist scheitert

Mein KI-Workflow-Blueprint in 7 Schritten – wie ich 10 Stunden pro Woche spare

Copy/Paste-Chaos: Wie du mit einem KI-System 10 Stunden pro Woche zurückgewinnst