17.05.2026 • 6 Min. Lesezeit

Lass deine KI Rückfragen stellen: Wie 326.000 analysierte Sales-Calls dein Prompting verbessern

Eine Frage, die mich seit Wochen umtreibt: Wie viele Rückfragen sind eigentlich optimal? Nicht in deinem Sales-Call. Bei deiner KI.

Bei Calls weiß die Forschung schon ziemlich genau, wo der Hebel sitzt. Bei KI wissen es ehrlich gesagt die wenigsten – obwohl die Mechanik fast identisch ist. Genau darüber will ich hier schreiben.

Was 326.000 analysierte Sales-Calls zeigen

Das CRM- und Conversation-Intelligence-Unternehmen Gong hat in einer ihrer berühmtesten Auswertungen 326.000 B2B-Sales-Calls durch ihre Analyse-Engine laufen lassen, um herauszufinden, welche Gesprächsmuster mit Abschlüssen korrelieren. Ergebnis (verkürzt): Wer Deals gewann, stellte im Schnitt 15 bis 16 Fragen pro Call. Wer verlor, stellte um die 20 – aber im Interrogations-Modus: hastig, vorne im Gespräch geballt, ohne Pause.

In einer zweiten, größeren Studie hat Gong 519.000 Discovery-Calls auseinandergenommen und einen noch konkreteren Sweet Spot identifiziert: 11 bis 14 gezielte Fragen in der Discovery führen zur höchsten Abschlussquote. Wer mit 6 oder weniger Fragen ins Gespräch geht (was, bitter genug, der SaaS-Durchschnitt ist), schließt signifikant schlechter ab.

Die in vielen Coaching-Threads kursierende plakative Zuspitzung „6 Fragen = 46 % Close, 11–14 Fragen = 74 %” entspringt einer Aufbereitung dieser Studien durch HireDNA und andere Sales-Coaches. Die exakten Closing-Prozentzahlen schwanken je nach Aufschlüsselung – die Kernaussage ist aber konsistent über mehrere Auswertungen: Mehr (richtig platzierte) Fragen korrelieren stark mit besseren Outcomes.

Caveat aus Forscher-Perspektive: Das ist eine Korrelation, kein bewiesener kausaler Effekt. Top-Verkäufer stellen vielleicht mehr Fragen, weil sie schon erkannt haben, dass dieser Lead trägt. Das ändert aber wenig am praktischen Take-away.

Warum das bei KI exakt gleich läuft

Jetzt der spannende Sprung: Bei deiner KI gilt erstaunlich genau dasselbe Muster.

Wenn du in ein Chat-Fenster reinschreibst „Schreib mir bitte einen LinkedIn-Post über mein neues Projekt” – was bekommst du? Generischen Output, der nach KI klingt, weil das Modell zwanzig fehlende Kontextfragen automatisch plausibel gefüllt hat. Es hat geraten. Aus dem Mittelwert seiner Trainingsdaten.

Wenn du stattdessen schreibst: „Bevor du antwortest, stell mir bitte 5 Fragen zu Kontext, Zielgruppe und Aufgabe” – wird etwas anderes passieren. Das Modell wird dich fragen, was du eigentlich sagen willst. Wer das lesen soll. Welchen Tone of Voice. Welche Konkretisierung. Welches Format.

Und dein Output am Ende ist messbar besser.

Das ist kein Mystik-Trick. Es ist die KI-Variante derselben Mechanik, die in Gongs Daten sichtbar wird: Wer mehr Klarheit aus dem Kontext zieht, bevor er antwortet, liefert besseren Output.

Self-Ask: das Paper, das diesen Mechanismus formalisiert hat

In der Forschung gibt es dafür einen Namen. Ofir Press und Kollegen haben 2022 das Paper Measuring and Narrowing the Compositionality Gap in Language Models (arXiv 2210.03350) veröffentlicht, in dem sie eine Prompting-Technik namens Self-Ask vorstellen.

Die Idee: Bei mehrstufigen Fragen sollen LLMs sich vor der finalen Antwort selbst Zwischenfragen stellen – und beantworten. Press konnte zeigen, dass die Compositionality Gap (also der Bereich, in dem das Modell zwar alle Einzelfakten weiß, aber sie nicht zur richtigen Endantwort komponieren kann) mit Self-Ask deutlich kleiner wird. Skalieren des Modells alleine half nicht. Das Zwischenfragen-Stellen half.

In der Praxis kannst du das Self-Ask-Prinzip auch ohne formales Paper-Setup anwenden. Du gibst dem Modell explizit den Auftrag: „Stell dir vor der Antwort drei eigene Klärungsfragen, beantworte sie kurz, und beantworte dann die Hauptaufgabe.” Output: Tiefer, strukturierter, mit weniger Halluzinations-Sprüngen.

Anthropic empfiehlt das offiziell

Was viele übersehen: Anthropic selbst gibt in seinem Prompt Engineering Guide und in den Claude 4 Best Practices eine fast wortgleiche Empfehlung. Sinngemäß: Wenn die Aufgabe komplex ist oder Kontext fehlen könnte, formuliere deinen Prompt so, dass Claude 1–2 zentrale Rückfragen sofort stellen darf, bevor er anfängt zu arbeiten. Plus den Hinweis, ob du Dokumente hochladen solltest.

Das ist keine Workaround-Folklore. Das ist die offizielle Empfehlung des Anbieters – und sie steht da, weil ihre eigenen internen Auswertungen zeigen, dass Ergebnisse so messbar besser werden.

Meine eigene Praxis: bis zu 100 Fragen

Ich habe mir angewöhnt, bei längeren oder wichtigen Aufgaben einen Standardsatz in meinen Prompt zu legen, der ungefähr so lautet:

„Bevor du beginnst: Stell mir alle Fragen, die für eine wirklich gute Antwort notwendig sind. Erst Kontextfragen, dann Zielfragen, dann Format- und Stilfragen. Du darfst gerne bis zu 100 Fragen stellen – ich werde sie beantworten. Erst danach gehst du in die Aufgabe.”

Klingt absurd. Funktioniert hervorragend.

Praktisch bekomme ich meist 8–20 Fragen, manchmal 30. Selten habe ich es ausgereizt. Aber die Erlaubnis, so viele zu stellen wie nötig, befreit das Modell aus dem trainierten Default „bloß keine Zeit verschwenden, gleich liefern”. Genau dieser Default ist es, der den durchschnittlichen Output produziert, den wir alle aus den schlechten ChatGPT-Posts kennen.

Wichtig dabei: Ich beantworte die Fragen wirklich. Nicht mit „weiß nicht”. Wenn ich eine Frage nicht beantworten kann, ist das eine wertvolle Information – meistens heißt es, dass ich selbst noch nicht klar genug bin. Dann lohnt sich oft, zuerst die Klarheit zu finden und dann erst zu generieren.

Drei konkrete Prompts zum Klauen

Für jede längere Aufgabe:

„Bevor du startest, stell mir 5–10 gezielte Rückfragen zu Kontext, Zielgruppe und Format. Erst nach meinen Antworten beginnst du.”

Für strategische Themen:

„Stelle dir vor der Antwort selbst drei Klärungsfragen, beantworte sie kurz aus dem Kontext, und gehe dann in die finale Antwort. Mach den Self-Ask-Schritt für mich sichtbar.”

Für kritisches Feedback:

„Frag mich vor der Bewertung, welches Erfolgskriterium ich anlege, gegen welchen Vergleichsmaßstab, und in welchem Schmerz-Punkt ich gerade stehe. Erst dann gibst du dein Feedback.”

Alle drei kosten dich 30 Sekunden mehr Tipparbeit. Alle drei verändern die Qualität deines Outputs in einer Größenordnung, die du im Bauch sofort merkst.

Was ich mitnehme

Gong sagt: Top-Verkäufer fragen mehr. Press sagt: LLMs werden besser, wenn sie sich selbst Zwischenfragen stellen. Anthropic sagt: Lasst Claude Rückfragen stellen, dann werden Ergebnisse besser.

Drei sehr unterschiedliche Quellen, dieselbe Pointe: Fragen vor Antworten.

Das Lustige ist – diese Erkenntnis ist nicht neu. Sokrates wusste das. Jeder gute Coach weiß das. Jede Therapeutin weiß das. Es ist eine der ältesten Wahrheiten der Wissensarbeit.

Was neu ist: Du kannst sie jetzt mit deinem Chat-Fenster verhandeln. Und damit dein gesamtes Niveau in der Zusammenarbeit mit KI nach oben ziehen, ohne ein einziges neues Tool zu lernen.

Probier es heute aus. Beim nächsten ernsthaften Prompt. Lass die KI fragen. Du wirst nicht zurückwollen.

Quellen

Benedikt Backhaus

Experte für KI, Automatisierung und die Zukunft der Arbeit. Ich helfe Unternehmen und Einzelpersonen dabei, die Potenziale neuer Technologien zu nutzen.

Mehr über mich → Termin buchen →

Lass deine KI Rückfragen stellen: Wie 326.000 analysierte Sales-Calls dein Prompting verbessern

Was 326.000 analysierte Sales-Calls zeigen

Warum das bei KI exakt gleich läuft

Self-Ask: das Paper, das diesen Mechanismus formalisiert hat

Anthropic empfiehlt das offiziell

Meine eigene Praxis: bis zu 100 Fragen

Drei konkrete Prompts zum Klauen

Was ich mitnehme

Quellen

Quellen

Benedikt Backhaus

Das könnte dich auch interessieren

Du nutzt 80 % deines ChatGPT-Potenzials nicht – So änderst du das mit dem richtigen Workflow

5 Kostenlose Tipps für ChatGPT – Direkt vom ChatGPT-Chef höchstpersönlich

Prompts sind tot. Skills sind das neue Primitiv.