Google testet „Denk-Modus“ für Gemini Live
20.01.2026 - 14:24:12Google bereitet eine Revolution für seine Sprachassistenten vor: Ein neuer „Denk-Modus“ soll Gemini Live zu komplexen, logischen Gesprächen befähigen. Die Funktion, die in einer Beta-Version entdeckt wurde, signalisiert einen strategischen Schwenk weg von schnellen Antworten hin zu durchdachten Dialogen.
Vom Schnellschuss zum gründlichen Denker
Die Tech-Branche setzt seit Jahren auf blitzschnelle Sprachantworten. Google will diesen Standard nun brechen. Wie Analysen des Beta-Codes der Google-App zeigen, arbeitet das Unternehmen an einem „Live Thinking Mode“. Die Beschreibung verspricht: Der Assistent wird sich „Zeit zum Nachdenken nehmen und detailliertere Antworten geben“.
Dieser Ansatz kopiert erfolgreiche „Chain-of-Thought“-Modelle aus textbasierten KI-Systemen. Für die Echtzeit-Sprachverarbeitung ist er jedoch eine technische Meisterleistung. Nutzer könnten künftig nicht nur Timer stellen, sondern komplexe Aufgaben stellen: „Plane einen Dreigänge-Menüplan für sechs Personen, berücksichtige dabei eine Laktoseintoleranz und eine Vegetarierin.“
Warum 73% der deutschen Unternehmen auf Cyberangriffe nicht vorbereitet sind – und was das für smarte Assistenten wie Gemini bedeutet. Unser kostenloses E‑Book erklärt, welche neuen Angriffsvektoren KI‑Agenten, visuelle Wahrnehmung und App‑Steuerung eröffnen, und liefert eine sofort umsetzbare 4‑Schritte‑Strategie zum Schutz Ihrer Systeme. Enthalten sind Praxisbeispiele, Checklisten und Hinweise zu gesetzlichen Anforderungen. Jetzt kostenlosen Cyber‑Security‑Guide herunterladen
Gemini 3 als heimlicher Treiber
Hinter der neuen Denkfähigkeit steckt vermutlich eine leistungsstärkere KI. Aktuell läuft Gemini Live auf dem effizienten, aber limitierten Gemini 2.5 Flash-Modell. Die Code-Hinweise deuten stark darauf hin, dass der „Thinking Mode“ die Rechenkraft des noch unveröffentlichten Gemini 3 nutzen wird.
Dieser Wechsel würde echtes „System-2-Denken“ ermöglichen – ein Begriff aus der Kognitionswissenschaft für langsame, logische und abwägende Prozesse. Für Google wäre es der direkte Sprung seines fortschrittlichsten Modells in eine Alltagsanwendung.
Sehen, erinnern, handeln: Der Weg zum universellen Agenten
Die Beta-Enthüllungen gehen weit über das reine Denken hinaus. Eine ganze Suite experimenteller „Live“-Features zeichnet das Bild eines universellen Assistenten:
- Multimodaler Speicher: Gemini soll sich Kontext über verschiedene Interaktionen hinweg merken – ob besprochene Details oder zuvor geteilte Bilder.
- Visuelle Wahrnehmung: Die KI könnte „reagieren, wenn sie etwas sieht“. Diese Funktion ist ein direkter Abkömmling von Project Astra, Googles Vision eines Echtzeit-KI-Agenten, der die Welt durch die Smartphone-Kamera versteht.
- UI-Steuerung: Code-Hinweise auf „UI Control“ lassen erahnen, dass Gemini künftig andere Apps bedienen könnte, um Aufgaben komplett abzuschließen.
Zusammen ergibt sich das Szenario eines handlungsfähigen Assistenten. Nutzer könnten sagen: „Such mir einen Flug nach Berlin unter 600 Euro, der mich Freitag vor Mittag dort hinbringt, und trag ihn in meinen Kalender ein.“ Gemini würde die Suche logisch durchführen und die Buchung eigenständig vornehmen.
Die Latenz-Frage: Warten für bessere Qualität?
Die entscheidende Frage ist: Werden Nutzer die Pausen akzeptieren? Experten sind zuversichtlich. In Bildung und Beruf hat sich gezeigt: Lieber einige Sekunden auf eine korrekte, durchdachte Antwort warten, als sofort eine halluzinierte oder oberflächliche zu erhalten. Die verbesserte Rauschunterdrückung in der Beta soll zudem störungsfreie Gespräche auch in lauter Umgebung sichern.
Die Features sind aktuell noch hinter Experimentier-Flags versteckt. Ihre Existenz im „Labs“-Bereich deutet auf einen baldigen Test mit freiwilligen Nutzern und eine mögliche allgemeine Veröffentlichung in naher Zukunft hin. Das Zeitalter des simplen Sprachassistenten neigt sich dem Ende zu – es macht Platz für eine KI, die sich Zeit zum Denken nimmt.
PS: Sie planen, KI‑Funktionen in Produkten zu nutzen oder arbeiten mit Sprachassistenten? Dieses Gratis‑E‑Book zeigt, wie Sie IT‑Sicherheit stärken, ohne teure neue Mitarbeiter einzustellen, und welche Schutzmaßnahmen bei multimodalen Assistenten wie Gemini besonders wichtig sind. Mit konkreten Checklisten, Praxisbeispielen und Hinweisen zu relevanten KI‑Regeln – ideal für CTOs und Produktmanager. Gratis E‑Book: Cyber‑Security Awareness herunterladen


