Es vergeht kaum ein Tag, an dem Googles KI-Modell Gemini und dessen Ableger sowie verbundenen Funktionen keinen Fortschritt machen – manchmal größer und manchmal geht es eher in die Details. Aber es gibt auch viele bedeutende Schritte und jetzt blicken die Entwickler einmal auf die wichtigsten Neuerungen der letzten Monate in Bezug auf die Pixel-Smartphones zurück. Vom neuen KI-Modell über die Multimodalität bis zur aufgeräumten Oberfläche.



Vor genau sechs Monaten hat Google die ersten Pixel-Smartphones mit integriertem Gemini vorgestellt, die Rede ist natürlich von den Pixel 9-Smartphones und deren starken KI-Fokus. Die allermeisten Funktionen sind parallel oder nur knapp zeitversetzt auch auf anderen Pixel-Smartphones oder Android-Smartphones gestartet. Dennoch blickt man jetzt anlässlich dessen noch einmal zurück, was sich seit damals bei Gemini getan hat. Es ging ordentlich voran beim KI-Modell.

Neue KI-Modelle

Der für das erste Halbjahr 2025 wichtigste Schritt wurde schon im Dezember 2024 vorbereitet, nämlich der Release von Gemini 2.0. Die Meilenstein-Version schafft die Grundlage für viele Verbesserungen und neue Dienste, denn die Kapazitäten wurden deutlich erhöht und die Möglichkeiten stark ausgebaut. So stellt man jetzt die KI-Agenten in den Mittelpunkt, setzt noch stärker als bisher auf Multimodalität und mehr.

Die neue Version steht mit den KI-Modellen Gemini 2.0 Flash für Gratisnutzer, Gemini 2.0 Flash Thinking und natürlich auch Gemini 2.0 Pro zur Verfügung. Flash Thinking richtet sich an Nutzer, die Anleitungen mit mehreren Schritten benötigen und wer das kostenpflichtige Pro-Modell verwendet, darf sich auf hervorragende Fähigkeiten rund um die Codierung, Mathematik und andere komplexe Anfragen freuen.

Neue multimodale Fähigkeiten

Erst im vergangenen Monat hat Gemini Live starke multimodale Fähigkeiten erhalten, die die Grundlage für kommende Entwicklungen legen. Nämlich die Live-Auswertung von Audio, Bildern und Videos. Das wird derzeit nur auf dem Smartphone für das Livegespräch mit Gemini genutzt, soll aber auch auf den kommenden smarten Brillen zum Einsatz kommen und die Umgebung sowie den Tagesablauf des Nutzers ständig beobachten, auswerten und hilfreiche Informationen liefern.

Dank der multimodalen Fähigkeiten von Gemini Live können innerhalb der Gespräche Bilder, Dateien und YouTube-Videos ausgewertet werden, um entsprechenden Kontext zu bieten. Ihr könnt beispielsweise ein Foto von einer Pflanze machen und euch mit Gemini Live darüber unterhalten, ob sie in eurem Garten überlebt und wann ihr sie pflanzen solltet. Oder ihr könnt auf ein Koch-Lernvideo auf YouTube verlinken und Gemini bitten, dieses zu erklären, wie das Rezept verbessert werden kann.

Gemini Deep Research

Mit Gemini Deep Research ist erst vor wenigen Tagen ein ganz neues KI-Modell gestartet, das es Advanced-Nutzern auch am Smartphone ermöglicht, tiefe Analysen durchzuführen. Es verwendet Gemini-Modelle, um Dutzende von Websites zu durchsuchen und komplexe Themen zu erkunden, wobei die Ergebnisse in leicht verständlichen Berichten bereitgestellt werden. Nutzer können Deep Research bitten, Hypothekenzinsen in verschiedenen Städten zu vergleichen oder Ihnen bei der Entscheidung zu helfen, welches Auto Sie kaufen sollten. Die Berichte enthalten Quellenlinks und es lassen sich jederzeit weitere Fragen stellen.

Gemini auf dem Sperrbildschirm

Gemini lässt sich auch auf dem Android-Sperrbildschirm nutzen, so wie das beim Google Assistant schon über viele Jahre der Fall gewesen ist. Jetzt hat man den Funktionsumfang ausgebaut und kann noch mehr Fragen beantworten oder gar Aufgaben ausführen, ohne dass das Smartphone dafür entsperrt werden muss.

Neue Gemini-Erweiterungen

In den letzten sechs Monaten hat Gemini die Fähigkeiten durch viele neue Erweiterungen ausgebaut. Dazu gehören etwa die Google Home-Erweiterung, der Zugriff auf persönliche Kontakte, die Verwendung der Telefon- und Messaging-Apps sowie die Werkzeug-Erweiterung zu Smartphone-Steuerung. Die Liste der verfügbaren Erweiterungen umfasst Apps wie Google Kalender, Google Tasks, Spotify und vieles mehr.

Aufgeräumtes Gemini-Overlay

Die Oberflächen von Gemini wurden aufgeräumt und sowohl innerhalb der App als auch in Gemini Live und in der Overlay-Variante deutlich entschlackt. Die optimierten Oberflächen sollen mehr Übersicht bringen, ein intuitives Layout umsetzen und den vollen Fokus auf die Konversation mit dem KI-ChatBot legen.

