Gemini 2.0: Google startet das Zeitalter der KI-Agenten – Videos zeigen die neuen Möglichkeiten des KI-Modells

Es vergeht kaum eine Woche, in der Googles KI-Plattform Gemini keine Fortschritte macht und dennoch gibt es immer wieder größere Meldungen, die aus der Masse an kleinen Schritten hervorstechen. Eine davon ist das vor wenigen Tagen für erste Nutzer gestartete Gemini 2.0 – die nächste Evolutionsstufe für den ChatBot und das KI-Modell. Mit diesem startet man offiziell in die Ära der KI-Agenten, die sowohl die Interaktion als auch die Multimodalität erweitern sollen.

Erst Mitte Dezember hat Google das neue Gemini 2.0 vorgestellt und vor wenigen Tagen fiel der Startschuss für erste Nutzer. Nachdem es vorab schon eine Art first-look mit der Flash-Version gegeben hat, ist in dieser Woche Gemini 2.0 offiziell gestartet. Zumindest für all die Nutzer, die über ein kostenpflichtiges Gemini Advanced-Abo verfügen. An der Oberfläche wird sich Gemini 2.0 nicht bemerkbar machen, denn der Fortschritt liegt beim KI-Modell unter der Haube. Erst im weiteren Verlauf der Version wird es neue Anwendungsmöglichkeiten geben.
Wenig überraschend handelt es sich bei der zweiten Generation um das bisher leistungsfähigste Modell, das die Multimodalität weiter steigern soll. Das Erstellen von Bildern und Audio ist grundsätzlich seit der ersten Version von Gemini nativ integriert, genauso wie das Erkennen und Auswerten dieser Inhalte. Jetzt geht man den Weg weiter, dass Gemini keine Unterschiede zwischen Text, Bild, Video oder Audio macht, was das reine Verständnis angeht.
Zum Start von Gemini 2.0 zeigt man einige neue KI-Agenten, die schon sehr bald eine große Rolle spielen sollen. Derzeit bietet man sie nur für interne Tester an, zeigt sie nun aber in den unten eingebundenen Videos. Das schon vor gut einem halben Jahr erstmals vorgestellte Project Astra ist auch wieder mit an Bord und soll den Nutzern dabei helfen, den Alltag mit vielen digitalen Helferlein zu bewältigen. Auch diesmal ist übrigens wieder eine smarte Brille zu sehen, die erneut nicht konkret angesprochen wird. Schaut euch einmal die folgenden Videos an.
Die neuen Gemini-Agenten
Neben dem Project Astra zur smarten Bilderkennung auf Basis einer Brille stechen auch die Projekte Imagen 3 und Veo 2 hervor, die dazu in der Lage sind, Bilder und Videos zu erzeugen. Beide sollen qualitativ sowohl eigenständig als auch durch das verbesserte Gemini-Modell nachgelegt haben. Eine weitere große Rolle könnte das ebenfalls gezeigte Projekt Mariner zur KI-Steuerung von Google Chrome spielen, das derzeit allerdings nur für interne Tester angeboten wird.
Ein weiterer Agent soll Entwickler bei der Erstellung von Spielen helfen oder Fehler im Code aufspüren. Ein anderer konzentriert sich auf den stärkeren Ausbau der KI-Bilderstellung. Wie ihr sehen könnt, wird es mittelfristig für viele Aufgabenbereiche eigene Agenten geben. Agenten sind wohl die neuen Apps. In den nächsten Tagen und Wochen werden wir sie euch sicherlich noch etwas ausführlicher vorstellen können, wenn Google sie den ersten Nutzern in der Breite anbietet.
Letzte Aktualisierung am 2025-01-18 / Bilder von der Amazon Product Advertising API / Affiliate Links, vielen Dank für eure Unterstützung!
GoogleWatchBlog bei Google News abonnieren | GoogleWatchBlog-Newsletter