Gemini 2.0 ist da! Google startet das Zeitalter der KI-Agenten jetzt als Flash- und Pro Experimental-Varianten

Google gibt rund um das KI-Modell Gemini weiter Vollgas und veröffentlicht nun wieder zwei neue Versionen, die für viele Nutzer zugänglich sind. Nach dem Start von Gemini 2.0 Flash in der vergangenen Woche, gibt es jetzt die neuen Modelle Gemini 2.0 Flash Thinking Experimental sowie Gemini 2.0 Pro Experimental. Beide basieren auf der im Dezember vorgestellten neuesten Generation und sollen zusätzliche Möglichkeiten bzw. neue Herangehensweisen bringen.

Erst in der vergangenen Woche hat Google Gemini 2.0 Flash für alle Nutzer gestartet und jetzt bringt man die zweite Major-Version des KI-Modells in weiteren Versionen für viele Nutzer: Das Flash-Modell richtet sich an alle Nutzer der kostenlosen Variante und soll eine solide Basis für alle Aufgaben bieten. Mit dem neuen Gemini 2.0 Flash Thinking Experimental setzt man das fort, will aber noch mehr darauf bauen, komplexere Antworten zu geben. Also eine Mischung aus schnell und umfangreich – und wie der Name schon sagt, noch im experimentellen Modus.
Das zweite neue Modell ist Gemini 2.0 Pro Experimental, wobei es sich um das Pro-Modell handelt, das nur für zahlende Gemini Advanced-Nutzer zugänglich ist. Das Advanced-Paket wiederum ist ein Teil von Google One AI Premium bzw. allen Google One-Tarifen ab 5 Teraybte Speicherplatz. Der Schwerpunkt liegt auf höchster Leistung mit komplexen Fragen, Antworten, dem Zugang zu erweiterten modalen Modellen und bietet das derzeit in der breiten Masse umfangreichste Paket.
Die Highlights vom darunterliegenden Gemini 2.0 sind aber nicht nur diese üblichen Verbesserungen im Bereich der Performance und Qualität, sondern liegen in den Grundlagen für zukünftige multimodale Features und die KI-Agenten. Denn mit Gemini 2.0 startet das „Zeitalter der KI-Agenten“, die für Advanced-Nutzer bald noch umfangreicher nutzbar sein sollen. Die KI-Agenten schaffen die Möglichkeit, Gemini in die unterschiedlichsten Rollen schlüpfen zu lassen und somit Experten für verschiedene Bereiche zu stellen.
Viele Beobachter sind sich darin einig, dass den KI-Agenten die Zukunft gehört – aber nicht nur ihnen, sondern auch den multimodalen Modellen: Gemini behandelt Text, Bild, Video, Audio und Co bekanntlich vollwertig gleich und kann sowohl bei der Eingabe als auch der Ausgabe mit beiden umgehen. Gemini 2.0 schafft die Grundlage für die neuen beeindruckenden Generatoren Imagen 3 für Bild und Veo 2 für Video – wir haben euch beide bereits ausführlich vorgestellt.
GoogleWatchBlog bei Google News abonnieren | GoogleWatchBlog-Newsletter