Google investiert sehr viel Zeit und Ressourcen in die Entwicklung von Gemini, das innerhalb kürzester Zeit in sehr viele Produkte eingezogen ist. Jetzt hat man den nächsten Schritt für das darunterliegende KI-Modell angekündigt, das in der Version 1.5 die unterstützte Medienwelt um Audio erweitert. Gemini 1.5 ist jetzt etwas breiter verfügbar und kann sowohl mit Text als auch Audio und Video umgehen.



Google hat die Gemini-KI in sehr viele Produkte integriert, wobei neben der einzelnen Verfügbarkeit des KI-ChatBots vor allem das Workspace-Paket zu nennen wäre, das erst gestern um das neue Google Vids erweitert wurde. Vor einigen Wochen hat man ein Update für den Unterbau angekündigt, das nun in einer öffentlichen Beta für App-Entwickler verfügbar ist. Bisher wurde Gemini Pro 1.5, das deutlich leistungsfähiger ist als das aktuelle Gemini Ultra, nur für interne Zwecke genutzt. Und „deutlich“ heißt in diesem Fall „extrem“. Google selbst spricht von „dramatischen Verbesserungen“.

Gemini 1.5 Pro ist 35x leistungsfähiger als Gemini 1.0 und stellt nach Googles offiziellen Angaben vor allem den großen Konkurrenten ChatGPT bei weitem in den Schatten (siehe das unten eingebundene Video). Das hat man allerdings schon mehrfach behauptet und plötzlich liegt Gemini 1.0 im Vergleichsvideo wieder hinter ChatGPT. Es ist eben immer eine Frage der Formulierung und Betrachtungsweise. Dennoch soll das den großen Schritt von Gemini 1.5 Pro nicht schmälern.

Nach Googles Angaben ist Gemini 1.5 Pro durch diesen großen Schritt in etwa so leistungsfähig wie das kostenpflichtige Gemini 1.0 Ultra. Für das Ultra-Paket zahlen die Nutzer immerhin 21,99 Euro pro Monat, sodass Google hoffentlich sehr bald auch das Ultra-Modell auf diese Version aktualisiert und dementsprechend wieder größere Schritte macht.









Die Leistungsdaten von Gemini 1.5 Pro

kann eine Stunde Video verarbeiten

kann 11 Stunden Audio verarbeiten

kann 30.000 Codezeilen verarbeiten

kann 700.000 Wörter verarbeiten

Gemini 1.5 Pro wear zuerst für ausgesuchte Entwickler mit einer Höhe von zehn Million Tokens (Datenpunkten) angeboten worden und jetzt öffnet man es in der Public Preview für alle Entwickler. Standardmäßig kann Gemini Pro schon jetzt mit 1.000.000 Tokens arbeiten – statt zuvor nur 32.000. Es ist zu erwarten, dass sich das bei diesem Entwicklungstempo schon bald ebenfalls ändern und die neue Version für viele Entwickler und den Gemini-ChatBot geöffnet wird.

Wir dürfen gespannt sein, ob Google dieses hohe Tempo beibehält. Falls ja, sollten wir rund um die schon bald anzukündigende Google I/O wohl Gemini 2.0 erhalten oder vielleicht das Ultra- und das Nano-Modell ebenfalls auf 1.5 bringen. Wir werden weiter beobachten, wie Google die Weiterentwicklung der einzelnen Editionen angeht.

