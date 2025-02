Google hat kürzlich das neue Gemini 2.0 veröffentlicht, das als bisher leistungsfähigstes KI-Modell an den Start geht und große Herausforderungen meistern soll. Die Pläne sind alles andere als bescheiden, und dementsprechend haben die Entwickler schon jetzt groß aufgefahren. Hier findet ihr eine schnelle Übersicht über die Leistungen von Gemini 2.0 sowie dessen Erweiterungen Imagen, Veo und Whisk.



Mit dem neuen KI-Modell Gemini 2.0 hat Google nicht nur die nächste Generation veröffentlicht, sondern auch die Basis für alle wichtigen KI-Produkte im ersten und vielleicht auch zweiten Halbjahr. Man wirft nicht nur mit immer mehr Tokens und Leistungen um sich, sondern auch mit gesteigerten Fähigkeiten, mit denen man sowohl technisch als auch in puncto Reichweite noch in diesem Jahr die Marktführerschaft übernehmen will. Hier findet ihr einen schnellen Überblick über die Stärken.

Gemini 2.0 KI-Modell

Mit dem Start von Gemini 2.0 hat Google offiziell die „Ära der KI-Agenten“ ausgerufen, denn die Multimodalität von Gemini bezieht sich nicht nur auf die medialen Fähigkeiten, sondern auch auf die Positionierung des KI-Modells. Die KI-Agenten sind schon heute ein wichtiger Bestandteil der Gemini-Oberfläche und werden es in den nächsten Monaten mit Sicherheit noch sehr viel stärker werden. Vor allem die Integration in die Google-Produkte wird man wohl mit KI-Agenten vorantreiben.

» Alle Infos zu Gemini 2.0

Imagen 3 Bildgenerator

Der Bildgenerator Imagen ist schon sehr viel älter als der KI-Hype, aber erst seit der zweiten und jetzt mit der dritten Generation kann dieser wirklich mithalten. Google hat nach eigenen Angaben an vielen Stellschrauben gedreht und konnte die Qualität der ausgelieferten Bilder deutlich erhöhen – unter anderem durch ein verbessertes Verständnis des Inhalts, eine optimierte Komposition der Bilder, einen höheren Realismus und noch mehr Möglichkeiten zur Festlegung einer einheitlichen Stilrichtung. Wir zeigen euch im folgenden Artikel viele Beispielfotos.

» Alle Infos zu Imagen 3









Veo 2 Videogenerator

Der Videogenerator Veo 2 ist das Bewegtbild-Pendant zu Imagen, denn hier geht es darum, ganze Videos per Künstlicher Intelligenz zu erschaffen. Diese haben bisher nur eine Länge von wenigen Sekunden und kommen qualitativ nicht immer an den Bildgenerator heran, aber mit der zweiten Generation hat man sehr große Fortschritte gemacht. Plötzlich auftauchende Fragmente, unnatürliche Bewegungen oder physikalisch unmögliche Darstellungen sollen durch ein deutlich verbessertes Verständnis weitestgehend der Vergangenheit angehören. Schaut euch die Beispiele einmal an.

» Alle Infos zu Veo 2

Whisk Bildmanipulation

Mit Whisk hat Google ein Tool zur Bildmanipulation veröffentlicht, das zwar selbst nicht viele Fähigkeiten bietet, aber den Weg für die zukünftige KI-Nutzung aufzeigt. Whisk erkennt Bilder, zerlegt diese in einen langen Prompt und kann aus diesem durch weitere Nutzerwünsche anschließend ein neues Bild erstellen. Man könnte es als grafische Oberfläche für die KI-Kommandozeile beschreiben. Alles noch experimentell, aber der Weg scheint dadurch bereitet.

» So funktioniert Whisk

—

Gemini 2.0 wird uns noch längere Zeit begleiten, denn Google hat das KI-Modell erst vor wenigen Tagen für viele Nutzer des ChatBots freigeschaltet und somit die Textform veröffentlicht. In den nächsten Wochen und Monaten sind tiefere Integrationen in die Google-Produkte zu erwarten.

