Gemini Omni: Google startet neuen KI-Generator für Medien aller Art – erstellt realistische Welten (Video)

google 

Google hat unter dem Dach von Gemini eine ganze Reihe von KI-Mediengeneratoren im Portfolio, mit denen die Nutzer Bilder, Text, Videos, Audio, Programmcode und mehr erstellen können. Jetzt geht man den nächsten Schritt und hat das vor einigen Tagen erstmals geleakte Gemini Omni offiziell angekündigt. Es ist ein KI-Generator für realistische Welten.


Gemini Omni

Google hat schon beim Start der ersten Generation von Gemini betont, dass das KI-Modell multimodal aufgebaut ist. Das bedeutet, dass es mit vielen Medientypen umgehen können, die sowohl als Eingangssignal als auch als Ergebnis verwendet werden können. Es begann mit Text, ging über Bilder und Dokumente und reicht längst auch bis zur Generierung von Videos, Animationen, ganzen Filmen und mehr. Jetzt will man all diese Dinge zu einem „Weltgenerator“ zusammenfassen.

Mit Gemini Omni können Nutzer laut der Ankündigung auf der Google I/O „alles aus allem erstellen“. Tatsächlich geht es darum, ein Weltmodell zu bauen, das Bilder und Videos parallel erstellt und versteht. Es wird gemixt mit Audio und einer realistischen Physik, sodass hochrealistische Dinge erstellt werden können. Man beginnt mit Video im Rahmen von „Gemini Omni Flash“, will das aber in Zukunft um viele weitere Medientypen erweitern.

Hier trifft Geminis Fähigkeit zum logischen Denken auf die Fähigkeit, Neues zu erschaffen. Omni ist unser neues Modell, das aus jedem beliebigen Input alles kreieren kann – angefangen bei Videos. Mit Omni können Sie Bilder, Audio, Video und Text als Input kombinieren und hochwertige Videos generieren, die auf dem realen Weltwissen von Gemini basieren. Zudem lassen sich Ihre Videos ganz einfach im Dialog bearbeiten.

Egal, ob Sie die Welt um sich herum verwandeln, Handlungsabläufe neu erfinden oder komplexe Details durch eine einfache Unterhaltung verfeinern möchten: Gemini Omni versteht die Physik, die Kultur und den Kontext Ihrer Vision.




Im obigen Video könnt ihr eine erste Demo von Gemini Omni sehen, wie es von Google im Rahmen des I/O Events vorgestellt worden ist. In den nächsten Tagen und Wochen wird es sicherlich viele weitere Informationen in diese Richtung geben. Perspektivisch dürfte Gemini Omni die erste Anlaufstelle für das Erstellen von Medien sein – egal ob es sich um Bilder, Videos, Audio oder andere Typen handelt. Gemini Omni soll noch heute für viele Nutzer starten.

Wir haben euch erst vor wenigen Tagen einige Beispielvideos aus Gemini Omni vorgestellt. Schaut doch bei Interesse mal herein.

» Googles Start in die KI-Ära: Alle Apps bekommen neue Logos – es gibt interessante Unterschiede (Galerie)

Letzte Aktualisierung am 16.05.2026 / Bilder von der Amazon Product Advertising API / Affiliate Links, vielen Dank für eure Unterstützung! Als Amazon-Partner verdiene ich an qualifizierten Verkäufen.


 


Teile diesen Artikel:

Facebook twitter Pocket Pocket
label ,
Artikel kann bezahlte Werbelinks und Anzeigen enthalten.