Gemini Omni: Google startet neuen KI-Generator für Medien aller Art – erstellt realistische Welten (Video)

Veröffentlicht am 19. Mai 2026 von Jens

Google hat unter dem Dach von Gemini eine ganze Reihe von KI-Mediengeneratoren im Portfolio, mit denen die Nutzer Bilder, Text, Videos, Audio, Programmcode und mehr erstellen können. Jetzt geht man den nächsten Schritt und hat das vor einigen Tagen erstmals geleakte Gemini Omni offiziell angekündigt. Es ist ein KI-Generator für realistische Welten.

Google hat schon beim Start der ersten Generation von Gemini betont, dass das KI-Modell multimodal aufgebaut ist. Das bedeutet, dass es mit vielen Medientypen umgehen können, die sowohl als Eingangssignal als auch als Ergebnis verwendet werden können. Es begann mit Text, ging über Bilder und Dokumente und reicht längst auch bis zur Generierung von Videos, Animationen, ganzen Filmen und mehr. Jetzt will man all diese Dinge zu einem „Weltgenerator“ zusammenfassen.

Mit Gemini Omni können Nutzer laut der Ankündigung auf der Google I/O „alles aus allem erstellen“. Tatsächlich geht es darum, ein Weltmodell zu bauen, das Bilder und Videos parallel erstellt und versteht. Es wird gemixt mit Audio und einer realistischen Physik, sodass hochrealistische Dinge erstellt werden können. Man beginnt mit Video im Rahmen von „Gemini Omni Flash“, will das aber in Zukunft um viele weitere Medientypen erweitern.

Hier trifft Geminis Fähigkeit zum logischen Denken auf die Fähigkeit, Neues zu erschaffen. Omni ist unser neues Modell, das aus jedem beliebigen Input alles kreieren kann – angefangen bei Videos. Mit Omni können Sie Bilder, Audio, Video und Text als Input kombinieren und hochwertige Videos generieren, die auf dem realen Weltwissen von Gemini basieren. Zudem lassen sich Ihre Videos ganz einfach im Dialog bearbeiten.

Egal, ob Sie die Welt um sich herum verwandeln, Handlungsabläufe neu erfinden oder komplexe Details durch eine einfache Unterhaltung verfeinern möchten: Gemini Omni versteht die Physik, die Kultur und den Kontext Ihrer Vision.

Im obigen Video könnt ihr eine erste Demo von Gemini Omni sehen, wie es von Google im Rahmen des I/O Events vorgestellt worden ist. In den nächsten Tagen und Wochen wird es sicherlich viele weitere Informationen in diese Richtung geben. Perspektivisch dürfte Gemini Omni die erste Anlaufstelle für das Erstellen von Medien sein – egal ob es sich um Bilder, Videos, Audio oder andere Typen handelt. Gemini Omni soll noch heute für viele Nutzer starten.

Wir haben euch erst vor wenigen Tagen einige Beispielvideos aus Gemini Omni vorgestellt. Schaut doch bei Interesse mal herein.

» Googles Start in die KI-Ära: Alle Apps bekommen neue Logos – es gibt interessante Unterschiede (Galerie)

Produkt	Preis
Google Pixel 10 – Android-Smartphone ohne SIM-Lock, mit Gemini, innovativer Dreifach-Rückkamera...	622,00 EUR	Bei Amazon kaufen
Google Pixel 10 Pro – Entsperrtes Android-Smartphone mit Gemini, Dreifach-Rückkamerasystem...	930,00 EUR	Bei Amazon kaufen
Google Pixel 10 Pro XL – Android-Smartphone ohne SIM-Lock, mit Gemini, Dreifach-Rückkamera, mehr...	999,00 EUR	Bei Amazon kaufen
Google Pixel Watch 4 (41 mm) – Android-Smartwatch mit gewölbtem Display und Fitness-Tracking und...	399,00 EUR 299,00 EUR	Bei Amazon kaufen
Google Pixel Buds 2a – Kabellose Kopfhörer mit aktiver Geräuschunterdrückung – Leicht und...	149,00 EUR 127,99 EUR	Bei Amazon kaufen

Letzte Aktualisierung am 16.05.2026 / Bilder von der Amazon Product Advertising API / Affiliate Links, vielen Dank für eure Unterstützung! Als Amazon-Partner verdiene ich an qualifizierten Verkäufen.

Keine Google-News mehr verpassen:
GoogleWatchBlog bei Google News abonnieren | GWB-Newsletter

Teile diesen Artikel: