Gemini Omni: Das ist Googles neuer Mediengenerator – starke Videobearbeitung per Sprache + Prompt (Videos)

google 

Google hat vor wenigen Tagen den neuen KI-Mediengenerator Gemini Omni vorgestellt, der die starken multimedialen Fähigkeiten der Gemini-KI unter ein Dach bringen soll. Mit Gemini Omni Flash bietet man den Nutzern schon heute starke Möglichkeiten zur Videobearbeitung per Sprache an, die wir euch in diesem Artikel ausführlich inklusive dem für die Beispiele genutzten Prompt vorstellen wollen.


gemini omni logo

Gemini bietet schon seit langer Zeit starke mediale Fähigkeiten, die sich zunächst in der Bildbearbeitung und der Bildgenerierung gezeigt haben – vor allem durch den im vergangenen Jahr ausgelösten Hype rund um Nano Banana. Schon damals standen auch Tools zur Videogenerierung und Videobearbeitung zur Verfügung, allen voran der Generator Veo und das starke Tool Flow zur Erstellung von ganzen Filmen. Jetzt hebt man das Ganze auf die nächste Stufe.

Mit Gemini Omni sollen die starken Gemini-Fähigkeiten zum Schlussfolgern mit der Fähigkeit, Neues zu kreieren, kombiniert werden. Omni ist das jüngste Modell, das aus allen möglichen Eingaben vielfältige Ausgaben erzeugen kann – eben ein multimodales Tool. Mit Omni lassen sich Bilder, Audio, Video und Text kombinieren und hochwertige Videos erstellen oder bestehende Videos umfangreich bearbeiten.

Das Highlight von Omni ist es, dass man voll auf Realismus setzt – so weit die Nutzer das wünschen. Das zeigt sich schon an den ersten Beispielen, die wir euch ab dem ersten Absatz hier im Artikel einbinden. Dabei soll Gemini Omni Flash nur der erste Schritt sein, den man mit den Videos geht. In späteren Versionen, die mutmaßlich schon in wenigen Wochen erstmals starten werden, sollen dann vollständig virtuelle und sicherlich auch interaktive Welten erstellt werden.




Videos per Spracheingabe bearbeiten

Mit Gemini Omni habe Nutzer die Möglichkeit, Videos sehr einfach zu bearbeiten, ohne auf aufwendige Prompts setzen zu müssen. Denn die Schlussfolgerungen und die gesamte Logik der Gemini Omni-KI ermöglichen es, dass die visuelle KI den Nutzern praktisch jegliche Arbeit abnehmen. Jede Anweisung baut auf der vorherigen auf. Charaktere bleiben konsistent, physische Eigenschaften sind realitätsgetreu und Szenen basieren auf dem, was vorher geschah.

Prompt: Make the sculpture out of bubbles.

Prompt: When the person touches the mirror, make the mirror ripple beautifully like liquid, and the person’s arm turns into reflective mirror material.

Prompt: Dim the lights in the room. Put a black and white checkerboard room inside a glass sphere that floats tracking above the hand, inside it contains a recursive representation




Videos in mehreren Durchgängen optimieren
Videos lassen sich nicht nur einmalig verändern bzw. aus einem bereits vorhanden Video erstellen, sondern ihr könnt das Ganze auch auf mehrere Durchgänge aufteilen. Es lässt sich die Umgebung ändern, der Blickwinkel, der Stil oder auch ein bestimmtes Detail anpassen, ohne den Faden der ursprünglichen Szene zu verieren. Schaut euch das in der folgenden Videostrecke einmal an, die mehrfach verändert wird.

A video of a violinist playing a song.

Prompt: Transport the violinist to the image environment

Prompt: Change the camera angle to be over the violinist’s shoulder.




Das Besondere an diesen Videobearbeitungen ist es, dass die Videos nichts von ihrem eigentlichen Inhalt und Realismus verlieren. Sie wirken auch weiterhin so, als hätte der Mensch sie selbst aufgenommen. Im Fall der Seifenblasenwelt vielleicht nicht ganz so einfach, aber es wirkt dennoch enorm realistisch. Kaum einer käme auf die Idee, dass hier eine KI am Werk war, denn Google Gemini gelingt der Spagat zwischen Nutzerwunsch und Realismus sehr gut.

Was mit diesem neuen Modell noch so alles möglich ist, haben wir euch erst vor wenigen Tagen in unserem ausführlichen Artikel zu den starken Möglichkeiten von Gemini Omni gezeigt, schaut doch darin auch einmal vorbei. Das neue Modell steht jetzt für Google AI Ultra-Abonnenten bereit, kann aber auch innerhalb von YouTube Shorts von allen Nutzern ausprobiert werden.

[Google-Blog]

Letzte Aktualisierung am 23.05.2026 / Bilder von der Amazon Product Advertising API / Affiliate Links, vielen Dank für eure Unterstützung! Als Amazon-Partner verdiene ich an qualifizierten Verkäufen.


 


Teile diesen Artikel:

Facebook twitter Pocket Pocket
label 
Artikel kann bezahlte Werbelinks und Anzeigen enthalten.