Google Flow & Gemini Omni: Große Updates für die KI-Mediengeneratoren für Video, Musik und mehr (Video)
Google lässt das Portfolio der KI-gestützen Kreativtools weiter wachsen und hat neben dem Neustart von Gemini Omni jetzt auch große Updates für Google Flow und Google Flow Music angekündigt. Jezt spendiert man stärkere Werkzeuge, lässt einen Agentenmodus einziehen, startet benutzerdefinierte Workflows und für beide Anwendungen eigene mobile Apps für Android und iOS.
Für die visuelle Produktion führt Google das Modell Gemini Omni Flash ein. Der Fokus dieses Updates liegt auf einer präziseren Videobearbeitung und der Möglichkeit, reale Aufnahmen mit generierten Inhalten zu kombinieren. Ein Schwerpunkt ist dabei die Verbesserung der Charakterkonsistenz: Das System ist nun darauf ausgelegt, Identitäten und Stimmen über verschiedene Szenen hinweg beizubehalten. Die Bedienung erfolgt dabei zunehmend über einen interaktiven Dialog mit der KI, was den Arbeitsablauf für Abonnenten von Google AI verändern soll.
Ein zentraler Bestandteil des Updates ist der neue Google Flow Agent, der Nutzer bei komplexeren Aufgaben unterstützen soll. Dieser Agent ist so konzipiert, dass er auf Anweisung Brainstorming-Prozesse für Dialoge oder Handlungsstränge übernimmt und Stapelverarbeitungen von Medieninhalten durchführt. Die finale Kontrolle über das Projekt verbleibt jedoch beim Anwender. Darüber hinaus übernimmt der Agent organisatorische Aufgaben, wie das Gruppieren von Dateien in Sammlungen und die automatisierte Benennung von Arbeitsmaterialien.
Eine weitere Neuerung sind die sogenannten Google Flow Tools. Diese Funktion erlaubt es Anwendern, mithilfe natürlicher Spracheingaben eigene Werkzeuge für die Bild- und Videobearbeitung zu erstellen, ohne dass dafür Programmierkenntnisse erforderlich sind. Als Praxisbeispiel nennt das Unternehmen das Tool „pixelBento“, das von einem Early-Access-Partner entwickelt wurde und spezifische visuelle Effekte anwendet. Diese eigens erstellten Tools können anschließend innerhalb der Community geteilt und von anderen Nutzern weiterentwickelt werden.
Im Bereich der Audioproduktion erhält Google Flow Music ebenfalls neue Funktionen, die vor allem die detaillierte Bearbeitung bestehender Projekte betreffen. Nutzer haben nun die Möglichkeit, Songs abschnittsweise anzupassen, ohne die restliche Komposition zu verändern. Dies schließt das Umschreiben oder Übersetzen einzelner Textzeilen sowie die gezielte Veränderung musikalischer Höhepunkte ein. Zudem lässt sich der Stil kompletter Lieder nachträglich in andere Genres transformieren, um beispielsweise alternative Versionen eines Originaltracks zu erzeugen.
Zusätzlich wird das Gemini Omni-Modell auch in Google Flow Music integriert, um die Erstellung passender Musikvideos zu erleichtern. Die Funktion erlaubt es Künstlern, über konversationelle Eingaben an den KI-Agenten visuelle Begleitmaterialien für ihre Audiospuren zu generieren. Durch den Einsatz von Omni Flash sollen sich die visuellen Stile, Motive und Bildfolgen an die Struktur, die Stimmung und das Tempo des jeweiligen Songs anpassen lassen.
Neben den webbasierten Plattformen, die weiterhin den vollen Funktionsumfang bieten, stellt Google nun auch mobile Anwendungen bereit. Die Apps sollen Nutzern die Möglichkeit geben, auch von mobilen Endgeräten aus an ihren Projekten zu arbeiten oder erste Entwürfe zu skizzieren. Der Rollout beginnt schrittweise: Die Google Flow-App für Android wird zunächst als Beta-Version veröffentlicht, während die eigenständige Google Flow Music-App zeitgleich für iOS-Nutzer zur Verfügung steht.
Letzte Aktualisierung am 22.04.2026 / Bilder von der Amazon Product Advertising API / Affiliate Links, vielen Dank für eure Unterstützung! Als Amazon-Partner verdiene ich an qualifizierten Verkäufen.
GoogleWatchBlog bei Google News abonnieren | GWB-Newsletter