Google setzt bei der KI-Plattform Gemini verstärkt auf die mediale Komponente und will es den Nutzern so leicht wie möglich machen, Fotos und Videos zu erzeugen. Doch weil es gar nicht so einfach ist, den passenden Prompt zu finden und diesen optimal zu formulieren, gibt es seit einiger Zeit ein starkes Tool, das diesen wichtigen Schritt erleichtern soll. Mit Whisk lassen sich neue Bilder sehr einfach erstellen und anpassen, ohne selbst am Prompt feilen zu müssen.
Google hat gestern Abend wie erwartet neue Gemini-Modelle vorgestellt, die sich nicht nur auf den KI-ChatBot und dessen Funktionsumfang beziehen, sondern auch die starken visuellen Ableger weiter voranbringen. In diesen Tagen startet der neue Bildgenerator Imagen 4, der Videogenerator Veo 3 sowie das neue Film-Tool Flow und ein Update für das Generator-Tool Whisk.
Googles KI-Plattform Gemini stärkt die mediale Komponente und will mit den starken neuen Bildgeneratoren und Videogeneratoren zeigen, welche Vorzüge das multimodale Modell mit sich bringt. Aber auch der Zugang zu diesen Bildgeneratoren soll vereinfacht und mit neuen Tools allen Nutzern erleichtert werden. Mit dem neuen Werkzeug Whisk lassen sich neue Bilder sehr einfach erstellen und anpassen, ohne selbst am Prompt basteln zu mischen.
Google hat gestern die beiden neuen Gemini-Mediengeneratoren Imagen 3 und Veo 2 vorgestellt, mit denen die Nutzer durch einfache Prompts beliebige Bilder oder Videos erstellen können. Aber es gibt noch ein drittes Tool im Bunde, das einen etwas anderen Ansatz verfolgt und das Erstellen von Bildern noch weiter vereinfachen soll: Mit Whisk lassen sich neue Bilder visuell generieren und anpassen.