Google hat vor wenigen Tagen das neue Filmtool Gemini Flow vorgestellt, das vielleicht etwas untergegangen ist, aber sich rückblickend sicherlich als Meilenstein der Videogeneratoren erweisen wird. Es basiert auf den aktuellen Generationen der Bild- und Videogeneratoren und schlägt eine Richtung ein, mit der Filmschaffende von ihrem Schreibtisch ganze Filme produzieren könnten. Ein absoluter Wahnsinn.
Google hat mit Gemini von Beginn an auf ein multimodales KI-Modell gesetzt, das alle Inhaltstypen gleichwertig behandelt und daher große Stärken im Medienbereich aufbauen kann - und die zeigt man jetzt. Vor wenigen Tagen wurden mit den Bild- und Videogeneratoren rund um Imagen, Veo und Flow echte Meilensteine geschaffen, die sowohl die Bild-, als auch Video-, und Filmproduktion revolutionieren können.
Google setzt bei der KI-Plattform Gemini verstärkt auf die mediale Komponente und will es den Nutzern so leicht wie möglich machen, Fotos und Videos zu erzeugen. Doch weil es gar nicht so einfach ist, den passenden Prompt zu finden und diesen optimal zu formulieren, gibt es seit einiger Zeit ein starkes Tool, das diesen wichtigen Schritt erleichtern soll. Mit Whisk lassen sich neue Bilder sehr einfach erstellen und anpassen, ohne selbst am Prompt feilen zu müssen.
Google hat mit dem KI-Videogenerator Veo schon seit längerer Zeit ein starkes Gemini-Tool im Portfolio, das vielen Nutzern die Möglichkeit gibt, knappe Videos durch Eingabe eines Prompts zu erstellen. Jetzt hat man ein neues Tool gestartet, mit dem die Videogenerierung auf eine ganz neue Stufe gehoben wird: Das KI-Filmtool Flow ermöglicht es mit einfachen und dennoch detaillierten Schritten, ganze Kurzfilme zu erstellen.
Der KI-Bildgenerator Imagen befindet sich bei Google schon seit langer Zeit in Entwicklung und ist in dieser Woche in der neuesten Generation erschienen, die wieder einen großen Schritt nach vorn macht. Mit dem neuen Imagen 4 will man die Gesamtqualität steigern, in dem vielen wichtigen Details mehr Beachtung geschenkt wird - von Texturen bis Text. Aber auch die Bildgröße lässt sich erstmals festlegen.
Google hat gestern Abend wie erwartet neue Gemini-Modelle vorgestellt, die sich nicht nur auf den KI-ChatBot und dessen Funktionsumfang beziehen, sondern auch die starken visuellen Ableger weiter voranbringen. In diesen Tagen startet der neue Bildgenerator Imagen 4, der Videogenerator Veo 3 sowie das neue Film-Tool Flow und ein Update für das Generator-Tool Whisk.
Googles KI-ChatBot Gemini besitzt schon seit längerer Zeit einen integrierten Bildgenerator, der auf Basis des Imagen-Modells beliebige Motive erzeugen kann. Jetzt wird eine neue Funktion ausgerollt, auf die viele Nutzer schon seit länger Zeit gewartet haben dürften, nämlich die Bildbearbeitung. Nutzer können jetzt ein Bild hochladen oder ein von Gemini erstelltes auswählen und per Prompt anpassen.
Googles Bildgenerator Imagen 3 hat zuletzt große Fortschritte gemacht und konnte nicht zuletzt durch den neuen Unterbau von Gemini 2.0 auch einen starken Leistungssprung machen. Dieser ermöglicht es nun, allen Nutzern ein Feature anzubieten, das man vor längerer Zeit aufgrund von komplexen Problemen zurückziehen musste: Geminis Imagen kann jetzt wieder für alle Nutzergruppen Fotos von Personen erstellen.
Googles KI-Plattform Gemini stärkt die mediale Komponente und will mit den starken neuen Bildgeneratoren und Videogeneratoren zeigen, welche Vorzüge das multimodale Modell mit sich bringt. Aber auch der Zugang zu diesen Bildgeneratoren soll vereinfacht und mit neuen Tools allen Nutzern erleichtert werden. Mit dem neuen Werkzeug Whisk lassen sich neue Bilder sehr einfach erstellen und anpassen, ohne selbst am Prompt basteln zu mischen.
Google arbeitet schon seit Jahren am Bildgenerator Imagen, der mittlerweile ein Teil des Gemini-Universums geworden ist und kürzlich als Imagen 3 in der dritten Generation erschienen ist. Mit Imagen 3 auf Basis von Gemini 2.0 soll die Plattform eine ganz neue Qualität erreichen und mit fotorealistischen Aufnahmen bis hin zu Ergebnissen in allen von den Nutzern gewünschten Stilen überzeugen. Hier findet ihr einige Beispiele.
Google hat gestern die beiden neuen Gemini-Mediengeneratoren Imagen 3 und Veo 2 vorgestellt, mit denen die Nutzer durch einfache Prompts beliebige Bilder oder Videos erstellen können. Aber es gibt noch ein drittes Tool im Bunde, das einen etwas anderen Ansatz verfolgt und das Erstellen von Bildern noch weiter vereinfachen soll: Mit Whisk lassen sich neue Bilder visuell generieren und anpassen.
Google hat vor wenigen Tagen das neue Gemini 2.0 vorgestellt, das in allen Bereichen große Verbesserungen im Gepäck haben und auch die Multimodalität zum Verständnis von Medien weiter verbessern soll. Passend dazu wurden nun neue Generationen des Videogenerators Veo sowie des seit langer Zeit im Einsatz befindlichen Bildgenerators Imagen vorgestellt. Beide sollen deutlich zugelegt haben.
Die Online-Textverarbeitung Google Docs bietet den Nutzern viele Möglichkeiten, um unterschiedliche Medien in ein Dokument einzufügen. Bilder sind natürlich die naheliegendste Variante für ein Dokument, das vielleicht auch ausgedruckt werden soll, und jetzt zieht auch an dieser Stelle die Künstliche Intelligenz ein. Viele Nutzer können per Imagen 3-Integration neue Fotos per Prompt generieren lassen.
Zu Googles KI-Modell Gemini gehört dank des multimodalen Ansatzes auch die Möglichkeit, Bilder zu vearbeiten oder auf Anfrage neue zu generieren. Jetzt macht das darunterliegende Modell Imagen 3 einen großen Schritt und ist ab sofort für alle Nutzer kostenlos und unbegrenzt verfügbar. Sowohl qualitativ als auch funktionell hat man sehr stark zugelegt und den Bildgenerator auf ein neues Level gebracht.
Nutzer von Google Workspace dürfen sich auf die nächste Generation der Plattform freuen, die natürlich ganz im Zeichen der Künstlichen Intelligenz und mehrstufig für die ersten Nutzer ausgerollt wird. Jetzt ist die Präsentationsplattform Google Slides an der Reihe, die Labs-Teilnehmern die Möglichkeit gibt, Grafiken dynamisch auf Basis der Imagen-Technologie zu generieren.