Gemini: Google startet beeindruckende neue KI-Modelle – Imagen 3 für Bild und Veo 2 für Video (Galerie)
Google hat vor wenigen Tagen das neue Gemini 2.0 vorgestellt, das in allen Bereichen große Verbesserungen im Gepäck haben und auch die Multimodalität zum Verständnis von Medien weiter verbessern soll. Passend dazu wurden nun neue Generationen des Videogenerators Veo sowie des seit langer Zeit im Einsatz befindlichen Bildgenerators Imagen vorgestellt. Beide sollen deutlich zugelegt haben.
Es geht bei Gemini Schlag auf Schlag: Erst Gemini 2.0, nur einen Tag später wurde Android XR mit Gemini-Unterstützung vorgestellt, das der KI den Weg in die virtuellen Realitäten öffnen soll, und jetzt kommt das nächste Kapitel: Gemini soll im Medienbereich verstärkt werden und in Kürze neue Generationen von Imagen und Veo erhalten. Beide sind seit längerer Zeit ein Bestandteil der Gemini-Plattform und ermöglichen das Generieren von Bildern und Videos.
Man geht nicht ganz konkret ins Detail, will bei beiden aber qualitativ stark nachgelegt haben. Das Verständnis für die Darstellungen, physikalische Grundlagen, menschliche Bewegungen und mehr will man sowohl bei Video als auch Bild besser im Griff haben, um die Ergebnisse noch natürlicher wirken zu lassen. So sollen sowohl die einzelnen Elemente als auch das Zusammenspiel dieser noch realistischere Bilder ergeben.
Zumindest in den veröffentlichten Bildern hat man das sehr gut hinbekommen, was bei vielen Nutzern in der Form sicherlich nicht ganz so gut aussieht. Ich bin persönlich bisher kaum von Googles Medien-KI überzeugt und greife dann doch eher zu anderen Tools. Aber vielleicht wird es mit Imagen 3 und Veo 2 besser, wenn diese in der Masse ankommen. Zunächst will man die neuen Modelle nur über ImageFX und VideoFX anbieten. Schaut euch einmal die Beispielaufnahmen an.
Imagen 3-Beispiele
Veo 2-Beispiel
Ich denke, diese Bilder und die Videos sprechen für sich. Da gibt es zwar noch immer Potenzial nach oben, aber der Realismus ist durchaus gegeben und sowohl an Qualität als auch inhaltlichem Verständnis wurde gut sichtbar gearbeitet.
GoogleWatchBlog bei Google News abonnieren | GoogleWatchBlog-Newsletter