Google hat mit dem KI-Videogenerator Veo schon seit längerer Zeit ein starkes Gemini-Tool im Portfolio, das vielen Nutzern die Möglichkeit gibt, knappe Videos durch Eingabe eines Prompts zu erstellen. Jetzt hat man ein neues Tool gestartet, mit dem die Videogenerierung auf eine ganz neue Stufe gehoben wird: Das KI-Filmtool Flow ermöglicht es mit einfachen und dennoch detaillierten Schritten, ganze Kurzfilme zu erstellen.
Google will den Smart Glasses endlich zum Durchbruch verhelfen und bringt dafür natürlich die eigenen Produkte in Stellung, die noch in diesem Jahr auf den ersten Geräten starten sollen. Jetzt hat man Android XR mit Gemini erneut vorgestellt und dabei nicht nur einen groben Zeitplan umrissen, sondern auch neue Smart Glasses-Partner genannt und weitere Hands-on bzw. in diesem Fall Eyes-on-Aufnahmen von der Oberfläche veröffentlicht.
Googles KI-Modell Gemini besitzt seit einiger Zeit einen eigenen Videogenerator, der in dieser Woche als Veo 3 in einer neuen Generation erschienen ist. Die dritte Generation setzt auf dem weiterhin verfügbaren Vorgänger auf und hält neben dessen Verbesserungen auch einen großen Schritt bereit, der über die Qualitätssteigerungen hinausgeht: Denn erstmals lassen sich Videos mit Ton oder gar Dialogen erzeugen.
Google hat erst vor wenigen Monaten den KI-Videogenerator Veo 2 veröffentlicht, der schon damals gewaltige Schritte bei der Qualität der Videos machen konnte. Jetzt hat man das Tool noch einmal deutlich verbessert und eine aktualisierte Version veröffentlicht, die den Nutzern sehr viel mehr Einfluss auf das Gesamtwerk gibt. Von der Kameraführung über Referenzbilder bis hin zum Hinzufügen und Entfernen von Objekten ist einiges dabei.
Der KI-Bildgenerator Imagen befindet sich bei Google schon seit langer Zeit in Entwicklung und ist in dieser Woche in der neuesten Generation erschienen, die wieder einen großen Schritt nach vorn macht. Mit dem neuen Imagen 4 will man die Gesamtqualität steigern, in dem vielen wichtigen Details mehr Beachtung geschenkt wird - von Texturen bis Text. Aber auch die Bildgröße lässt sich erstmals festlegen.
Mit der Plattform NotebookLM hat das KI-Modell Gemini eine mächtige Schnittstelle erhalten, die den Nutzern bei der Organisation von Dokumenten und den darin enthaltenen Informationen helfen soll. Die Web-App ist längst kein Geheimtipp mehr und jetzt dürfen sich auch Android-Nutzer freuen. Denn in dieser Woche hat Google die neue NotebookLM-Ap gestartet, die viele neue Funktionen und eine optimierte Oberfläche auf die Smartphones bringt.
Google hat in dieser Woche den breiten US-Start des KI-Modus in der Google Websuche angekündigt, mit dem sich die Suchmaschine vollständig verändert und im klassischen Sinne nicht mehr als eine solche bezeichnet werden sollte. Doch jetzt gibt es massiven Gegenwind aus der Verlegerbranche, denn selbst mächtige US-Medien bezichtigen Google des Content-Diebstahls. Google klaut Inhalte, gibt sie als die eigenen aus und verdient auch noch Geld damit.
Nutzer von GMail können schon seit langer Zeit von den smarten Antworten profitieren, die auf allen Plattformen zur Verfügung stehen und eine schnelle Antwort auf eine E-Mail ermöglichen. Bislang bestanden diese Antworten allerdings nur aus wenigen Worten und nahmen eher zufällig Bezug auf den Inhalt einer E-Mail. Mit einer kommenden Integration von Gemini soll der Umfang sehr deutlich ausgebaut werden.
Google hat gestern Abend wie erwartet neue Gemini-Modelle vorgestellt, die sich nicht nur auf den KI-ChatBot und dessen Funktionsumfang beziehen, sondern auch die starken visuellen Ableger weiter voranbringen. In diesen Tagen startet der neue Bildgenerator Imagen 4, der Videogenerator Veo 3 sowie das neue Film-Tool Flow und ein Update für das Generator-Tool Whisk.
Schon seit längerer Zeit ist bekannt, dass der Browser Google Chrome mit dem KI-ChatBot Gemini ausgerüstet werden soll und jetzt haben die Entwickler diesen Schritt offiziell angekündigt. Schon ab heute werden erste Nutzer die Möglichkeit haben, Gemini (Live) direkt im Browser zu verwenden, der extra für diese Integration einen eigenen Button mit übergeordneter Funktionalität erhält.
Google arbeitet seit vielen Jahren an Smart Glasses, die schon bald mit der neuen Plattform Android XR starten sollen. Ankündigungen hat es bereits mehrfach gegeben und jetzt liefert man etwas mehr Details zu den Möglichkeiten der Plattform, die wohl zunächst hauptsächlich dafür konzipiert ist, Gemini mit den visuellen Features zu pushen. Das Ziel ist es, die Google Glass-Visionen endlich umzusetzen.
Google hat für den Hype rund um Gemini schon vor längerer Zeit den Start des "Zeitalter für KI-Agenten" angekündigt und jetzt lässt man diesen Worten auch Taten folgen: Das KI-Modell erhält einen neuen "Agent Modus", in dem die Künstliche Intelligenz mehr oder weniger selbstständig Aufgaben ausführt und den Nutzer proaktiv informieren kann. Parallel lernt das daran angebundene Project Mariner dazu und ermöglicht ein Live-Browsing.
Wer den vollen Funktionsumfang von Googles KI-Modell Gemini nutzen möchte, kann dies schon seit längerer Zeit durch ein Abo bei Google One tun, das den Advanced-Zugang für 21,99 Euro pro Monat freischaltet. Jetzt startet ein neues Abo, das mehr als das zehnfache (!) von dem kostet und den Nutzern neben sehr viel Speicherplatz auch die absolut höchsten Stufen und neuesten Inhalte von Gemini freischaltet.
Bei der heute Abend gestarteten Entwicklerkonferenz Google I/O dreht sich wie erwartet vieles um Gemini, das bereits zum dritten Mal in diesem Jahr mit neuen Modellen nachlegen kann. Das vor einigen Wochen veröffentlichte Gemini 2.5 erhält neue Funktionen, eine verbesserte Performance, breiter zugängliche Einzelmodelle, neue Versionen für die Bild- und Videogeneratoren und einiges mehr.
Nutzer des Videomessengers Google Meet durften sich zuletzt bereits über einige Integrationen von Gemini freuen und jetzt folgt der nächste große Schritt, der in der internationalen Kommunikation zum Gamechanger werden könnte: Eine neue Gemini-KI soll in Kürze eine Live-Übersetzung ermöglichen, die als echter Dolmetscher arbeiten soll - ohne größere Verzögerung und gar in passender Tonlage und Stimme.