Googles KI-Modell Gemini besitzt seit einiger Zeit einen eigenen Videogenerator, der in dieser Woche als Veo 3 in einer neuen Generation erschienen ist. Die dritte Generation setzt auf dem weiterhin verfügbaren Vorgänger auf und hält neben dessen Verbesserungen auch einen großen Schritt bereit, der über die Qualitätssteigerungen hinausgeht: Denn erstmals lassen sich Videos mit Ton oder gar Dialogen erzeugen.
Google hat erst vor wenigen Monaten den KI-Videogenerator Veo 2 veröffentlicht, der schon damals gewaltige Schritte bei der Qualität der Videos machen konnte. Jetzt hat man das Tool noch einmal deutlich verbessert und eine aktualisierte Version veröffentlicht, die den Nutzern sehr viel mehr Einfluss auf das Gesamtwerk gibt. Von der Kameraführung über Referenzbilder bis hin zum Hinzufügen und Entfernen von Objekten ist einiges dabei.
Der KI-Bildgenerator Imagen befindet sich bei Google schon seit langer Zeit in Entwicklung und ist in dieser Woche in der neuesten Generation erschienen, die wieder einen großen Schritt nach vorn macht. Mit dem neuen Imagen 4 will man die Gesamtqualität steigern, in dem vielen wichtigen Details mehr Beachtung geschenkt wird - von Texturen bis Text. Aber auch die Bildgröße lässt sich erstmals festlegen.
Mit der Plattform NotebookLM hat das KI-Modell Gemini eine mächtige Schnittstelle erhalten, die den Nutzern bei der Organisation von Dokumenten und den darin enthaltenen Informationen helfen soll. Die Web-App ist längst kein Geheimtipp mehr und jetzt dürfen sich auch Android-Nutzer freuen. Denn in dieser Woche hat Google die neue NotebookLM-Ap gestartet, die viele neue Funktionen und eine optimierte Oberfläche auf die Smartphones bringt.
Google hat in dieser Woche den breiten US-Start des KI-Modus in der Google Websuche angekündigt, mit dem sich die Suchmaschine vollständig verändert und im klassischen Sinne nicht mehr als eine solche bezeichnet werden sollte. Doch jetzt gibt es massiven Gegenwind aus der Verlegerbranche, denn selbst mächtige US-Medien bezichtigen Google des Content-Diebstahls. Google klaut Inhalte, gibt sie als die eigenen aus und verdient auch noch Geld damit.
Nutzer von GMail können schon seit langer Zeit von den smarten Antworten profitieren, die auf allen Plattformen zur Verfügung stehen und eine schnelle Antwort auf eine E-Mail ermöglichen. Bislang bestanden diese Antworten allerdings nur aus wenigen Worten und nahmen eher zufällig Bezug auf den Inhalt einer E-Mail. Mit einer kommenden Integration von Gemini soll der Umfang sehr deutlich ausgebaut werden.
Google hat gestern Abend wie erwartet neue Gemini-Modelle vorgestellt, die sich nicht nur auf den KI-ChatBot und dessen Funktionsumfang beziehen, sondern auch die starken visuellen Ableger weiter voranbringen. In diesen Tagen startet der neue Bildgenerator Imagen 4, der Videogenerator Veo 3 sowie das neue Film-Tool Flow und ein Update für das Generator-Tool Whisk.
Schon seit längerer Zeit ist bekannt, dass der Browser Google Chrome mit dem KI-ChatBot Gemini ausgerüstet werden soll und jetzt haben die Entwickler diesen Schritt offiziell angekündigt. Schon ab heute werden erste Nutzer die Möglichkeit haben, Gemini (Live) direkt im Browser zu verwenden, der extra für diese Integration einen eigenen Button mit übergeordneter Funktionalität erhält.
Google arbeitet seit vielen Jahren an Smart Glasses, die schon bald mit der neuen Plattform Android XR starten sollen. Ankündigungen hat es bereits mehrfach gegeben und jetzt liefert man etwas mehr Details zu den Möglichkeiten der Plattform, die wohl zunächst hauptsächlich dafür konzipiert ist, Gemini mit den visuellen Features zu pushen. Das Ziel ist es, die Google Glass-Visionen endlich umzusetzen.
Google hat für den Hype rund um Gemini schon vor längerer Zeit den Start des "Zeitalter für KI-Agenten" angekündigt und jetzt lässt man diesen Worten auch Taten folgen: Das KI-Modell erhält einen neuen "Agent Modus", in dem die Künstliche Intelligenz mehr oder weniger selbstständig Aufgaben ausführt und den Nutzer proaktiv informieren kann. Parallel lernt das daran angebundene Project Mariner dazu und ermöglicht ein Live-Browsing.
Wer den vollen Funktionsumfang von Googles KI-Modell Gemini nutzen möchte, kann dies schon seit längerer Zeit durch ein Abo bei Google One tun, das den Advanced-Zugang für 21,99 Euro pro Monat freischaltet. Jetzt startet ein neues Abo, das mehr als das zehnfache (!) von dem kostet und den Nutzern neben sehr viel Speicherplatz auch die absolut höchsten Stufen und neuesten Inhalte von Gemini freischaltet.
Bei der heute Abend gestarteten Entwicklerkonferenz Google I/O dreht sich wie erwartet vieles um Gemini, das bereits zum dritten Mal in diesem Jahr mit neuen Modellen nachlegen kann. Das vor einigen Wochen veröffentlichte Gemini 2.5 erhält neue Funktionen, eine verbesserte Performance, breiter zugängliche Einzelmodelle, neue Versionen für die Bild- und Videogeneratoren und einiges mehr.
Nutzer des Videomessengers Google Meet durften sich zuletzt bereits über einige Integrationen von Gemini freuen und jetzt folgt der nächste große Schritt, der in der internationalen Kommunikation zum Gamechanger werden könnte: Eine neue Gemini-KI soll in Kürze eine Live-Übersetzung ermöglichen, die als echter Dolmetscher arbeiten soll - ohne größere Verzögerung und gar in passender Tonlage und Stimme.
Mit dem KI-ChatBot Gemini lassen sich sehr viele Informationen zusammentragen und praktisch beliebige Themen behandeln, über die mit der Künstlichen Intelligenz philosophiert werden kann. Nach einer überraschend langen Wartezeit wird jetzt endlich eine Suchfunktion ausgerollt, mit der die Nutzer ihre Gemini-Konversationen durchsuchen und somit die bereits erhaltenen Informationen schneller wiederfinden können.
Das auf der Gemini-KI basierende Tool NotebookLM hat in den letzten Monaten große Schritte gemacht und sich wohl tatsächlich bei immer mehr Nutzergruppen vom Geheimtipp zum praktischen Helferlein gesteigert. Jetzt dürfte die Reichweite noch einmal anziehen, denn Google hat wie versprochen die neue Android-App veröffentlicht, die schon vor einigen Tagen erstmals angekündigt und für die I/O in Aussicht gestellt wurde. Die App bringt eine optimierte Oberfläche.