Im Browser Google Chrome gibt es derzeit größere Umbauten, die hauptsächlich mit der Integration von Gemini in Verbindung stehen, das den Browser-Alltag mittelfristig recht stark umkrempeln könnte. Jetzt zeigt sich eine sehr interessante Veränderung auf der Neuer Tab-Seite, die zu Spekulationen über eine mögliche weitere KI-Integration führt, die selbst vor dem Suchfeld und der Adressleiste nicht Halt macht.
Beim Cloudspeicher Google Drive konzentriert man sich derzeit auf Videos, die nach den jüngsten Updates schneller hochgeladen und abgespielt werden können und seit wenigen Tagen auch einen Abrufzähler besitzen. Jetzt wird die Integration von Gemini verstärkt, das allen Premium-Nutzern erste Möglichkeiten zur Videoanalyse gibt.
Bei Google dreht sich seit langer Zeit alles um die Künstliche Intelligenz, wobei in den letzten zwei Jahren natürlich Gemini absolut im Fokus ist. Jetzt hat Google eine interessante neue App veröffentlicht, mit der es den Nutzern ermöglicht wird, einen Schwung von kostenlos verfügbaren KI-Modellen herunterzuladen und lokal ohne Internetanbindung zu verwenden.
Google ist mit dem KI-Modell Gemini und dessen App-Ableger sehr gut aufgestellt, denn man integriert es nicht nur tief in die hauseigenen Pixel-Smartphones, sondern über Partnerschaften auch in die Geräte anderer Hersteller - allen voran Samsung. Doch diese Partnerschaft könnte laut aktuellen Berichten Risse bekommen oder gar enden, denn in Südkorea hat man offenbar andere Pläne und will sich groß beim Konkurrenten Perplexity einkaufen.
Google hat vor wenigen Tagen das neue Filmtool Gemini Flow vorgestellt, das vielleicht etwas untergegangen ist, aber sich rückblickend sicherlich als Meilenstein der Videogeneratoren erweisen wird. Es basiert auf den aktuellen Generationen der Bild- und Videogeneratoren und schlägt eine Richtung ein, mit der Filmschaffende von ihrem Schreibtisch ganze Filme produzieren könnten. Ein absoluter Wahnsinn.
Google will rund um die Infotainment-Plattform Android Auto nach einer etwas längeren Pause wieder größere Schritte machen und hat in diesen Tagen gleich zwei interessante Ankündigungen machen können. Beide zielen darauf ab, dass der Funktionsumfang der Plattform ausgebaut wird und sich nicht mehr nur hauptsächlich auf Navigation und Musik konzentriert. Auch das Verweilen während des Parkens spielt eine Rolle.
Google hat mit Gemini von Beginn an auf ein multimodales KI-Modell gesetzt, das alle Inhaltstypen gleichwertig behandelt und daher große Stärken im Medienbereich aufbauen kann - und die zeigt man jetzt. Vor wenigen Tagen wurden mit den Bild- und Videogeneratoren rund um Imagen, Veo und Flow echte Meilensteine geschaffen, die sowohl die Bild-, als auch Video-, und Filmproduktion revolutionieren können.
Die Plattform Google Shopping ist ein wichtiger Bestandteil der Google Websuche und für viele Menschen eine wichtige Anlaufstelle auf der Suche nach Produkten - sowohl bewusst als auch eher zufällig. In diesen Tagen bekommt die Plattform mit Try it on eine starke neue KI-Funktion, die zuerst im Modebereich und später in vielen weiteren Kategorien zum echten Gamechanger werden könnte.
Schon sehr bald dürfen sich viele Nutzer von Android Auto auf einen neuen Sprachassistenten freuen, der viele neue Möglichkeiten mitbringen wird. Mittlerweile hat Google den Start von Gemini Live offiziell gemacht und jetzt zeigt sich der Assistant-Nachfolger in vielen Hands-on-Videos. Der Funktionsumfang wird perspektivisch und auch direkt nach dem Start deutlich steigen.
Mit dem KI-ChatBot Gemini können Nutzer Antworten auf Fragen erhalten, Texte in beliebiger Form erstellen, Bilder erstellen, je nach Paket Videos erstellen und einiges mehr. Nur die wenigsten Nutzer dürften wissen, dass Gemini auch Web-Anwendungen automatisch konzipieren, erstellen und mit Inhalten füllen kann. Jetzt hat Google eine interessante Demo-App veröffentlicht, die die wichtigsten Kennzahlen der Google I/O zusammenfasst.
Google arbeitet mit Hochdruck daran, den KI-ChatBot Gemini auf alle Plattformen zu bringen, wobei natürlich die Android-Ableger im Fokus stehen. Bisher ist Gemini hauptsächlich auf Smartphones und Tablets verfügbar - mit nahezu identischen Oberflächen. Jetzt zeigt sich eine neue Tablet-optimierte Oberfläche, die zusätzlich zur Konversation auch die Hauptnavigation auf die großen Displays bringen kann.
Google hat in den letzten Tagen sehr viele Ankündigungen rund um Gemini gemacht, von denen viele Funktionen recht zeitnah für die Nutzer freigegeben werden sollen. Ein großer Bestandteil davon ist natürlich das immer breiter verfügbare Gemini Live, das nach einem langsamen Rollout in den letzten Wochen jetzt für alle Nutzer inklusive Display- und Kamerafreigabe verfügbar sein sollte.
Google setzt bei der KI-Plattform Gemini verstärkt auf die mediale Komponente und will es den Nutzern so leicht wie möglich machen, Fotos und Videos zu erzeugen. Doch weil es gar nicht so einfach ist, den passenden Prompt zu finden und diesen optimal zu formulieren, gibt es seit einiger Zeit ein starkes Tool, das diesen wichtigen Schritt erleichtern soll. Mit Whisk lassen sich neue Bilder sehr einfach erstellen und anpassen, ohne selbst am Prompt feilen zu müssen.
Google hat zur Promotion rund um Gemini vor einigen Monaten das Zeitalter der KI-Agenten ausgerufen und ist der Meinung, dass dieses spezielle KI-Konzept schon sehr bald eine bedeutende Rolle spielen wird. In dieser Woche hat man endlich gezeigt, wie man sich die erste Generation dieser Agenten vorstellt und welche Möglichkeiten diese schon sehr bald bieten werden. Der neue Gemini Agent Modus steht bereits in den Startlöchern.
Google hat mit dem KI-Videogenerator Veo schon seit längerer Zeit ein starkes Gemini-Tool im Portfolio, das vielen Nutzern die Möglichkeit gibt, knappe Videos durch Eingabe eines Prompts zu erstellen. Jetzt hat man ein neues Tool gestartet, mit dem die Videogenerierung auf eine ganz neue Stufe gehoben wird: Das KI-Filmtool Flow ermöglicht es mit einfachen und dennoch detaillierten Schritten, ganze Kurzfilme zu erstellen.