Beim smarten Dateimanager Google Files gibt es in diesen Tagen einige interessante Neuerungen rund um die Darstellung von PDF-Dateien. Denn die App hat recht überraschend einen eigenen PDF-Betrachter erhalten und jetzt wurde kurz darauf eine Integration von Gemini angekündigt. Der KI-ChatBot kann nun ausgewählte PDF-Dateien analysieren und deren Inhalt zusammenfassen.
Google arbeitet seit vielen Jahren an Smart Glasses und hat dabei schon die unterschiedlichsten Konzepte ausprobiert, die sich allesamt nicht am Markt behaupten konnten oder gar nicht erst erschienen sind. Im kommenden Jahr steht der nächste Anlauf an, für den man nun alle benötigten Puzzleteilchen mitbringt. Vor allem die so wichtige Killer-Applikation, an der es stets gemangelt hat, hat man mit Gemini endlich gefunden.
Alle paar Jahre hat Google ein neues Fokusprodukt im Portfolio, das innerhalb kürzester Zeit breit aufgestellt und in möglichst viele Produkte integriert wird - was sich in der Vergangenheit nicht immer als nachhaltig erwiesen hat. Derzeit ist ohne Frage Gemini dieses absolute Fokusprodukt, dessen Arme gar nicht weit genug reichen können. In den letzten Tagen zeigte sich, dass Gemini auch in neuen Bereichen einiges zugetraut wird.
Vor wenigen Tagen ist mit Gemini 2.0 die zweite große Generation des KI-ChatBot gestartet, der nun in noch mehr unterschiedlichen Varianten zur Verfügung steht. Um es den Nutzern zu erleichtern, das darunterliegende KI-Modell zu ändern und somit eigene Testläufe zu starten, hat man nun einen neuen Channel Switcher in die Android-App integriert. Mit diesem könnt ihr einfach zwischen den verfügbaren Gemini-Kanälen wechseln.
Google hat gestern die beiden neuen Gemini-Mediengeneratoren Imagen 3 und Veo 2 vorgestellt, mit denen die Nutzer durch einfache Prompts beliebige Bilder oder Videos erstellen können. Aber es gibt noch ein drittes Tool im Bunde, das einen etwas anderen Ansatz verfolgt und das Erstellen von Bildern noch weiter vereinfachen soll: Mit Whisk lassen sich neue Bilder visuell generieren und anpassen.
Google hat vor wenigen Tagen das neue Gemini 2.0 vorgestellt, das in allen Bereichen große Verbesserungen im Gepäck haben und auch die Multimodalität zum Verständnis von Medien weiter verbessern soll. Passend dazu wurden nun neue Generationen des Videogenerators Veo sowie des seit langer Zeit im Einsatz befindlichen Bildgenerators Imagen vorgestellt. Beide sollen deutlich zugelegt haben.
Google hat der noch recht jungen Plattform NotebookLM vor einiger Zeit ein interessantes neues Feature spendiert, das bei den Nutzern wohl sehr gut ankommt und jetzt erweitert wird: Das von der KI erstellte Podcast-Format Audio Overview erhält eine vollständig interaktive Komponente, die den Nutzern jederzeit einsteigen lässt. Daraus kann sich während der Erklärung ein echtes Expertengespräch ergeben.
Viele Menschen kennen Hey Google, denn selbst wenn man es nicht aktiv verwendet, hat man sicherlich schon einmal davon gehört. Doch Google könnte dieses Hotword zur Aktivierung des Assistant schon bald einstampfen, denn im Zuge einer Neuvorstellung wird auch vom Marketing plötzlich eine neue Wortgruppe verwendet: Wenig überraschend heißt es dort jetzt statt 'Hey Google' in der neuen Version Hey Gemini.
Google bietet seit vielen Jahren eine KI-basierte Bilderkennung, die in einigen Produkten wie Google Fotos, der Bildersuche oder auch Lookout zum Einsatz kommt. Die Erkennung weiß seit jeher zu beeindrucken, doch wie weit diese Technologie mittlerweile fortgeschritten ist, dürfte nur den wenigsten Nutzern bewusst sein. Ein neues Tool, das auch ein wenig aufrütteln will, demonstriert jetzt auf eine etwas erschreckende Weise, wie viele Informationen die Algorithmen aus einem einzigen Bild ziehen können.
Bei Nutzung des Cloudspeichers Google Drive kommt man immer wieder mit größeren Ordnern in Berührung, die viele Dateien umfassen oder auch weitere Unterordner enthalten können, durch die man sich durchkämpfen muss. Jetzt wird ein Update für das in einigen Versionen integrierte Gemini ausgerollt, das den Nutzern diese Arbeit abnehmen kann. Die KI fasst Ordner intelligent zusammen.
Google arbeitet seit vielen Jahren an den Bereichen Virtual Reality, Augmented Reality und Mixed Reality, hatte dabei bisher aber nur überschaubaren Erfolg. Jetzt startet der nächste Angriff, denn man hat das neue Betriebssystem Android XR vorgestellt, das als Plattform für smarte Displays und Smart Glasses dienen soll. Als Killer-Anwendung hat man Gemini ausgemacht und ruft daher die Gemini-Ära für Smart Glasses aus.
Google gibt bei der Weiterentwicklung von Gemini weiter Vollgas und hat jetzt, wie bereits erwartet, das neue Gemini 2.0 vorgestellt. Man spricht von einem Meilenstein der eigenen KI-Plattform, der eine deutlich gesteigerte Leistung, eine breitere Multimodalität sowie einige neue Agenten und Integrationen im Gepäck hat. Passenderweise ruft man auch gleich die Ära der KI-Agenten aus.
Google hat den Funktionsumfang von Gemini zuletzt durch einen ganzen Schwung an Erweiterungen vergrößert, die sowohl einige Google-Anwendungen als auch externe Plattformen angebunden haben. Diesen Weg will man weitergehen und fragt jetzt die Nutzer nach ihrer Meinung bzw. sucht Inspirationen für die nächsten Erweiterungen, an die sich das Team heranwagen soll.
Wir befinden uns im letzten Monat des Jahres und viele Plattformen haben bereits ihre Jahresrückblicke veröffentlicht - darunter auch vor wenigen Tagen der Streamingriese Spotify. In diesem Jahr bekommen die Spotify-Nutzer nicht nur die üblichen Top-Playlisten geliefert, sondern in Kooperation mit Google Gemini auch eine Art Podcast mit einem moderierten persönlichen Musik-Jahresrückblick.
Nutzer des KI-ChatBot Gemini dürfen sich in derzeit über einen recht stark wachsenden Funktionsumfang freuen, der um eine ganze Reihe lokal-konzentrierter Features anwächst. Dazu gehört eine per "Werkzeuge"-Erweiterung umgesetzte lokale Smartphone-Steuerung, die in dieser Woche für viele Nutzer ausgerollt wurde. Mit dieser lassen sich viele Smartphone-Funktionen und auch einige Apps steuern. Hier findet ihr die derzeit vollständige Liste aller Funktionen.