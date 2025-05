Google hat zur Promotion rund um Gemini vor einigen Monaten das Zeitalter der KI-Agenten ausgerufen und ist der Meinung, dass dieses spezielle KI-Konzept schon sehr bald eine bedeutende Rolle spielen wird. In dieser Woche hat man endlich gezeigt, wie man sich die erste Generation dieser Agenten vorstellt und welche Möglichkeiten diese schon sehr bald bieten werden. Der neue Gemini Agent Modus steht bereits in den Startlöchern.



Die Künstliche Intelligenz hat in Form der KI-ChatBots in den letzten zwei bis drei Jahren unglaublich große Schritte gemacht und Dinge im Jahr 2025 für selbstverständlich erklärt, die man 2022 noch nicht für möglich gehalten hätte. Dennoch werden die Unternehmen nicht müde zu betonen, dass die KI-Entwicklung noch ganz am Anfang steht und sehr viel mehr leisten kann. Und dann kommt schon das häufig genannte Buzzword der KI-Agenten ins Spiel, die den Nutzern als echte Assistenten zur Seite stehen sollen.

Die Nutzung von KI-ChatBots hat sich längst etabliert, basiert aber gewissermaßen weiterhin auf dem alten Frage-Antwort-Spiel. Auch wenn Produkte wie Gemini Live das ein wenig kaschieren, bleibt es bei diesem fixierten Ablauf: Nutzer fragt, KI antwortet. Mit den KI-Agenten bricht sich dieses Spielchen auf, denn die Nutzer können dauerhafte Aufgaben für Beobachtung, Funktionsausführung oder sonstige Reaktionen ausgeben. Als Beispiel zeigt man eine Wohnungssuche mit konkreten Anforderungen. Heute gibt es kein Ergebnis, aber vielleicht morgen oder nächste Woche. Die KI-Agenten überwachen dies und melden sich anschließend proaktiv. Ein wichtiger Bestandteil des neuen Gemini Agent Modus ist das Project Mariner.

Mit dem Project Mariner kommt Gemini in den Chrome-Browser und ist dazu in der Lage, selbstständig im Web zu surfen, während der Nutzer dabei zusieht. Die KI kann sowohl im Hintergrund agieren als auch beobachtet werden, wobei das für die Abläufe wohl keinen großen Unterschied macht. Mariner ist ein Teil der Agent-KI, gleichzeitig aber auch ein Tool für den Browser-Alltag. Lest euch dazu einmal den verlinkten Artikel durch.









Mit dem Gemini Agent Mode wird der KI-ChatBot zu einem echten Helferlein, das den Alltag des Nutzers aktiv unterstützen kann. Die Agenten lernen die Wünsche des Nutzers kennen, die Vorlieben und auch die gewohnten Abläufe. So lässt sich auch etwa eine Form der Automatisierung aufstellen, die vom Gemini KI-Agent durchlaufen werden könnte. Beispiel: Sende alle meine Fotos von Ort X regelmäßig an Person Y. Oder: Recherchiere zum Thema Z und informiere mich bei Neuigkeiten.

Google beschreibt das mit den folgenden Worten: „Stellen Sie sich vor, Sie geben einfach Ihr Ziel an, und Gemini koordiniert intelligent die Schritte, um es zu erreichen. Der Agentenmodus kombiniert nahtlos erweiterte Funktionen wie Live-Webbrowsing, detaillierte Recherche und intelligente Integrationen mit Ihren Google-Apps und ermöglicht es so, komplexe, mehrstufige Aufgaben von Anfang bis Ende mit minimaler Aufsicht Ihrerseits zu bewältigen.“

Der neue Gemini Agentenmodus wird zunächst nur für Abonnenten von Google One AI Ultra zur Verfügung stehen und dementsprechend sehr wenig genutzt werden können. Denn dieser wird nur für US-Nutzer für 249,99 Dollar pro Monat angeboten.

