GoogleWatchBlog

Gemini: KI-Agenten sollen Computer und Smartphones steuern – Computer use startet in Gemini 3.5 Flash

» Web-Version «

Google baut den Umfang des KI-Modells Gemini immer weiter aus und will auch dem gleichnamigen ChatBot mehr Möglichkeiten spendieren. Jetzt kündigt man einen wichtigen Schritt an, der schon bald größere Bedeutung erlangen könnte: Die Fähigkeit zur Computerbedienung – Gemini Computer use ist nun fest in Gemini 3.5 Flash integriert und steht damit theoretisch allen Nutzern offen.


Gemini soll sich verstärkt in Richtung KI-Agenten entwickeln und benötigt dafür nicht nur umfangreichen Zugriff auf Informationen, sondern auch Interaktionsmöglichkeiten – und diese will Google mit Gemini Computer use noch stärker zur Verfügung stellen. Entwickler können jetzt mit Gemini 3.5 Flash – also dem aktuellen Standardmodell – die Computerbedienung als Werkzeug verwenden. Zuvor war diese Funktion nur über Gemini 2.5 verfügbar.

Interessierte Entwickler können jetzt auf Basis dieses Modells zuverlässige und maßgeschneiderte KI-Agenten bauen, die Inhalte auf dem Bildschirm des Nutzer sehen können, logisch schlussfolgern können und auch selbstständig Aktionen ausführen können. Das gilt sowohl für den Browser als auch die Desktopumgebung oder für Android. Gemini kann den Displayinhalt vollständig sehen, verstehen und auch mit diesem interagieren.

Die Integration bringt laut Google die bisher beste Leistung für komplexe, langfristige Unternehmensaufgaben, wie beispielsweise kontinuierliche Softwaretests oder die Automatisierung von professioneller Wissensarbeit. Da Agenten in Live-Umgebungen agieren, wurde das Modell mit gezieltem „Adversarial Training“ gegen Prompt-Injection-Angriffe abgehärtet. Das sowie zwei neue Sicherheitssysteme sollen für Sicherheit sorgen:

  • Explizite Nutzerbestätigung: Bevor die KI sensible oder unumkehrbare Aktionen ausführt, muss der Mensch zustimmen.
  • Automatischer Stopp: Das System bricht Aufgaben sofort ab, sobald eine indirekte Prompt-Injection erkannt wird.

Die neue Funktion kann ab sofort über die Gemini API und die Gemini Enterprise Agent Platform von Entwicklern und Unternehmen genutzt werden.

[Google-Blog]

Letzte Aktualisierung am 22.06.2026 / Bilder von der Amazon Product Advertising API / Affiliate Links, vielen Dank für eure Unterstützung! Als Amazon-Partner verdiene ich an qualifizierten Verkäufen.


Keine Google-News mehr verpassen:
GoogleWatchBlog bei Google News abonnieren | Jetzt den GoogleWatchBlog-Newsletter abonnieren