Die Android-App der Fotoplattform Google Fotos hat in den letzten Monaten große Schritte bei der KI-Bildbearbeitung gemacht und jetzt steht der nächste Ausbau an: Die zunächst exklusiv für die Pixel 10-Smartphones angebotene KI-Bildbearbeitung per Spracheingabe startet jetzt für alle US-Nutzer und dürfte schon sehr bald ohne weitere Einschränkungen für alle Nutzer freigegeben werden.



Die KI-Bildbearbeitung in Google Fotos gehört mittlerweile zu den wichtigsten Funktionen der App und baut diesen Bereich immer weiter aus. Im Laufe der letzten Monate gab es zunächst eine neue Oberfläche für den gesamten Bearbeitungsbereich, man hat die KI-Vorschläge tiefer als bisher nach Auswahl eines Objekts integriert und mit „conversational editing“ wurde erst vor wenigen Wochen ein Feature eingeführt, dass die zukünftige Ausrichtung der Bildbearbeitung zeigt.

Im Rahmen dieser Funktion haben die Nutzer die Möglichkeit, ein Foto per Spracheingabe oder Text zu bearbeiten, ohne selbst konkret Hand an das Foto anlegen zu müssen. Es muss einfach nur der Bearbeitungswunsch beschrieben werden, wie etwa „klare den Himmel auf“, „entferne die Sonnenreflexionen“ oder „entferne die Personen aus dem Hintergrund“ und die KI wird dies entsprechend umsetzen. Dabei kommt ein ganzer Schwung an KI-Funktionen dazu, die im Hintergrund zusammenarbeiten.

Die verwendete Gemini-KI kann nicht nur Objekte und Personen in Bildern erkennen, sondern das abgebildete Szenario tatsächlich lesen und verstehen, worum es in einem Bild oder Foto geht. Daher kann es selbst Optimierungen wie „make it better“ automatisiert vornehmen und ein Bild nach objektiven Punkten optimieren. Anschließend erfolgt die Objekterkennung, dann das Herauslösen, Bearbeiten und Generieren von neuen Inhalten. Im Folgenden seht ihr einige Beispiele.

















Das Prompt-Feld für diese KI-Fotobearbeitung befindet sich unter jedem Bild im Editor und kann somit schnell verwendet werden. Es lassen sich auch mehrere Wünsche zugleich äußern, sodass keine unnötigen Wartezeiten oder Einzelschritte entstehen – ihr könnt es in den obigen Beispielvideos sehen. Selbst die Wiederherstellung von alten abfotografierten Fotos durch Colorierung, Entfernung von Beschädigungen, Optimierung von Perspektiven und mehr ist möglich.

Dank der starken visuellen Gemini-Funktionen kann die KI alle notwendigen Schritte von selbst gehen: Das beginnt bei der Bilderkennung für die Auswahl, bei der Feststellung der Probleme und Auswahl der Filter und Werkzeuge bis zur Anwendung der jeweiligen Filter, möglicherweise dem Generieren von zusätzlichen Inhalten bis zur Komposition des fertigen Motivs.

Zunächst stand die Funktion nur für Pixel 10-Nutzer zur Verfügung. Jetzt startet man sie für alle US-Nutzer ohne weitere Voraussetzungen, es ist also kein Abo oder Pixel notwendig. Dem globalen Start in wenigen Tagen oder Wochen sollte also nichts mehr im Wege stehen.

