Künstliche Intelligenz: Neues Google-Projekt generiert überraschend realistische Bilder aus Text (Galerie)

Veröffentlicht am 16. Juli 2022 von Jens

Die automatische Erkennung von Inhalten auf Fotos ist für einige Google-Entwickler ein größeres Thema und wird in einigen Produkten seit vielen Jahren eingesetzt. Mittlerweile geht man aber auch den umgekehrten Weg und möchte aus einem eingegebenen Text dynamisch ein realistisches Bild erzeugen. Mit der neuen Plattform Imagen wurde nun eine Demo veröffentlicht, die die Möglichkeiten der Künstlichen Intelligenz zeigen soll.

Bildmanipulation und Bilderzeugung sind große Themen, die in Zukunft eine immer größere Rolle spielen werden – und offenbar ist auch Google vorn mit dabei. Erst vor wenigen Tagen wurde das Projekt Parti angekündigt und jetzt hat man mit Imagen ein zweites Projekt veröffentlicht, das genau die gleiche Leistung bietet. Man setzt auf unterschiedliche Konzepte und Herangehensweisen, aber die Verwendung durch den Endnutzer ist die Gleiche: Text eingeben und Bild erhalten.

Es geht es aber nicht nur um einfache Formen oder die Kombination mehrerer Elemente als Collage, sondern um realistische Darstellungen. Googles Forscher haben sehr viele Beispielbilder sowie eine interaktive Webseite veröffentlicht, auf der sich interessierte Nutzer von den Möglichkeiten und der Qualität überzeugen können. Auf den Bildern ist genau das zu sehen, was beschrieben wurde und sogar der Stil kann in der Anfrage festgelegt werden. Möchte man ein Foto, eine Grafik oder ein Kunstwerk angelehnt an den Stil eines berühmten Künstlers?

Für dieses Projekt stoßen viele KI-Bereiche zusammen: Text erkennen und verstehen, Zusammenhänge verstehen, Objekte in der Bilddatenbank finden oder erzeugen und anschließend zu einem fertigen Bild zusammensetzen. Der letzte Schritt ist vermutlich der mit Abstand schwerste und das Kernprodukt von Parti und Imagen. Schaut euch einmal die folgenden Beispielbilder an.

Man muss festhalten, dass all diese Bilder nicht als Original existieren. Sie wurden von den Algorithmen zusammengesetzt, ohne dass man das (meiner Meinung nach) sehen kann. Größen, Farben, Schatten, Überlappungen oder sonstige Interaktionen zwischen mehreren Objekten sind sehr gut umgesetzt und sorgen dafür, dass man nicht auf die Idee kommen würde, dass es ein künstlich erzeugtes Bild ist. Aus diesem Grund ist jedes Bild auch mit einem kleinen Wasserzeichen versehen, um diese unterscheiden zu können.

Eine solche Technologie ist aber nicht nur beeindruckend, sondern hat hohes Missbrauchspotenzial. Man könnte praktisch beliebige Szenerien erzeugen, die andere Menschen in Verruf bringen können. Schon seit vielen Jahren ist es dank Photoshop & Co bekanntlich möglich, Fotos extrem realistisch zu fälschen oder zumindest anzupassen. Doch Tools wie Imagen und Parti sind da noch einmal auf einem völlig anderen Level und können die Grundlage für Fälschungen liefern.

Daher hat man sich bei Google entschieden, diese Technologie zwar zu präsentieren, aber noch nicht vollwertig nutzbar zu machen. Man möchte Sicherheitsbeschränkungen einführen, die noch nicht näher benannt sind, bevor so etwas freigegeben wird. Früher oder später wird es sicherlich Tools geben, die so etwas für Jedermann nutzbar machen, aber noch ist es nicht soweit. Schaut euch die Webseite einmal an, dort gibt es auch Beispielbildern mit Fehlern, die die aktuellen Limits und Stolpersteine der Technologie aufzeigen.

» Imagen

» Parti

» Googles Künstliche Intelligenz: Googler will Bewusstsein entdeckt haben – wenn die Simulation zur Realität wird

» Googles Künstliche Intelligenz: Sind zukünfige Produkte durch Diskussionen um das KI-Bewusstsein gefährdet?

» Google in der Krise? Einige Produkte sollen eingestellt oder zusammengelegt werden – so soll es weitergehen

[Google-Blog]

Keine Google-News mehr verpassen:
GoogleWatchBlog bei Google News abonnieren | GoogleWatchBlog-Newsletter