Gemini 2.0: Das ist Googles neuer Bildgenerator Imagen 3 – erzeugt beeindruckende Aufnahmen (Galerie)

Google arbeitet schon seit Jahren am Bildgenerator Imagen, der mittlerweile ein Teil des Gemini-Universums geworden ist und kürzlich als Imagen 3 in der dritten Generation erschienen ist. Mit Imagen 3 auf Basis von Gemini 2.0 soll die Plattform eine ganz neue Qualität erreichen und mit fotorealistischen Aufnahmen bis hin zu Ergebnissen in allen von den Nutzern gewünschten Stilen überzeugen. Hier findet ihr einige Beispiele.

Bildgeneratoren sind beeindruckende Werkzeuge, die über viele Jahre hinter den verschlossenen Türen der KI-Labore geblieben sind, aber mittlerweile in großer Anzahl für alle Nutzer zur Verfügung stehen – zum Teil auch in kostenlosen und breit verfügbaren Varianten. Google war mit Imagen lange Zeit der gefühlte Vorreiter in diesem Bereich, doch tatsächlich hat sich durch den KI-Boom gezeigt, dass die damals schon gezeigte Qualität mehr Glückssache war und der Bildgenerator eher durchwachsene Ergebnisse ausspuckt.
Mit Imagen 3 auf Basis von Gemini 2.0 soll sich das ändern, denn man hat nach eigenen Angaben qualitativ deutlich nachgelegt. Die Bilder sollen nun beeindruckender sein, die Komposition – also Zusammenstellungen – der einzelnen Elemente realistischer und logischer sein. Außerdem lassen sich noch mehr Kunststile anfragen, man hat an der Genauigkeit gearbeitet und bietet vom Fotorealismus bis hin zu Impressionismus und abstrakten Aufnahmen bis zum Anime alle gewünschten Richtungen.
Auf den folgenden Bildern könnt ihr euch von der Leistung von Imagen 3 überzeugen. Diese wurden von Google rein mit dem eigenen Bildgenerator erstellt und sollen nicht nachträglich bearbeitet worden sein. Denn Gemini soll auch die Eingabeaufforderung der Nutzer noch besser als bisher verstehen, mehr Details herausziehen, Zusammenhänge logischer verknüpfen und dabei Motive entstehen lassen, wie sie sich der Nutzer tatsächlich vorgestellt hat. Schaut euch die folgenden Beispiele einmal an.
Laut den Angaben im Google-Blog stammen die Bilder aus dem Generator und wurden weder nachträglich bearbeitet noch in irgendeiner Form anders zusammengestellt. Wer sich für die exakten Prompts interessiert, mit denen diese erstellt worden sind, findet sie in der Quelle im Google-Blog. Natürlich ist es gut möglich, dass man diese Prompts unzählige Male abgefeuert hat und irgendwann war mal ein Glückstreffer dabei. Doch laut der Ankündigung soll Imagen 3 auf Basis von Gemini 2.0 auch in Blindtests sehr gut abschneiden und der deutliche Gewinner unter den Bildgeneratoren sein.
Dass Imagen jetzt auch Menschen generieren kann, war für einige Monate kaum denkbar und hat zu großen Diskussionen aufgrund von ungleichen Zusammenstellungen geführt. Daher hat man eine Reihe von nicht näher genannten Schutzmaßnahmen eingeführt und letztendlich ist auch entscheidend, wie der Prompt der Nutzer aussieht.
Wer das Ganze ausprobieren möchte, benötigt zum einen ein Gemini Advanced-Abo sowie einen Zugang zu Google Labs, um es unter der Bezeichnung ImageFX auszuprobieren.
GoogleWatchBlog bei Google News abonnieren | GoogleWatchBlog-Newsletter