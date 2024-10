Zu Googles KI-Modell Gemini gehört dank des multimodalen Ansatzes auch die Möglichkeit, Bilder zu vearbeiten oder auf Anfrage neue zu generieren. Jetzt macht das darunterliegende Modell Imagen 3 einen großen Schritt und ist ab sofort für alle Nutzer kostenlos und unbegrenzt verfügbar. Sowohl qualitativ als auch funktionell hat man sehr stark zugelegt und den Bildgenerator auf ein neues Level gebracht.



Der in Google Gemini integrierte Bildgenerator Imagen wird schon seit einigen Wochen schrittweise ausgerollt und wurde jetzt laut offizieller Ankündigung für alle Nutzer freigeschaltet – auch in Deutschland. Das neue Modell erzeugt laut Googles Ankündigung qualitativ hochwertige Bilder, die von Nutzern in allen verfügbaren Sprachen erstellt werden können. Laut Google setzt man einen neuen Standard für Bildqualität und generiert die Bilder mit nur wenigen Worten. Imagen 3 unterstützt dabei auch verschiedene Stile vom fotorealistischen Landschaften über strukturierte Ölgemälde bis hin zu skurrilen Claymation-Szenen, die sich großer Beliebtheit erfreuen.

Imagen 3 bringt erweiterte Bildgenerierungsfunktionen mit integrierten Sicherheitsvorkehrungen und entspricht natürlich Googles vor langer Zeit veröffentlichten Produktdesignprinzipien. Betont wird das vor allem aus dem Grund, weil man nun Fotos mit Menschen erzeugen kann. In vielen Benchmarks schneidet Imagen 3 im Vergleich zu anderen verfügbaren Bildgenerierungsmodellen gut ab. Gut, nicht sehr gut oder überragend. Und wie schon bei Imagen 2 verwendet man SynthID, ein Tool für Wasserzeichen und zum Identifizieren von KI-generierten Bildern.

Googles Designprinzipien besagen: Die Nutzer behalten von Anfang bis Ende die Kontrolle über den kreativen Prozess. Wenn das erste Bild, das ihr erhaltet, nicht euren Erwartungen entspricht, sagt Gemini einfach, was ihr ändern möchtet, und ihr erhaltet ein neues Bild.

