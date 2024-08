Google hat vor wenigen Tagen ein großes Update für den Gemini Bildgenerator angekündigt, der auf Basis von Imagen 3 nicht nur einen großen qualitativen Sprung machen soll, sondern auch einen funktionellen. Denn erstmals wird es möglich sein, sich von der Künstlichen Intelligenz Bilder erzeugen zu lassen, auf denen Menschen abgebildet sind. Ein riskanter, aber sicherlich notwendiger Schritt.



KI-Bildgeneratoren gibt es mittlerweile in großer Anzahl, aber nur wenige können eine wirklich gute Qualität vorweisen und auf den ersten Blick täuschend echte Fotos generieren. Googles Imagen 3 gehört nach eigenen Angaben dazu, hat bisher aber eine absichtliche Schwachstelle gehabt – wenn man es so nennen will. Denn Gemini bzw. Imagen konnten bisher keine Fotos generieren, auf denen Menschen abgebildet sind.

Weil man bei Google natürlich sehr genau weiß, dass es so mancher Konkurrent nicht ganz so eng sieht und es ohnehin auch zahlreiche Personen-Generatoren gibt, musste man diese Einschränkung irgendwann aufheben – und das tut man jetzt. Allerdings öffnet man nicht jegliche Schranken, sondern bewegt sich weiterhin in einem Rahmen. So wird es nur möglich sein, generische Personen mit sehr grober Bezeichnung zu erzeugen, aber keine detaillierten Gesichter. Damit soll verhindert werden, dass Fake-Bilder erstellt werden.

Google schreibt: „Die Erzeugung fotorealistischer, identifizierbarer Personen, die Darstellung von Minderjährigen oder übermäßig blutiger, gewalttätiger oder sexueller Szenen wird von uns nicht unterstützt. Natürlich wird nicht jedes Bild, das Gemini erstellt, perfekt sein, aber wir werden weiterhin auf das Feedback unserer Early Access Gemini Advanced Nutzer*innen hören und die Funktion weiter verbessern.“









Durch den Ausschluss von identifizierbaren Personen, minderjährigen Personen sowie der Darstellung von übermäßiger Gewalt und sexuellen Abbildungen hat man schon mal viele Grenzen gesetzt, die für Entrüstung sorgen könnten. Dennoch sorgen solche KI-Bilder und die dargestellten Szenerien immer wieder für Diskussionen, gerade dann, wenn ein reichweitenstarkes Produkt aus dem Hause Google eine solche Funktion einführt und nur wenige Knopfdrücke entfernt nutzbar macht.

Aber auch solche Grenzen könnten irgendwann aufgeweicht werden. Gewalt und sexuelle Darstellungen sicherlich nicht, aber detaillierter beschriebene Personen oder Kinder sind sicherlich etwas, auf das man (in guter Absicht!) langfristig nicht verzichten will oder kann. Das gilt dann auch für den Magic Editor, der bekanntlich auch Personen verschieben, ausblenden oder neuerdings durch die Add Me-Funktion auch einblenden kann. Bis zum „verändern“ von Personen ist es nur noch ein kleiner Schritt.

Zunächst wird die Personengenerierung nur für Nutzer von Gemini Advanced, Gemini Business und Gemini Enterprise und auch nur in englischer Sprache geben. Die Sprachbarriere soll schnell fallen, die Zugänglichkeit für alle Nutzer könnte wohl noch etwas länger bestehen.

[Google-Blog]