Google hat dem KI-Modell Gemini zuletzt einen ganzen Schwung neuer Bild- und Videogeneratoren spendiert, die in ihren jeweils neuesten Versionen unglaublich starke Fähigkeiten mitbringen. Spätestens an diesem Punkt müssen wir uns allerdings auch fragen, wo diese Entwicklung noch hinzuführen soll und was das schon sehr bald sowohl für die Medienbranche als auch die gesamte Gesellschaft bedeutet.



Wir haben euch hier im Blog in den letzten Wochen die strong>starken Gemini-Mediengeneratoren ausführlich vorgestellt, die als Imagen fotorealistische Bilder erstellen, als Veo fotorealistische Videos mit Ton und als Flow ganze Filme mit aufwendigen Szenerien erstellen kann. Auch wenn ich solche Tools derzeit eher zu Testzwecken als im praktischen Einsatz verwende, habe ich sie erst vor wenigen Tagen als absoluter Wahnsinn mit Wow-Effekt bezeichnet – und dabei bleibe ich auch.

Es ist wirklich unglaublich, welche großen Fortschritte die Künstliche Intelligenz allein in den letzten drei Jahren gemacht hat. Vielleicht war vieles davon hinter verschlossenen Türen schon seit langer Zeit möglich, aber so etwas in der breiten Masse ohne Beta-Label und noch dazu weitgehend kostenlos anzubieten, ist noch einmal eine ganz andere Geschichte. Denn während unter Laborbedingungen auch mal heikles Material herauskommen darf, sollte das im öffentlich zugänglichen Bereich nicht mehr passieren.

Und das führt dann schon zur nächsten Frage aus dem Titel: Wo soll das alles noch hinführen? Noch vor drei bis vier Jahren waren die Ergebnisse der KI-Bildgeneratoren eher zum Schmunzeln als zum Staunen. Und heute erstellen sie ganze Kinofilme mit realistischer Darstellung, absolut korrekter Physik, sinnvoller Handlung, schicken Szenenbildern und (aus Laien-Sicht gesagt) guter Vertonung. Wo stehen wir dann erst, wenn wir nochmal drei Jahre nach vorn springen?









Während die KI viele Jahre eine Herausforderung für Tech-Ingenieure gewesen ist, ist sie es heute eher für die Medienbranche und die gesamte Gesellschaft. Mit der breiten und noch dazu kostenlosen Verfügbarkeit dieser Mediengeneratoren kann man einem Bild oder Video heute kein Vertrauen mehr schenken. Nicht, dass das durch Bild- und Videobearbeitung in den letzten Jahren absolut vertrauenswürdig gewesen wäre, aber der Aufwand und die notwendigen Kenntnisse stehen in keinem Verhältnis zueinander. Ein großes Problem, das sich aus meiner Sicht nicht lösen lässt und sich immer weiter verschärft.

Das ist aber nicht nur im Beweisfall ein Problem, sondern auch für die gesamte Medienbranche. Wer braucht noch Schauspieler? Wer braucht noch Filmstudios? Wer braucht noch gute Drehbücher, Kameraleute, Ton-Ingenieure,…? Wie soll ein 250 Millionen Dollar-Film mit einem 250 Dollar-Film von Gemini Flow mit ähnlichem Ergebnis konkurrieren? Die Film- und Bildflut wird kein Ende kennen, worunter recht schnell auch die inhaltliche Qualität leiden wird. Ähnlich wie heute gesamte Webseiten mit KI-Texten gefüllt werden und echte Autoren nicht mehr lange von ihrer Arbeit leben können, wird das im Bild- und Videobereich sehr ähnlich sein. Ist das wirklich erstrebenswert?

Google ist nur eines von vielen Unternehmen, das solche Mediengeneratoren anbietet, aber dennoch hat man in Mountain View meiner Meinung nach derzeit die größte Verantwortung. Denn Gemini hat die größte Reichweite und kein anderes Unternehmen kann so viele Menschen mit den KI-Integrationen in die großen Produkte erreichen. Das Wettrennen zwischen den großen Anbietern führt eher dazu, dass all das mehr oder weniger unkontrolliert auf die Menschheit losgelassen wird. So toll das auch alles sein mag, so sehr könnte uns alles das schon sehr bald auf die Füße fallen…

