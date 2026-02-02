Google baut den Umfang des KI-Modells Gemini immer weiter aus, ist längst im multimedialen Bereich sehr breit vertreten und geht nun den nächsten Schritt: Das im vergangenen Jahr erstmals gezeigte Gemini Genie 3 wurde jetzt für erste Nutzer veröffentlicht und soll selbst KI-Videogeneratoren in den Schatten stellen. Genie 3 erzeugt umfangreiche virtuelle Welten, die sich grenzenlos durchschreiten und mit Zwischenspeicher entdecken lassen.



Die Entwickler von Google Deepmind arbeiten schon seit langer am KI-Modell Genie, das vor einigen Monaten in der dritten Generation vorgestellt wurde, die als erste endlich für den großen Auftritt bereit ist. Mit Genie 3 bietet man nun die Möglichkeit, virtuelle Welten per Prompt zu erstellen, die sich dynamisch anpassen lassen, sich theoretisch unendlich vergrößern lassen und vom Spieler durchschritten werden können. Man kann sich das Ganze wie ein Open World-Videospiel vorstellen – nur ohne Designer und vielleicht mit mehr Realismus.

Die virtuelle Welt kann von den Spielern aus der Ich-Perspektive oder auch aus der Verfolgerperspektive durchschritten werden, wobei sowohl die eigene Rolle als auch alle Details dieser Welt festgelegt werden können. So könnt ihr beispielsweise als Maler durch ein Haus laufen, mit dem Hubschrauber durch die Wüste fliegen oder einfach zu Fuß durch Steppen oder Städte rennen. Selbst in der Rolle eines Fisches kann man durch die Ozeane schwimmen. Im unten eingebundenen Video seht ihr eine Reihe von Beispielen und auch die Interaktionsmöglichkeiten.

Ihr könnt die Welt jederzeit beeinflussen. Dazu wird einfach ein Prompt geöffnet, in dem der Wunsch wie gewohnt angegeben werden kann: Soll plötzlich ein Hubschrauber vorbeifliegen, ein Dinosaurier durch den Fluss stapfen oder ein Jetski vorbeifahren, der euch dann auch nassspritzt? Alles jederzeit möglich. Schaut euch das Video einmal an, in dem die Möglichkeiten von Genie 3 sehr gut gezeigt werden.









Aber es gibt nicht nur die Live-Generierung, sondern auch den Live-Speicher. Kehrt ihr zu einem Teil der Welt zurück, in dem ihr bereits gewesen seid, wird dieser exakt gleich aussehen. Selbst die von euch möglicherweise vorgenommenen Änderungen oder Interaktionen werden gespeichert. Ihr könnt also jederzeit an eine Stelle zurückkehren und auch die dort von euch vorgenommenen Änderungen werden weiterhin verfügbar sein. Gezeigt wird das am Beispiel des Malers, der ein Zimmer anstreicht, einen Rundgang unternimmt und anschließend wieder die bereits begonnene Wand sehen kann.

Google hat dem KI-Modell noch viele Grenzen gesetzt, etwa eine Limitierung auf 60 Sekunden oder auch eingeschränkte Generierungen für gewisse Situationen. Dennoch ist das schon jetzt mehr als beeindruckend und soll in Zukunft nicht nur für Videospiele zum Einsatz kommen, sondern perspektivisch auch für den privaten Gebrauch – vielleicht mit Real World-Integration für AR-Brillen. Weitere technische Daten: Die Welten sind zwar endlos, doch die Konsistenz kann man nur für maximal zehn Minuten versprechen – was beim derzeitigen 60 Sekunden-Limit kein Problem ist. Die Navigation durch die Welten erfolgt mit 24 Frames bei 720p. Auch da ist noch Luft noch oben.

Laut Google sind die Welten physisch korrekt. Das bedeutet, dass Umgebungen, Licht, Wasser und sämtliche Materialien sich so verhalten, wie sie es auch in der Natur tun würden. Google hat das KI-Modell jetzt in der ersten öffentlichen Generation gestartet, die allerdings nur für ausgesuchte US-Nutzer mit einem aktiven Google AI Ultra-Abo verfügbar ist. Es wird wohl noch einige Monate dauern, bis man sich für weitere Nutzer öffnet.

[Google-Blog]

