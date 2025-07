Google will den KI-Videogenerator Veo 3 so vielen Nutzern wie möglich zugänglich machen und gibt bei der Verbreitung derzeit richtig Gas: Kürzlich ist das Gemini-Tool für viele Google One-Abonnenten und auch Pixel 9-Nutzer gestartet, die mit nur wenigen Worten ganze Videoclips generieren können. Damit eure Ergebnisse optimal aussehen, findet ihr in diesem Artikel sehr viele Google-Tipps für den perfekten Prompt.



Es sind gerade einmal gute drei Jahre vergangen, seitdem die KI-ChatBots ihren Durchbruch erreichen konnten und auch erste Bildgeneratoren so langsam für die breite Masse zugänglich gemacht worden sind. Von KI-Videogeneratoren war damals schon die Rede, doch wirklich ernstzunehmen waren sie nicht. Das hat sich spätestens mit Googles Start von Gemini Veo 3 geändert, denn der KI-Videogenerator kann unglaublich gute Ergebnisse vorweisen – wenn man ihn denn richtig bedient.

Ein Video kann nur so gut sein wie der Prompt, mit dem es erstellt worden ist. Je detaillierter ihr eure Vorstellung beschreibt, desto besser wird das Ergebnis und kann auch tatsächlich so aussehen, wie es sich im eigenen Kopfkino abgespielt hat. Doch weil KI-Videogeneratoren für viele Nutzer noch ein sehr neues Feld sind, hat Google jetzt eine ganze Reihe von Tipps für Einsteiger und Fortgeschrittene veröffentlicht, um den perfekten Prompt zusammenzustellen.

Bei der KI-basierten Erstellung eines Videos sind Details unerlässlich. Denn alles, was ihr dem Tool nicht mitteilt, muss von diesem selbst ausgewürfelt werden und sieht dementsprechend nicht so aus, wie ihr euch das vorgestellt habt. Es ist nicht so, dass zu viele Details die KI verwirren würden – sondern genau umgekehrt. Je mehr Details, desto weniger muss die KI halluzinieren. Immerhin erstellen wir 8 Sekunden-Videos mit 24 FPS. Also knapp 200 Bilder. Hier findet ihr einen ganzen Schwung an Tipps:









Wichtige Grundlagen für den perfekten Prompt

Der/die Hauptcharakter/in: Wer oder was ist der Star eures Videos? Veranschaulicht und beschreibt euren Hauptcharakter: Sagt nicht nur „ein Hund“, sondern „ein flauschiger Golden Retriever mit Sonnenbrille und Smoking“. Ob es zwei lachende Freunde, ein sprechendes Croissant oder ein Hund im Anzug sind – gebt so viele Details wie möglich! Die Szene: Wo spielt die Handlung? Entführt die Zuschauer*innen an einen „tropischen Strand im Sturm“, in ein „Raumschiff, das durch den Weltraum schwebt“ oder in ein „gemütliches Cottage, an dessen Fenster der Regen prasselt“. Beschreibt die Atmosphäre durch Licht und Farbe – sollen es warme Töne oder ein nebliger Sonnenuntergang sein? Die Aktion: Was passiert? Das ist der Kern eurer Geschichte. Fliehen eure Charaktere „vor einem riesigen Felsbrocken“? Geben sie ihren „Zimmerpflanzen einen Motivationsschub“? Oder „tanzen sie, als würde niemand zusehen“? Stimmung & Stil: Wie soll das Video gestaltet sein und sich anfühlen? Definiert die Ästhetik, um die gewünschte Atmosphäre einzufangen. Soll euer Video „im Anime-Stil”, wie ein „Film Noir” oder wie ein „VHS-Video der 1980er” aussehen? Die Stimmung kann „dramatisch“, „spannend“, „chaotisch“ oder im Stil einer „Sitcom aus den 70ern” sein. Die Kraft des Klangs: Die Superkraft von Veo 3! Das ist eure Chance, Magie in das Video einfließen zu lassen. Fügt Soundeffekte wie „hupende Autos“ oder „fröhliches Vogelgezwitscher“ hinzu. Gebt Anweisungen für Dialoge, indem ihr eine Figur „nervös flüstern“ oder „wütend schreien“ lasst.

Beachtet ihr die obigen Punkte, kommt ihr schneller zum Ergebnis. Der Aufbau des Prompts ist zweitrangig, viel wichtiger ist der Inhalt. Der Vergleich mag hinken, aber vielleicht könnte man es mit dem klassischen Notruf vergleichen: Wo, was, wer, wie viele und Reaktion auf mögliche Gegenfragen. Ist all das enthalten, kann die Gemini-KI ausrücken und den gewünschten Inhalt erstellen.









Regieanweisungen für die Kamera

Mit Gemini könnt ihr auch im Regiestuhl Platz nehmen und detaillierte Anweisungen an die KI-Kamera weitergeben. Damit lässt sich nicht nur die Handlung, sondern auch die Szenerie beeinflussen. Von der Gesamtdarstellung über Kamerafahrten und Perspektiven bis hin zu Kameraeffekten. Was damit alles möglich ist, findet ihr beispielhaft in folgender Liste.

Kamerabewegungen

Nahaufnahme: Fordert z.B. eine „Nahaufnahme der Augen einer Person“ an.

Luftaufnahme: Beschreibt z.B. eine „Luftaufnahme eines Waldes bei Einbruch der Dunkelheit“.

Zoom: Nutzt z.B. einen „langsamen Zoom von einer Weitwinkelaufnahme auf den Mund einer Person“.

Dolly-Fahrt (Dolly): Eine Bewegung der gesamten Kamera vorwärts oder rückwärts auf Schienen.

Schwenk (Pan): Eine horizontale Bewegung der Kamera auf einer festen Achse.

Kameraperspektiven

Froschperspektive (Low-Angle Shot): Lässt euer Motiv größer und mächtiger erscheinen.

Vogelperspektive (High-Angle Shot): Lässt euer Motiv kleiner und verletzlicher wirken.

Point-of-view (POV): Zeigt die Szene aus der Perspektive einer Figur.

Fokus und Licht

Geringe Schärfentiefe (Shallow Depth of Field): Isoliert euer Hauptmotiv, indem nur ein kleiner Teil des Bildes scharf ist.

Low-Key-Beleuchtung: Schafft eine dunkle, dramatische Atmosphäre mit starken Schatten.

Farbkorrektur (Color Grading): Bittet um eine bestimmte Farbgebung, wie zum Beispiel „warme Farbtöne wie Rot, Orange und Gelb“, um ein Gefühl von Wärme zu erzeugen.

Stil und Genre

Filmisch / Cineastisch: Ein Stil, der das Aussehen und die Anmutung von Spielfilmen nachahmt.

Dokumentarisch : Ein Stil, der Realismus und Authentizität betont.

Vlog-Stil: Ein Stil, der informell und gesprächig ist.

Abstrakt: Nicht-gegenständlicher visueller Stil.

Surreal: Traumhafter oder bizarrer visueller Stil.

Minimalistisch: Einfacher und aufgeräumter visueller Stil.

Retro: Ein Stil, der eine vergangene Ära nachahmt.

Bewegter Zeitraffer / Hyperlapse: Eine Zeitraffertechnik mit einer sich bewegenden Kamera.

Zeitlupe: Filmmaterial, das mit reduzierter Geschwindigkeit abgespielt wird.

Zeitraffer: Filmmaterial, das aus Bildern besteht, die mit einer sehr niedrigen Bildrate aufgenommen wurden.









Beachtet ihr obige Tipps für die Handlung und auch die Darstellung, lassen sich mit Gemini Veo 3 beeindruckende Videos erstellen, so wie sie im obigen Beispiel zu sehen sind. Viele weitere Videobeispiele findet ihr in diesem Artikel zu Veo 3.

Google selbst schreibt, dass ihr eure Anfragen mit Bedacht wählen solltet, denn die Anzahl der verfügbaren Generierungen pro Tag ist limitiert. Tippt also nicht drauf los und verbessert euch mehrfach, sondern macht euch Gedanken. Schreibt nicht zu wenige Informationen – aber auch nicht zu viel. In der Ankündigung heißt es, dass manche Ideen und Beschreibungen einfach zu komplex für ein 8-Sekunden-Video sein können und sich daher nicht realisieren lassen. Dann heißt es nicht konkretisieren, sondern vereinfachen.

Es ist wirklich beeindruckend, wie schnell sich die Videogeneratoren weiterentwickelt haben. Erst im vergangenen Jahr hat Google das Veo-Projekt überhaupt für die Öffentlichkeit freigegeben, später mit Veo 2 extrem stark nachgelegt, mit dem neuen Veo 2 erst im Mai die ganzen Regie-Anweisungen möglich gemacht und mit Veo 3 den aktuellen Stand inklusive der Kamera-Beeinflussung der Audiospur von Musik über Sounds bis Konversationen geschaffen.