Gemini Veo 3: So erstellt ihr den perfekten Prompt für den Videogenerator – Google gibt praktische Tipps

Google hat den starken Videogenerator Gemini Veo 3 in Deutschland gestartet und ermöglicht es jetzt vielen Nutzern, kurze Videos per Prompt zu erstellen. Damit die Ergebnisse auch vorzeigbar sind und das täglich limitierte Kontingent nicht zu schnell verbraucht ist, zeigen wir euch in diesem Artikel einige grundsätzliche Tipps für den perfekten Veo-Prompt. Dieser sollte einem gewissen Aufbau folgen.

Bei immer mehr Menschen ziehen KI-ChatBots in den Alltag ein und damit festigt sich auch die Erfahrung, wie ein guter Prompt aussehen sollte, um sofort die gewünschten Ergebnisse zu erhalten. Der Prompt ist das, was ihr in das Eingabefeld eintragt. Dabei gilt bei KI bekanntlich, je mehr Informationen und Gedanken ihr mitteilt, desto präziser wird das Ergebnis. Das gilt bei den Text-Assistenten genauso wie bei den aufstrebenden Mediengeneratoren.
Gerade im Medienbereich ist ein ausführlicher Prompt sehr wichtig, auch wenn dieser manchmal etwas Zeit in Anspruch nimmt. Vielen Menschen folgen nach wie vor dem Muster, dass sie sofortige Ergebnisse sehen wollen und dabei auch den Prompt so knapp wie möglich halten. Doch weil die KI auch ohne Gegenfragen mit der Inhaltserstellung beginnt, sieht das Ergebnis nicht immer so aus, wie man sich das vorgestellt hat. Wie auch, wenn man die eigenen Vorstellungen nicht mitgeteilt hat?
Bei Text sind genaue Informationen hilfreich, bei Bild sind sie sehr wichtig und bei Video praktisch unerlässlich. Und so darf ein Video-Prompt auch einmal eine Handvoll oder mehr Zeilen füllen. Es ist nicht so, dass zu viele Details die KI verwirren würden – sondern genau umgekehrt. Je mehr Details, desto weniger muss die KI halluzinieren. Immerhin erstellen wir 8 Sekunden-Videos mit 24 FPS. Also knapp 200 Bilder.
- Der/die Hauptcharakter/in: Wer oder was ist der Star eures Videos? Veranschaulicht und beschreibt euren Hauptcharakter: Sagt nicht nur „ein Hund“, sondern „ein flauschiger Golden Retriever mit Sonnenbrille und Smoking“. Ob es zwei lachende Freunde, ein sprechendes Croissant oder ein Hund im Anzug sind – gebt so viele Details wie möglich!
- Die Szene: Wo spielt die Handlung? Entführt die Zuschauer*innen an einen „tropischen Strand im Sturm“, in ein „Raumschiff, das durch den Weltraum schwebt“ oder in ein „gemütliches Cottage, an dessen Fenster der Regen prasselt“. Beschreibt die Atmosphäre durch Licht und Farbe – sollen es warme Töne oder ein nebliger Sonnenuntergang sein?
- Die Aktion: Was passiert? Das ist der Kern eurer Geschichte. Fliehen eure Charaktere „vor einem riesigen Felsbrocken“? Geben sie ihren „Zimmerpflanzen einen Motivationsschub“? Oder „tanzen sie, als würde niemand zusehen“?
- Stimmung & Stil: Wie soll das Video gestaltet sein und sich anfühlen? Definiert die Ästhetik, um die gewünschte Atmosphäre einzufangen. Soll euer Video „im Anime-Stil”, wie ein „Film Noir” oder wie ein „VHS-Video der 1980er” aussehen? Die Stimmung kann „dramatisch“, „spannend“, „chaotisch“ oder im Stil einer „Sitcom aus den 70ern” sein.
- Die Kraft des Klangs: Die Superkraft von Veo 3! Das ist eure Chance, Magie in das Video einfließen zu lassen. Fügt Soundeffekte wie „hupende Autos“ oder „fröhliches Vogelgezwitscher“ hinzu. Gebt Anweisungen für Dialoge, indem ihr eine Figur „nervös flüstern“ oder „wütend schreien“ lasst.
Beachtet ihr die obigen Punkte, kommt ihr sehr viel schneller zum Ergebnis. Der Aufbau des Prompts ist zweitrangig, viel wichtiger ist der Inhalt. Der Vergleich mag hinken, aber vielleicht könnte man es mit dem klassischen Notruf vergleichen: Wo, was, wer, wie viele und Reaktion auf mögliche Gegenfragen. Ist all das enthalten, kann die Gemini-KI ausrücken und den gewünschten Inhalt erstellen.
Google selbst schreibt, dass ihr eure Anfragen mit Bedacht wählen solltet, denn die Anzahl der verfügbaren Generierungen pro Tag ist limitiert. Tippt also nicht drauf los und verbessert euch mehrfach, sondern macht euch Gedanken. Schreibt nicht zu wenige Informationen – aber auch nicht zu viel. In der Ankündigung heißt es, dass manche Ideen und Beschreibungen einfach zu komplex für ein 8-Sekunden-Video sein können und sich daher nicht realisieren lassen. Dann heißt es nicht konkretisieren, sondern vereinfachen.
Und wer die Grundlagen erst einmal beherrscht, kann später zu den Regie-Anweisungen für Fortgeschrittene übergehen, die wir euch hier in Kürze im Blog präsentieren.
» Jetzt bis zu vier Monate Amazon Music Premium Gratis sichern
» Drei Monate Audible Hörbücher und Podcasts kostenlos
» Kostenlose Amazon Visa Kreditkarte mit Startguthaben und 2 Prozent Cashback sichern
GoogleWatchBlog bei Google News abonnieren | GoogleWatchBlog-Newsletter