Google hat vor wenigen Wochen den neuen KI-Musikgenerator Lyria veröffentlicht, der das KI-Modell um den letzten weißen Flick im Medienbereich bereinigt hat. Viele Nutzer dürften das Tool wohl schon ausprobiert haben und vielleicht auch hörbare Ergebnisse erzielt haben. Wer mehr herausholen möchte, bekommt jetzt Tipps und Tricks für den perfekten Prompt.
Gemini ist im Medienbereich sehr stark aufgestellt und hat mit dem breiten Start von Lyria kürzlich den gesamten Markt der Musikgeneratoren auf den Kopf gestellt – denn das Tool ist kostenlos und unbegrenzt für alle Nutzer verfügbar. Die allermeisten Menschen dürften zwar einen Bezug zur Musik haben, aber eben nur auf der Zuhörer-Seite unterwegs sein, sodass man gar nicht so genau weiß, wo man mit einem Prompt für die Musikerstellung überhaupt beginnen soll.
Ihr könnt Gemini natürlich mit einem sehr einfachen Prompt und wenigen Wörtern füttern, sodass die KI den allergrößten Teil der Kreativarbeit übernimmt – aber dann darf man natürlich auch keine Ergebnisse erwarten, die einem selbst gefallen. Die Wahrscheinlich wäre in etwa gleich, wenn ihr Gemini darum bittet, ein zufälliges Bild zu generieren und darauf zu hoffen, dass es euch gefällt. Wir haben euch erst vor wenigen Tagen viele beeindruckende Lyria-Beispiele inklusive Hörproben und Prompts gezeigt.
Jetzt schauen wir uns einmal an, wie ein perfekter Prompt aufgebaut sein muss, um hörbare Ergebnisse zu erzeugen, die vielleicht auch euren Geschmack treffen. Google hat dafür wieder eine Art Anleitung veröffentlicht, die ihr euch einmal ansehen solltet. Dabei zieht man noch einmal die Analogie zur Malerei: Die KI fungiert als Pinsel, aber ihr bleibt die Maler. Damit das auch im Musikbereich gilt, könnt ihr die folgenden Tipps beherzigen.
Das ist die Formel, die laut Google-Experten derzeit den perfekten Prompt für Gemini Lyria formt. Die Reihenfolge spielt dabei keine große Rolle, macht es euch aufgrund der ansteigenden Detailtiefe aber einfacher, den Prompt in natürlicher Sprache zu formulieren. Schauen wir uns einmal die einzelnen Bestandteile dieses Prompts an:
Musik
Im ersten Teil des Prompts wird die reine Musik beschrieben, die aus der Angabe des Genres und wahlweise auch der Ära besteht. Außerdem könnt ihr das Tempo und die Stimmung festlegen sowie gewünschte Instrumente anfordern, denen musikalische Anweisungen und mehr geben.
Genre & Ära
Die Lyria-KI kennt spezifische regionale Sounds und kann auch mit genreübergreifenden Fusionen umgehen. Ihr müsst also nicht nur simpel nach Pop oder Rock fragen, sondern könnt auch nach „Moderner Electronic Dance Music gemischt mit Europop“ fragen. Oder weist Lyria auch an, eine „Fusion aus Metal und Rap“ zu erstellen. Ihr könnt sogar Epochen wie „französischer Yé-Yé-Pop der 60er“ oder „Bay Area Hyphy“ angeben, um eine bestimmte Essenz einzufangen.
Tempo & Stimmung
Steuert die Energie, indem ihr die Beats Per Minute (BPM) im Prompt mit angebt. Verwendet „170 BPM für Drum and Bass“ oder eine „Langsame 60 BPM Ballade“, um das Tempo nach euren Wünschen vorzugeben. Ihr könnt sogar bestimmte Taktarten wie einen „3/4-Walzertakt“ anfordern.
Instrumente
Das Modell greift standardmäßig auf eine Standard-Instrumentierung zurück. Möchtet ihr etwas ausgefalleneres, müsst ihr präzse sein und einzigartige Texturen in den Prompt integrieren. Versucht beispielsweise eine Anfrage wie „Eine schmutzige, verzerrte Bassline, die gegen saubere, knackige Hi-Hats ankämpft“ oder „Warme, analoge Synthesizer-Pads, die unter einer trockenen, intimen Akustikgitarre anschwellen“.
Stimme
Laut Google ist die Stimme „der Schlüssel zur wahren Magie“. Klar, der Text und auch die Stimme machen den Song überhaupt erst aus. Um sicherzustellen, dass sich das Audio natürlich und nicht künstlich oder komisch anhört, könnt ihr ein detailliertes Interpretenprofil angeben. Bei vielen KI-generierten Musikinhalten wird oft die Ungenauigkeit kritisiert, doch mit den richtigen Anweisungen könnt ihr diese in den Griff bekommen.
Stimmfare
- Weiblicher Sopran: „Klare, kristalline Klangfarbe… fähig, pfeifende hohe Töne zu treffen“.
- Gealterter Rocker: „Rau und texturiert mit einer kiesigen Klangfarbe, die an den Grunge der 90er erinnert“.
- Männlicher Bariton: „Tief, schokoladig und samtweich“.
Textthema
Die Vorgabe eines Textes bleibt ganz euch überlassen. Möchtet ihr ein Thema oder ganz konkrete Zeilen, teilt Lyria das einfach mit. Probiert das einfach einmal aus.
» Einige Lyria-Beispiele von Google Gemini