Google erweitert die Möglichkeiten seines AI-Assistenten. In der Google Gemini-App ist eine Musikgenerierungsfunktion erschienen, die es erlaubt, vollständige Werke nicht nur aus textlichen Beschreibungen, sondern auch basierend auf Fotos, Dokumenten oder PDF-Dateien zu erstellen. Dies ist ein weiterer Schritt in der Entwicklung kreativer Werkzeuge, die auf künstlicher Intelligenz basieren. Die neue Funktion funktioniert global und unterstützt alle in Gemini verfügbaren Sprachen.
Lyria 3. KI komponiert und schreibt Texte
Für die Musikgenerierung ist das Modell Lyria 3 verantwortlich, das von dem Team von Google DeepMind entwickelt wurde. Das System verwandelt kurze Beschreibungen in fertige Aufnahmen, die etwa 30 Sekunden lang sind.
Der Benutzer kann Folgendes festlegen:
Musikgenre,
Stimmung des Stücks,
Tempo,
Gesangsstil,
Charakter des Sounds.
Das Modell generiert sowohl instrumentale Versionen als auch vollständige Songs mit Text und Gesang. Besonders wichtig ist, dass Lyria 3 auch hochgeladene Dateien analysiert. Es reicht aus, ein Foto, eine Präsentation oder ein Dokument hochzuladen, und das System erstellt basierend auf deren Inhalt einen Text und eine passende Komposition. Die fertigen Aufnahmen erhalten einzigartige Cover, die von dem Modell Nano Banana generiert werden. Die Dateien können heruntergeladen oder per Link geteilt werden.
Dream Track trifft die Creator von Shorts
Google stellt dieselbe Technologie den Video-Creators auf YouTube Shorts zur Verfügung. Die Funktion mit dem Namen Dream Track ermöglicht es, musikalische Hintergründe für kurze Filme zu generieren und kommt schrittweise zu Nutzern außerhalb der Vereinigten Staaten. Die neue Version des Modells bringt eine Verbesserung der Audioqualität im Vergleich zu früheren Tests. Die Stücke haben ausgefeiltere Gesangsmelodien und eine bessere kompositorische Kohärenz. Alle generierten Aufnahmen enthalten ein für das Ohr unsichtbares Wasserzeichen SynthID.
Gemini kann seine Präsenz erkennen und bestätigen, ob die Datei von Googles System erstellt wurde. Das Unternehmen hat auch Sicherheitsmaßnahmen implementiert, um das Kopieren des Stils bestimmter Künstler zu verhindern. Das Eingeben des Namens eines Musikers in das Eingabefeld führt nicht zur Erstellung eines Stücks in seinem Stil, sondern wird lediglich als Inspiration für die Schaffung einer neuen Komposition betrachtet. Google betont, dass das Werkzeug dazu gedacht ist, die Kreativität der Nutzer zu unterstützen und nicht professionelle Creator zu ersetzen.
Eine neue Funktion in Gemini zeigt, wie schnell sich generative Werkzeuge entwickeln. Musik aus einem Foto oder Dokument in einer halben Minute zu erstellen, schien vor kurzem futuristisch, wird heute zu einem Bestandteil mobiler Anwendungen im Alltag. Lyria 3 erweitert die Möglichkeiten der KI um vollwertige Kompositionen mit Gesang, und Dream Track könnte die Art und Weise verändern, wie Inhalte in Shorts erstellt werden.
Quelle: Google
Katarzyna Petru












