AI/ neuronale Netzwerke für Effekte, Mixing

adrachin · 29.03.24

Wenn Bedarf besteht, hier gibt es Links zu allen Relevanten Gesetzen und Bestimmungen einschliesslich International. Wenn dann die 10 000 - 100 000 hoch X Seiten durchgeackert sind, kann es weitergehen.... (;

Blumfeld · 30.03.24

Und wenn jemand immer noch glaubt das KI was mit maschinellem lernen zu tun hat und sich gruseln möchte:

View: https://www.youtube.com/watch?v=Sq1QZB5baNw

Achtet mal auf die weitergabe des Apfels, das würde kein programmierter Roboter tun. (ich habe früher Roboter programmiert). Und auf die Sprachpause und sein "Ähh"...

Die Modelle sind einfach gut. Ich denke Verwirrung herscht ein bisschen weil die Hersteller immer "neue" Versionen herausbringen (Sonu V1, V2, V3) das aber keine Veränderungen an den Modellen sind sondern nur erweiterte Trainigsversionen,
So ist Stable Diffusion 1.4 mit Laion 5B Bildern in 256 x 256 Pixeln trainiert,
Stable Diffusion 1.5 mit Bildern in 512 x 512 Pixeln
und Stable Diffusion XL mit Bildern in 1024 x 1024 Pixeln. Die Modelle sind gleich geblieben.
Auch im LLM Bereich. ChatGTP 4.0 ist ein Model das sich mit sich selbst unterhält und aus 8 Spezialisierten Chat GTP 3.5 Modellen besteht.

Also fehlt es der Musik KI an Trainigsdaten (s.o.).

Aber wenn erst mal einer das finanziert und das Model mit ALLEM auch aus der Theorie (Mittelalter, Klassik, Jazz, Moderne) trainiert wird kann man ihr sagen, hier habe ich ein schönes Rockriff, zeig mir mal ein Solo dazu in myxolidischer Skala...
braucht eine KI 3 Sekunden...

trichtersoft · 30.03.24

Die rechtlichen Fragen werden Gerichte weltweit in den nächsten Jahren und Jahrzehnten beschäftigen. Das wird wohl kaum hier im Forum geklärt werden.

Die Qualität der Musik, die mit ML Methoden erzeugt werden kann, nimmt derweil immer weiter zu.
Im Thread-Titel geht es im AI für Effekte und Mixing. Inzwischen wird seit mehreren Seiten diskutiert, wie ganze Musikstücke quasi auf Knopfdruck erstellt (und dann per AI wieder in Stems zerlegt) werden können.

Ich bin gespannt wo das alles hinführt.

Hintergrundmusik für Präsentationsvideos, Warteschleifen, ... oder zum Entspannen. Da kann ich mir durchaus vorstellen, dass ein ML Model einfach live endlos Musik mit vorgegebener Stimmung/Atmosphäre erzeugt.

exoslime · 30.03.24

trichtersoft schrieb:
Hintergrundmusik für Präsentationsvideos, Warteschleifen, ... oder zum Entspannen. Da kann ich mir durchaus vorstellen, dass ein ML Model einfach live endlos Musik mit vorgegebener Stimmung/Atmosphäre erzeugt.

das hat mich gerade getriggert, sowas wäre doch super interessant wenn das zu Therapeutische Zwecke eingesetzt wird, über zb Sensoren wird die Stimmungslage des Patienten analysiert und auf Basis dessen AI eine Musik generiert die einen maximal effektiven positiven Einfluss ausübt.

abolesco · 30.03.24

exoslime schrieb:
das hat mich gerade getriggert

mich auch, deshalb habe ich mich mal mit ChatGPT drüber unterhalten. Eine Antwort war dann die:

"...
Es gibt einige spannende Projekte und Forschungsinitiativen, die sich mit der Entwicklung von KI-generierter Musik beschäftigen, insbesondere im therapeutischen Kontext. Ein paar Beispiele dazu:

Endel: Eine App, die algorithmisch generierte Klänge und Musik verwendet, um Konzentration, Entspannung und Schlaf zu fördern. Endel nutzt verschiedene Datenpunkte, darunter Wetter, Tageszeit und Herzfrequenz (über Integrationen mit Smart Devices), um personalisierte Soundscapes zu erstellen, die sich an die Bedürfnisse des Nutzers anpassen.
Brain.fm: Bietet Musik, die von KI generiert wird, um den Nutzer in einen Zustand tiefer Konzentration, Entspannung oder Schlaf zu versetzen. Die Entwickler von Brain.fm arbeiten mit Neurowissenschaftlern zusammen, um Musikstücke zu erstellen, die spezifische kognitive Zustände fördern sollen.
Mubert: Ein weiteres Beispiel für die Nutzung von KI zur Erstellung von Musik, die auf die Bedürfnisse des Nutzers zugeschnitten ist. Mubert fokussiert sich auf die Erstellung von Endlosmusik für verschiedene Aktivitäten und Stimmungen, von Entspannung bis hin zu Fokussierung und Bewegung.
AI Music: Ein Unternehmen, das KI nutzt, um dynamische Musik und Audioinhalte zu erstellen, die sich in Echtzeit an die Hörpräferenzen und das Engagement des Nutzers anpassen können. Dies kann auch therapeutische Anwendungen haben, indem Musik basierend auf dem emotionalen Zustand des Nutzers personalisiert wird.

Diese Beispiele zeigen, wie KI genutzt werden kann, um Musik zu schaffen, die nicht nur unterhaltend ist, sondern auch spezifische psychologische oder therapeutische Effekte hat. Der Schlüssel liegt in der Fähigkeit der KI, komplexe Muster und Präferenzen zu lernen und anzuwenden, um Musik zu generieren, die auf individuelle Bedürfnisse zugeschnitten ist.
..."

Ich habe daraufhin ChatGPT gefragt was dann aus der guten alten Klangschale und der 432HZ-Stimmung werden soll.

MaxJoy · 30.03.24

abolesco schrieb:
Es gibt einige spannende Projekte und Forschungsinitiativen

Ich wette, diese ganzen Psycho-Musik-Apps mischen noch Binaurale Beats in den Mix. Damit kann man zwischen Hochstress und Tiefschlaf so ziemlich jeden Zustand anreizen. Richtig abheben tut die ganze Geschichte, wenn Puls, Bewegungen, Klang der Stimme etc. vom Smartphone des Hörers zurück gemeldet werden - dann kann die Software z. B. gezielt gegensteuern, wenn jemand wütend ist oder einzuschlafen droht. Auch eine Art von Bio-Feedback.

trichtersoft schrieb:
Im Thread-Titel geht es im AI für Effekte und Mixing. Inzwischen wird seit mehreren Seiten diskutiert, wie ganze Musikstücke quasi auf Knopfdruck erstellt (und dann per AI wieder in Stems zerlegt) werden können.

So schnell geht das heutzutage. Mit den neuen Chips lassen sich AIs so schnell trainieren, dass man sich nur noch etwas Verrücktes wünschen muss und - puff - existiert es.

Die teure Klangschale würde ich trotzdem nicht wegschmeißen. Du könntest ja den Salat darin anrichten, sofern sie lebensmittelecht ist.

abolesco · 31.03.24

MaxJoy schrieb:
Die teure Klangschale würde ich trotzdem nicht wegschmeißen. Du könntest ja den Salat darin anrichten, sofern sie lebensmittelecht ist.

Genau. Sogar für deren Verwendung in Verbindung mit K.I. hatte ChatGPT Ideen, Salat kam aber
nicht vor

.

MaxJoy · 31.03.24

abolesco schrieb:
Sogar für deren Verwendung in Verbindung mit K.I. hatte ChatGPT Ideen, Salat kam aber nicht vor .

Salatschüsseln sind auch old-style analog. Trotzdem werde ich meine Gitarren jetzt nicht nicht als Tennisschläger recyceln, sondern weiterhin in Ehren halten.

abolesco · 31.03.24

Habe mit ChatGPT den Faden weitergesponnen und mir einen Prompt für Suno.ai kreieren lassen. Leider versteht Suno diesen nicht genau, bzw. kann es (noch) keine speziellen Wünsche nach Instrumenten erfüllen. Naturgeräusche, Klangschale und Didgeridoo hat es nicht verwendet.
Einer der zwei Songs die am Ende rauskamen hat aber das Potential mein neuer Smartfönweckruf zu werden:

"Morning Harmony"

MaxJoy · 31.03.24

Man verknallt sich regelrecht in manche Songs. Spaßeshalber habe ich mal Hänschen Klein im Swing Gewand neu vertonen lassen. Danke, suno!

abolesco · 31.03.24

Eine Text-To-Drummer oder Text-To-Bassist - K.I. wäre toll. Eine verbesserte Form der Bandmatefunktion in den Toontrack-Plugins sozusagen. Bandmate ist schon ganz okay, aber ich nutze dann doch lieber Tap To Find. Und das findet halt nur fertige Midifiles. Für Surfrock hat Toonetrack aber nichts im Angebot für den ezDrummer.
Wenn man dem K.I.-Bandmate einfach ein Riff senden könnte und dazu per Text den Befehl "Spiel mir dazu etwas in der Art von (Song) und/oder (Band), und das würde er hinbekommen und dem Gitarrenpart Selbst anpassen, wäre das schon der Hit. Hoffentlich kommt das bald, das würde mir sehr viel Zeit sparen.

Worst guitarist · 05.04.24

losch schrieb:
KI arbeitet eben nicht unbedingt strikt deterministisch, wie du es nahelegst. Gleiche Abfragen führen z.B. eben nicht zu gleichen Ergebnissen.

Moment, gleicher Prompt + gleicher Seed-Wert müssten - ohne weiteres Training - doch theoretisch zumindest immer den gleichen Output haben, ¿no?

goorooj schrieb:
Natürlich ist das hier noch ausbaubar, aber das ist v3 ... schauen wir bei v5 mal weiter

Ist schon erstaunlich, wie viel Noise und Glitches innerhalb einer Generation Software da schon entfernt worden sind! Bei V2 hat der auch mal nur Brummen ausgegeben und mittlerweile kannst du bei Musikstil auch schon Künstler oder abstrakte Konzepte eingeben

GinMonotonic schrieb:
Reggae ist auch so ein Ding wo gefühlt jedes zweite Ergebnis gleich klingt

nee, also habe schon tagelang unterschiedlichste Dub und Bass Music mir ausgeben lassen. Musst du kreativere Prompts eingeben

abolesco schrieb:
Eine Text-To-Drummer oder Text-To-Bassist - K.I. wäre toll. Eine verbesserte Form der Bandmatefunktion in den Toontrack-Plugins sozusagen. Bandmate ist schon ganz okay, aber ich nutze dann doch lieber Tap To Find. Und das findet halt nur fertige Midifiles. Für Surfrock hat Toonetrack aber nichts im Angebot für den ezDrummer.

Gib mal bei Suno bei Stil 'Surfrock Drums solo recording" ein. Musst du halt ggf etwas zurechtschneiden, aber geht schon alles

Was mich noch beschäftigt hat: braucht man immer gleich Neuronale Netzwerke? Hier hatte einer nach Presets für seinen Synthesizer gefragt, das geht mir Zufallsparametern und etwas manueller Nachbesserung auch schon seit Ewigkeiten (habe kürzlich aus Jux und Dollerei in einer Minute mit einem Choir Plugin ein Synth-Lead gebaut)

MaxJoy · 05.04.24

Worst guitarist schrieb:
Gib mal bei Suno bei Stil 'Surfrock Drums solo recording" ein.

Gibt es irgendwo eine Liste mit den Musikstilen und zusätzlichen Beschwörungsformeln, die suno beherrscht?

Worst guitarist · 05.04.24

MaxJoy schrieb:
Gibt es irgendwo eine Liste mit den Musikstilen und zusätzlichen Beschwörungsformeln, die suno beherrscht?

schätze nicht, aber was beim Feld Style of Music meistens klappt:
'Genre (also was auch geläufig ist), 'Subgenre', 'Instrumentierung', 'Stimmung' (dark, heavy, happy...)

Also etwa 'Industrial Dub EDM Synthesizer Viola happy' ^^

pipowicz · 07.04.24

MaxJoy schrieb:
Gibt es irgendwo eine Liste mit den Musikstilen und zusätzlichen Beschwörungsformeln, die suno beherrscht?

Ja, gibt es. Ki spuckt es aus.
Cheers !

MaxJoy · 07.04.24

ChatGPT weiß von nichts, aber es gibt ein Wiki. Die Liste ist recht umfangreich:

Style & Genre List – Suno.wiki

www.suno.wiki

trichtersoft · 08.04.24

Bezüglich der Rechtsfragen:
Hier ist die MIT Lizenz in form einer traurigen Jazz-Ballade.

(natürlich AI generiert)
Das muss dann nur als letzer (oder erster?) Song auf jedes Album.

Permission is hereby granted | Suno

Sad girl piano ballad; jazz-trained female singer-songwriter song. Listen and make your own with Suno.

app.suno.ai

MaxJoy · 08.04.24

trichtersoft schrieb:
Hier ist die MIT Lizenz in form einer traurigen Jazz-Ballade.

Die Stelle "WHETHER IN AN ACTION OF CONTRACT" hat mich zu Tränen gerührt.

adrachin · 08.04.24

Hier mal was für Mixing: Techivation AI-Loudener. Techivation ist Spezialist für DSP Coding. Deren Plugins sind nicht die üblichen Hämmer die den Sound bis zur Unkenntlichkeit verbiegen. Die sind subtil und sehr gezielt einsetzbar. Die AI Variante basiert auf der ursprünglichen M-Louder DSP hat aber zusätzlichen AI generierten Code mitbekommen. Da ist tatsächlich ein Neural Network drin. Zu sehen ist das einerseits am Foot Print, das hat über 350MB Code. Andererseits am CPU Load. Der ist erstaunlich gering. Ich vermute, die rechnen den AI Teil auf den ML Compute Units. Apple MAC, was ich verwende, hat davon reichlich.

Was macht das Teil? Ich habe das mal auf alle Spuren einer Mischung gelegt und dann "angelernt". Der Effekt ist ein klarerer und akzentuierterer Sound am Ausgang. Wie wenn man was Ariel drüber schüttet um den Grauschleier zu entfernen... (;

Kommt gut. Das Funktioniert mit allen Sound. Egal was man da reinschickt. Demonstrieren kann ich das mit der Mischung nicht, da es nicht öffentlich verwendet werden darf. Falls es interessiert. ziehe ich es mal in eine andere Mischung rein.

Worst guitarist · 08.04.24

adrachin schrieb:
Deren Plugins sind nicht die üblichen Hämmer die den Sound bis zur Unkenntlichkeit verbiegen. Die sind subtil und sehr gezielt einsetzbar. Die AI Variante basiert auf der ursprünglichen M-Louder DSP hat aber zusätzlichen AI generierten Code mitbekommen.

Bei zu subtilen Plugins habe ich immer Sorge, dass ich mir den Unterschied zum Input-Signal nur einbilde und das alles Marketing-Blabla ist

adrachin schrieb:
Falls es interessiert. ziehe ich es mal in eine andere Mischung rein.

ja, wäre mal gespannt, was man da blind hören kann

AI/ neuronale Netzwerke für Effekte, Mixing

Beiträge mit meisten Reaktionen

Anhänge

Style & Genre List – Suno.wiki

Permission is hereby granted | Suno

Quick Links

[Userthread] UAD

Plugins / Audio-Apps zu reduzierten Preis: Groupbuys, Discounts,...

Universal Audio Connect will ständig Updates machen