AI/ neuronale Netzwerke für Effekte, Mixing

Alles was Computer an neuen Klassen und Typen erkennen können, das können sie nur, weil der Programmierer vorgesehen hat, Unbekanntes ersatzweise als Neues zu klassifizieren und Kriterien gesetzt hat
Du verfügst offenbar über große Kompetenzen der konventionellen Informationsverarbeitung und hast sie hier ausführlich beschrieben.

Allerdings hat die derzeitige Entwicklung im Bereich KI sehr wenig mit dem zu tun, was seit 30 Jahren in dieser Hinsicht gängig war.

KI arbeitet eben nicht unbedingt strikt deterministisch, wie du es nahelegst. Gleiche Abfragen führen z.B. eben nicht zu gleichen Ergebnissen. Die Arbeitsweise ist eine völlig andere, als die der konventionellen Informationsverarbeitung,
 
  • Gefällt mir
Reaktionen: 1 Benutzer
KI arbeitet eben nicht unbedingt strikt deterministisch, wie du es nahelegst. Gleiche Abfragen führen z.B. eben nicht zu gleichen Ergebnissen. Die Arbeitsweise ist eine völlig andere, als die der konventionellen Informationsverarbeitung,
Aber die KI hat trotzdem Einschränkungen. Simples Beispiel: ich arbeite an einer Improvisation an der Orgel. Dann fällt mir an diesem Instrument und diesem Raum eine besondere klangliche Wirkung auf bei einer Kombination, die theoretisch und praktisch eigentlich totaler Unsinn ist, trotzdem wirkt es in dem Raum trotz aller Regelbrüche klanglich sehr gut. Ich kann nun mit meinen ganzen Sinnen sagen, dass dies für klingt und ich damit arbeite. Könnte das eine KI auch?
 
Ein letztes mal sage ich noch etwas zu dem Thema.
Die Antwort auf deine Frage: Ja. Und noch viel mehr.
Es geht um die Lernmodelle. Die Lernmodelle sind inzwischen so ausgereift das sie ALLES können. Je nach Fragestellung. Googles Alpha Go hat, nachdem sie den Go Weltmeister geschlagen hat sich selber Schach Spielen beigebracht. Man hat ihr die Regeln erklärt und danach hat sie in einem Monat mehrere Milliarden Partien gegen sich selber gespielt. Nun ist sie besser als alle anderen Schachcomputer.
Wenn ich ein Modell trainiere bei Musik auch auf Auswirkungen im Raum zu achten und dabei psychologische und physiologische Besonderheiten des Menschen zu beachten wird sie das in kürzester Zeit können.
Im Moment werden die Modelle Weltweit auf Situationen angepasst und man sieht fast täglich Verbesserungen oder Neuerungen mit denen man gar nicht gerechnet hatte.
Von daher hat mein Vorredner "losch" auch recht und mein Vorredner "engineer" nicht. Das was er sagt war "früher", "damals", "vor unserer Zeit", "vor KI".
 
  • Gefällt mir
Reaktionen: 2 Benutzer
Auch wir sind trainiert, unser Musikgeschmack ist angelernt.
Antrainiert, anhand von Beispielen die wir seit frühester Kindheit vorgesetzt bekommen. Wir mögen, was wir kennen.

Andere Arten von Musik in anderen Ecken der Welt existieren, die mit dem was wir hier habene her nichts zu tun haben.
Die wurden genauso angelernt.

Es gibt allerdings bedeutend weniger Musik im Netz als Bilder. Das heisst, potentiell viel weniger Trainingsdaten. Bild- und Videoanwendungen sind die Low Hanging Fruits im KI-Bereich.
Auch müsste die KI erst befähigt sein wie ein menschliches Ohr alle Instrumente in einem Stück voneinander zu trennen und getrennt zu verarbeiten.
 
Auch müsste die KI erst befähigt sein wie ein menschliches Ohr alle Instrumente in einem Stück voneinander zu trennen und getrennt zu verarbeiten.
Versuche dich mal hieran https://www.musiker-board.de/thread...nien-heraushoeren-mit-ki.745847/#post-9626252

Moises kann das mittlerweile nicht nur mit Basslinien wirklich erstaunlich gut! So gut, dass sie das für mich nun immer öfter mit allen möglichen Instrumenten tut. Für einen kleinen monatlichen Betrag. Ist es mir wert.
 
Von daher hat mein Vorredner "losch" auch recht und mein Vorredner "engineer" nicht. Das was er sagt war "früher", "damals", "vor unserer Zeit", "vor KI".
Imho gehen die Beiträge von @engineer eher Richtung: wird alles nicht so heiss gegessen, wie es (momentan) gekocht wird. :D
Mein ältestes Buch über Neuronale Netze ist Jahrgang 1988, Cognizers (Neural Networks and Machines That Think) von Johnson/Brown, Wiley Verlag.
 
Auch müsste die KI erst befähigt sein wie ein menschliches Ohr alle Instrumente in einem Stück voneinander zu trennen und getrennt zu verarbeiten.
Ehrlich gesagt glaube ich, dass der normale Zuhörer das nicht einmal kann und somit auch nicht wirklich ziehführend wäre. Für den gewöhnlichen Zuhörer spielt es ja keine Rolle welches Instrument nun was macht, da zählt der Gesamteindruck.

Ich würde einmal von mir selbst behaupten ein gutes Gehöhr zu haben, ich kann Muster erkennen und nachspielen, ohne die Noten zu kennen. Da ich aber überwiegend Orgel und Harmonium spiele, komme ich dort schnell an die Grenzen. Ein Stück mit einem einzelnen 8" gespielt ist kein Problem. Kommt noch ein 4" dazu wird es schwerer. Wenn ich nun die Registrierung nicht kenne und diese auch variiert wie 8", 4", 2" dann vielleicht den 2" durch eine Quinte oder einem 1 1/3" ersetzt oder gar eine Mixtur, dann ist es nahezu unmöglich noch zu sagen welche der gehörten Töne auch tatsächlich gespielt wurden. Spiele ich auf einen 8" ein mittleres c und nehme den 4" dazu, dann erklingt zusätzlich das c eine Oktave höher mit, oder wenn ich die Quinte dazu nehme, dann drücke ich weiterhin das c, aber es erklingen beide c und noch das g.

Jetzt Versuche zu ermitteln ob nur das c gespielt wurde oder die einzelnen Töne. Eine KI kann die Töne wohl erkennen, ob die darauf resultierenden Noten auch spielbar wären ist eine andere Frage.
 
Habe gerade diesen Artikel über eine Zusammenarbeit von Roland und Universal gefunden, die KI zur Produktion von Musik nutzen möchten. Der Mensch, als Produzent von Musik, soll dabei aber im Mittelpunkt bleiben.

 
Imho gehen die Beiträge von @engineer eher Richtung: wird alles nicht so heiss gegessen, wie es (momentan) gekocht wird
Nur zur info: Ich und andere arbeiten ja beruflich an und mit solchen Systemen - derzeit sogar recht intensiv, während die Meisten, die sich hier und anderswo dazu äußern, ihre Erfahrungen aus user-Sicht beisteuern. Da sind viele von dem überwältigt, was die Protagnoisten als Ergebnisse und Beispiele posten, vergessen aber, dass dies die gut funktionierende Spitze des Eisberg ist. Von den vielen Fehlschlägen und Ausfällen, die nicht zum Erfolg geführt haben, wissen sie nichts, weil sie ihnen nicht präsentiert wurden. Wenn du aber direkt an der Materie arbeitest, siehst du real, wie es mit den Fortschritten aussieht. Wie jemand eingeworfen hat, sind die Strukturen die für KI eingesetzt werden, seit Jahrzehnten erkannt und formuliert. Die Fortschritte, die man jetzt macht, liegen überwiegend an der Realisierbarkeit infolge von vorhandener Hardware.

Zum dem Beispiel Schach z.B. ist z.B. zu sagen, dass schon seit 25 Jahren jeder Schachcomputer jeden Großmeister schlägt, weil er einfach schneller ist. Das ist aber keine wirkliche Intelligenzleistung und sich das Spiel durch Ausprobieren selber beizubringen, eine reine Leistung der Zeit. Ich selber habe Ende der 1990er am Rechenzentrum ein solches Programm geschrieben, dass alle Kombis durchprobiert, indem es rekursiv jede Partie zu Ende spielt, bewertet und die Partien, die auf Sieg gehen markiert. Man muss dann nur eine aktuelle Partie die man spielt identifizieren und in der angelegten Bib suchen, um ab da einen bekannten Weg weiterzugehen. ch behaupte, dass es in diesem Forum wenigstens 10 Leute gibt, die genug Programmieren können, um aufgrund dieser Angaben, so ein Programm direkt runterschreiben können. Es ist wie gesagt nur eine Frage von Tempo und Speicher. Der Mechanismus ist simpel und die Schachregeln sind es auch. Die kann man an einer Hand abzählen. Die anscheinend gigantische Menge an Möglichkeiten beim Schach ist aus Computersicht winzig und leicht testbar.

Im täglichen Leben gibt es überwiegend Fälle, die nicht nach so einfachen Regeln laufen - oft auch gegen eine Regel ablaufen - und einen Fall aufwerfen, der nicht von der KI gelernt wurde und folglich auch kein Muster oder Methode exisitert, weil es kein Kriterium für richtig oder falsch gibt. D.h. die KI kann ohne Hilfe und Input nicht entscheiden, ob eine Methode eine gute Lösung lieferte oder nicht - anders als beim Schach.

Mein Schachprogramm scheiterte damals auch eben genau an Speichergrößen und Rechenzeit. Eine Verbesserung war, die Partien nicht zuende zu spielen und sie vollständig zu bewerten, sondern mittendrin abzubrechen und die Lage zu bewerten. Wenn man dann rekursiv in die Tiefe geht und mit dieser Lagebewertung zurückkommt, reicht es auch schon um eine Zugfolge zu bewerten. Leider reichte auch das nur bis 4-5 Züge für ein volles Brett. Gute Schachspieler denken aber angeblich 10 Züge voraus. Am Ende also eine Frage der Rechenzeit.
 
Die Fortschritte, die man jetzt macht, liegen überwiegend an der Realisierbarkeit infolge von vorhandener Hardware.
Und auch hier: Das war "früher", "damals", "vor unserer Zeit", "vor KI". Meine KI Systeme laufen auf Gaming Rechnern. Völlig undenkbar früher. Deine Aussaggen sind einfach falsch. Aber was solls.
 
  • Gefällt mir
Reaktionen: 1 Benutzer
RipX ist nirgendwo in diesem Thread erwähnt, dabei ist das doch genau das, was hier gesucht ist: Ein AI-gestützte Software, mit der man fertige Mixe auseinander nehmen und die Spuren direkt manipulieren kann (Spuren als Audio oder Midi exportieren, Samples direkt im Mix verschieben oder austauschen etc.).


View: https://www.youtube.com/watch?v=RntacVYLnAo
 
Meine KI Systeme laufen auf Gaming Rechnern. Völlig undenkbar früher. Deine Aussaggen sind einfach falsch. Aber was solls.
Ich wüsste nicht, was daran falsch sein soll :gruebel:
Als die Grundlagen dieser Technik entwickelt wurden, gab es halt noch keine geeignete Hardware für den praktischen Einsatz.
Und auch noch keine einfach verfügbaren Quellen von Massendaten.
Oder glaubst du ernsthaft, dass man mit dem Design erst angefangen hat seit es „Gaming Rechner“ gibt ? :D
 
Ich habe gerade in suno.ai den prompt eingegeben: "FOLK Song, a witch cursing the Land because a Farmer killed her "my little pony""

Das ist komplett computergeneriert, den Text hat sich suno.ai von chatgpt geholt. Die Stimme ist auch computergeneriert, ebenso der Mix etc. ... alles.
Und jetzt sag nochmal dass KI das nicht irgendwann beherrscht.



Natürlich ist das hier noch ausbaubar, aber das ist v3 ... schauen wir bei v5 mal weiter
 
Zuletzt bearbeitet:
  • Gefällt mir
  • Interessant
Reaktionen: 5 Benutzer
NVIDIA hat gerade den neuen KI Chip B200 vorgestellt. Damit kann man ChatGTP in 3 Minuten trainieren -anstatt 2 Jahre wie bei ChatGTP 3.5 - das wird die Trainigskosten (Mietzeit von Supercomputern) dramatisch verringern. Dann werden auch kleinere Projekte rentabel. Im Moment kostet KI Trainig noch ca. 500k € aufwärts.
 
  • Gefällt mir
Reaktionen: 2 Benutzer
Und jetzt sag nochmal dass KI das nicht irgendwann beherrscht.

Folksongs sind natürlich nicht gerade überkompliziert, aber sie so hinzubekommen, ist große Kunst. Das Lied ist gut und klingt sehr authentisch, ich bin beeindruckt. :cool:
 
  • Gefällt mir
Reaktionen: 1 Benutzer
Tja. So unterschiedlich sind die Bewertungen. Ich finde das ist bestenfalls eine grobe Skizze, die vielleicht mal ein Song werden kann. Mal abgesehen von dem Kraut und Rüben Text.....
 
Was dort auf der Website als Beispiele aufgeführt wird ist aber schon ziemlich beeindruckend.
Insbesondere bei Powermetal (wo gefühlt jeder zweite Track gleich klingt ;) ).
 
  • Gefällt mir
Reaktionen: 1 Benutzer

Unser weiteres Online-Angebot:
Bassic.de · Deejayforum.de · Sequencer.de · Clavio.de · Guitarworld.de · Recording.de

Musiker-Board Logo
Zurück
Oben