• Bitte beachten! Dies ist ein Forum, in dem es keine professionelle und auch keine verbindliche Rechtsberatung gibt. Es werden lediglich persönliche Meinungen und Erfahrungen wiedergegeben. Diskussionen bitte möglichst mit allgemeinen Beispielen und nicht mit speziellen Fällen führen.

AI: Der Tod für alle Sänger und Sprecher?

A
AA_
Registrierter Benutzer
Zuletzt hier
27.02.23
Registriert
18.09.22
Beiträge
31
Kekse
0
Hallo,

vielleicht hat der ein oder andere schon von Stimmprogrammen gehört,
die 1:1 Stimmen simulieren können. (z.B. von Stars oder, Deine eigene,...)

Du lädst eine Tonaufnahme von jemandem hoch,
und kopierst einen Text rein oder sprichst ins Mikrofon.

Es ist noch nicht perfekt, aber schon sehr nahe dran.

Mal ein Beispiel:

Beitrag automatisch zusammengefügt:


Programm:

https://beta.elevenlabs.io/
 
Juhu, eine neue Fake-News Dimension

Glaub mir die, vermutlich sowieso nicht, gefährdeten Existenzen von Sängerinnen und Sprecherinnen sind dabei in Zukunft das kleinste Problem ;-)
 
  • Gefällt mir
Reaktionen: 7 Benutzer
Im Moment sind wir vielleicht auf dem Level, dass eine KI-Software die Stimme "ändern" kann.
Ein Hörbuch so lesen, dass man das auch hören mag, dass sehe ich z.B. noch längst nicht.
Singen schon gar nicht. Das will ich mir auch gar nicht vorstellen. ;-)

Aber ja, das Thema wird in den nächsten Jahren schon einiges verändern.
Und sicher nicht nur positiv.
 
  • Gefällt mir
Reaktionen: 2 Benutzer
ich sehe nicht den zusammenhang zwischen titel und beitrag.
 
  • Gefällt mir
Reaktionen: 1 Benutzer
Joe Biden spricht seine Reden weiterhin selbst.

Das Thema ist irgendwas zwischen aufregend und gähn.
 
  • Gefällt mir
Reaktionen: 1 Benutzer
Die erste Frage, die sich da stellt, und die natürlich bereits seit längerem breit diskutiert wird: Was ist ein O-Ton noch wert? Was bedeutet das für Fake News?

Ansonsten… naja. Wir brauchen halt das bedingungslose Grundeinkommen. Nachdem die Maschinen den Hand-Arbeitern die Jobs weggenommen haben, werden sie durch KI nun den Gehirn-Arbeitern die Jobs wegnehmen. Irgendwann brauchen wir nur noch Mechatroniker, Informatiker und Leute, die Maschinen überwachen. Aber, so ist es ja gedacht, davon weniger wie wenn Menschen die Arbeit selber machen. Sonst lohnt es sich ja nicht (für wen?). Da das Grundeinkommen aber politisch nicht möglich ist, und wir hier auch nicht über Politik diskutieren dürfen, schauen wir schweigend dem Gesamtsystem zu, wie es sich auffrisst.

Ansonsten wurde ja schon viel gesagt über das Thema drüben im Fred Songtext von ChatGPT.

Ein Punkt: Derzeit kann KI vor allem deswegen komplette Popmusikstücke produzieren, weil die Hörgewohnheiten durch 20 Jahre Autotune-Einsatz bereits auf „unnatürlich“ eingeschossen sind.
 
  • Gefällt mir
Reaktionen: 1 Benutzer
You can call me Al.
 
  • Haha
Reaktionen: 1 Benutzer
Zuletzt bearbeitet von einem Moderator:
  • Gefällt mir
Reaktionen: 2 Benutzer
Schlimm finde ich diese Beiträge bei Youtube wo eine Roboterstimme die ein bisschen menschlich klingt aber völlig scheiß betont irgendwelche vip news vorliest.

Sowas bekommt auch noch Klicks :(

 
  • Gefällt mir
Reaktionen: 1 Benutzer
Im Moment sind wir vielleicht auf dem Level, dass eine KI-Software die Stimme "ändern" kann.
Ein Hörbuch so lesen, dass man das auch hören mag, dass sehe ich z.B. noch längst nicht.
Singen schon gar nicht.

Klar geht das mittlerweile. Das Tool nennt sich Synth V und je nach Genre kann man es als Demo beim Songschreiben nutzen, um es später durch einen Sänger, eine Sängerin zu ersetzen oder man kann den Gesang direkt nutzen. Je nachdem klingt das schon ziemlich gut und das ist ja erst der Anfang.



 
  • Gefällt mir
  • Wow
Reaktionen: 5 Benutzer
A
  • Gelöscht von Vali
  • Grund: Wortwahl
@Hardsound Olli
Ok, ich muss sagen, dass ist doch weit mehr als ich bislang kannte und erwartet habe. Danke für den Beitrag!

Als Ersatz für eine/n Sänger/in, oder als gefühlvoll und ausdruckstark vorlesende Stimme in einem Hörbuch müsste ich das jetzt nicht haben, aber es ist durchaus beeindruckend.
 
  • Gefällt mir
Reaktionen: 2 Benutzer
Bezugspost gelöscht

Ganz von der Hand zu weisen waren die Anmerkungen nicht. Denn hinter dem tatsächlich dramatisierenden Titel folgte lediglich der Hinweis, dass es AI gibt und die auch schon gar nicht schlecht Stimmen imitieren kann.

Tatsächlich sind einige schon weiter. In US-Filmproduktionen werden bereits künstliche Stimmklone von Verstorbenen eingesetzt und das Unternehmen Worldwide XR will komplette Filme mit verstorbenen Schauspielern drehen.

Mir persönlich ist ziemlich egal, wovon oder womit sich künftige Generationen berieseln lassen. Im Zweifelsfall haben sie es nicht besser vedient.

--
 
Zuletzt bearbeitet von einem Moderator:
  • Gefällt mir
Reaktionen: 2 Benutzer
S
  • Gelöscht von Vali
  • Grund: Bezugspost
Salty
  • Gelöscht von Vali
  • Grund: Bezugspost
m.E. muss man mal zwei Effekte voneinander trennen:

Erkennung von Fakes und Umgang damit: solche Fakes kann man glaube ich Stand heute schon noch gut ermitteln. Öffentliche Reden sind sowieso nicht so kritisch, weil es das Original ja auch noch gibt (und ein paar Zeugen dazu). Und einem Promi Worte in den Mund legen, oder durch gezieltes Schnipseln den Sinn komplett verfälschen, oder auch komplette Fake News in den Umlauf bringen - das macht Presse & Social Media schon länger, und die die sowas als eigene Wahrheit ansehen wollen, tun das so oder so. Braucht eben noch mehr Aufmerksamkeit und Hinterfragen von Quellen.
Die Technik muss & wird sich noch dran anpassen - Kennzeichnung für beglaubigte Originale, Checksum, Zertifikate, whatever. Das Urheberrecht muss sich auch dran anpassen, vielleicht braucht's auch ein Recht an den eigenen Stimmmerkmalen oder so. Wird etwas dauern, aber man wird lernen damit umzugehen.

Tod für Sänger & Sprecher (der Threadtitel): naja, Schallplatten, Tonbänder, digitale Aufnahme, Sequenzer, Samples, Playback etc. haben auch ganze Berufsbilder verdrängt oder dezimiert (Live-Künstler, Stenotypisten, Kino-Klavierspieler ...), aber auch eigene Kunstformen geschaffen. Über einen menschlichen Stimmenimitator regt sich auch niemand auf, jetzt klappts halt per Technik und noch authentischer.
Abba Voyage und Paul McCartney Find My Love sind Beispiele, wo Künstler selbst deep fake Techniken nutzen, nur eben für Video anstatt Audio.
Willkommen im Jahr 2023...
 
  • Gefällt mir
Reaktionen: 2 Benutzer
@Hardsound Olli
Ok, ich muss sagen, dass ist doch weit mehr als ich bislang kannte und erwartet habe. Danke für den Beitrag!

Als Ersatz für eine/n Sänger/in, oder als gefühlvoll und ausdruckstark vorlesende Stimme in einem Hörbuch müsste ich das jetzt nicht haben, aber es ist durchaus beeindruckend.

Es gibt ansonsten neben dem bekannten Klassiker Vocaloid noch emvoice: https://emvoiceapp.com/

Das klingt zwar noch nicht so gut wie Synth V, hat aber den Vorteil, dass es kostenlos ist. Die Stimmen an sich kosten zwar etwas aber im Demomodus hat man ca eine Oktave die man nutzen darf, auch kommerziell. Für umsonst echt richtig klasse, man braucht allerdings eine Internetleitung, weil das auf einem Server berechnet wird. Klingt zwar mitunter sehr künstlich aber für einige Genres kann das ja auch gewollt sein und mit den richtigen FX dahinter geht auch einiges. Oder man nimmt es halt testweise beim Komponieren zum rumprobieren und nutzt danach einen echten Sänger.
 
glombi
  • Gelöscht von Vali
  • Grund: Bezugspost
DirkS
  • Gelöscht von DirkS
Ganz von der Hand zu weisen waren die Anmerkungen nicht. Denn hinter dem tatsächlich dramatisierenden Titel folgte lediglich der Hinweis, dass es AI gibt und die auch schon gar nicht schlecht Stimmen imitieren kann.

Tatsächlich sind einige schon weiter. In US-Filmproduktionen werden bereits künstliche Stimmklone von Verstorbenen eingesetzt und das Unternehmen Worldwide XR will komplette Filme mit verstorbenen Schauspielern drehen.

Mir persönlich ist ziemlich egal, wovon oder womit sich künftige Generationen berieseln lassen. Im Zweifelsfall haben sie es nicht besser vedient.

--

Klar, ich hätte den Titel natürlich nochmal in den Beitrag kopieren können.
Nur wozu soll das gut sein? Ist doch klar worum es hier geht, wenns in der Überschrift steht.
 
Wie immer, wenn Technik bisher menschliche Fähigkeiten besser nachahmt, kann man sich auch hier fragen, wozu es dann noch reale Menschen - in diesem Fall Sprecher und Sänger - braucht.

Und die Antwort ist natürlich wie bisher auch immer: zur Gestaltung von menschlich berührender Dramaturgie, die sich durch einen emotionalen und sensiblen Umgang mit dem ästhetischen Gegenstand zeigt. Ein hohes Maß an Glaubwürdigkeit und Authentizität bei einer Textwiedergabe kann man nur erreichen, wenn man den Gegenstand in seiner emotionalen Dimension durchdringt.

Allerdings gibt es viele Textwiedergaben von Menschen, die jetzt schon mechanisch ablaufen. Schlechte Vorträge und schlechtes Schauspiel z.B. . Sowas könnte eine KI ebenbürtig hinbekommen. Hoffentlich wird ein Nebeneffekt von Sprach-KI sein, dass Sprecher und Schauspieler sich auf die zutiefst menschlichen Kompetenzen authentischer Gestaltung besinnen und handwerklich hochwertig und emotional sensibel sprechen.

Ein Problem ist bereits bzw. wird weiterhin sein, dass sich viele Konsumenten mit schlecht dargebotenen Texten zufrieden geben.
 
Allerdings gibt es viele Textwiedergaben von Menschen, die jetzt schon mechanisch ablaufen. Schlechte Vorträge und schlechtes Schauspiel z.B. . Sowas könnte eine KI ebenbürtig hinbekommen. Hoffentlich wird ein Nebeneffekt von Sprach-KI sein, dass Sprecher und Schauspieler sich auf die zutiefst menschlichen Kompetenzen authentischer Gestaltung besinnen und handwerklich hochwertig und emotional sensibel sprechen.

Ein Problem ist bereits bzw. wird weiterhin sein, dass sich viele Konsumenten mit schlecht dargebotenen Texten zufrieden geben.
Wir tun uns als Menschen schon so unfassbar schwer das wirklich zu durchdringen. Interessanterweise auch eines der wenigen Felder die man praktisch nicht googeln kann und wozu es keine Youtube-Tutorials gibt. Wenn meine Schauspielschüler in der Schule ankommen ist es ihnen meist überhaupt nicht bewusst was da überhaupt vor ihnen liegt und was es zu lernen gibt. Das ist echt eine Art „Geheimwissenschaft“.
Selbst wenn Eine künstliche Intelligenz das lernen könnte wüsste ich beim besten Willen nicht wer ihr das beibringen sollte. Imitieren von menschlichem Verhalten wird da nicht reichen, weil das Netz überläuft von Oberfächlichkeiten. Wie soll eine KI da gut von schlecht unterscheiden können?

Mich erinnert diese ganze Diskussion sehr an Zukunftsvisionen wie in „Zurück in die Zukunft“. Demnach müssten ja eigentlich Autos schon längst fliegen können. In Wahrheit ist alles ziemlich ähnlich wie 1989 -abgesehen von allgegenwärtigen Computern und Smartphones und ein paar Elektroautos.
 
Wenn meine Schauspielschüler in der Schule ankommen ist es ihnen meist überhaupt nicht bewusst was da überhaupt vor ihnen liegt und was es zu lernen gibt. Das ist echt eine Art „Geheimwissenschaft“.
Selbst wenn Eine künstliche Intelligenz das lernen könnte wüsste ich beim besten Willen nicht wer ihr das beibringen sollte.

Künstliche Intelligenz lernt mehr so wie Kinder lernen, aber auf eine viel einfachere und naivere Art. Du denkst als Dozent vermutlich, ganz richtig und berufsgeprägt: Wie bringt man das bei?

KI wird aber nichts beigebracht. KI lernt, indem sie ein paar Millionen oder Milliarden Filme „schaut“ und macht es nach.

Das wird auch noch kommen. Social Media hat mir dazu einen interessanten, themenverwandten Artikel hochgespült: https://www.artechock.de/film/text/artikel/2023/02_16_contentvsfilm.html – hier beklagt jemand, dass Film immer mehr zum Content verkommt.

Ich denke, dass hier eine Voraussetzung dahinter liegt: Kreative Inhalte, die berühren, die neu sind, die faszinieren, verärgern, etc. – also Kunst im weitesten Sinne, sind nicht mehr gefragt. Es geht um Content. Content ist aber nur Mittel zum Zweck. Er soll Klicks oder Impressions generieren, er soll Marketing sein, er soll Geld einbringen. Welcher Content im Detail, das ist eigentlich fast egal.

So ist das in der industriellen Popmusik, so ist das bei Drehbüchern. Ist es da verwunderlich, dass es verlockend ist, das durch KI zu ersetzen? Der Content ist ja schließlich irgendwie auch beliebig. Hauptsache Cashflow.

Den Gesang, oder das Schauspiel, oder die Musikproduktion auch gleich der Maschine zu übergeben, ist natürlich in diesem System logisch. Kein nervenden Musiker und Darsteller mehr, die auch noch Geld wollen. Solange es nicht verboten ist, und es sich wirtschaftlich lohnt, wird das passieren. Nachrichtensprecher sind dann raus, Top40-Popmusiker auch. Bei Sendern wie SWR3 werden in Zukunft hoffentlich die automatisch geschriebenen Nachrichtentexte nochmal auf Plausibilität geprüft werden, bevor sie dann automatisch gesprochen werden. Dazwischen automatisch generierte Popmusik.

Sicherlich wird eine Minderheit die Sehnsucht nach dem originären, nach Persönlichkeit, nach Menschlichkeit bewahren und es wird auch weiterhin menschlich produziert. Aber Geld verdienen lässt sich ja damit bereits jetzt nicht, abseits des großen Business.
 
  • Gefällt mir
Reaktionen: 2 Benutzer
KI wird aber nichts beigebracht. KI lernt, indem sie ein paar Millionen oder Milliarden Filme „schaut“ und macht es nach.
und dann schaut sie sich eben auch den ganzen mittelmäßigen Müll an und lernt genau das. Genau wie meine Studenten..
Und dann müssen sie erst wieder lernen, dass es einen riesen Unterschied macht ob ein Ergebnis kopiert oder reproduziert wird oder ob ein Vorgang im Moment real erlebt wird. Ich bezweifle, dass das eine KI jemals kapieren oder erschaffen kann. Zumindest glaube ich vorher an die fliegenden Autos!
 
  • Gefällt mir
Reaktionen: 1 Benutzer
Selbst wenn Eine künstliche Intelligenz das lernen könnte wüsste ich beim besten Willen nicht wer ihr das beibringen sollte.
Das ist einer der großen Denkfehler, die gern gemacht werden. Es gibt "Trainer", ja, aber diese definieren eigentlich lediglich den Betrachtungsraum, damit die KI halbwegs sinnvolle Lösungsräume durchsucht und Parameter bekommt, die den Prozess beschleunigen helfen.
KI wird aber nichts beigebracht. KI lernt, indem sie ein paar Millionen oder Milliarden Filme „schaut“ und macht es nach.
Ganz genau so nämlich.

Wie soll eine KI da gut von schlecht unterscheiden können?
Ja, und das ist wieder die menschliche Hybris. Wie unterscheidest Du denn gut von schlecht? Wahrscheinlich über Dein gelerntes, erlebtes, verinnerlichtes Weltbild (überspitzt und verkürzt). Nicht anders wird das auch bei einer KI passieren.

"Artificial Intelligence" ist die Gesamtdisziplin, die eine Vielzahl von Teilbereichen unter sich vereint. "Machine Learning" ist dabei ein bzw. der Teilbereich, über den wir hier sprechen. Momentan sehen wir die ersten Schritte einer neuen Anwendungsmöglichkeit von Technologie und in - ich kann mich da immer wieder nur wiederholen - typisch deutscher Manier fällt uns in Diskussionen immer wieder nur ein, mögliche Fehler und "Shortcomings" zu finden und im Wald zu pfeifen. Das ist nicht der Untergang des Abendlandes, wie man früher zu sagen pflegte, aber es ist ein fundamentaler Wandel, wie die Menschheit mit diesen Themen (lernen, verstehen, anwenden, entwickeln) grundsätzlich umgeht und berührt nicht nur das Wesen der heutigen Arbeitswelt (und auch der kreativen Berufe), sondern alle Lebensbereiche und Ökosysteme - und wenn ich sehe, was allein in meinem Berufsfeld in der Techindustrie in diesem Thema gerade abgeht, ist das gerade mal Pipifax, über was hier diskutiert wird.
 
  • Gefällt mir
Reaktionen: 1 Benutzer

Unser weiteres Online-Angebot:
Bassic.de · Deejayforum.de · Sequencer.de · Clavio.de · Guitarworld.de · Recording.de

Musiker-Board Logo
Zurück
Oben