livebox
Mod Emeritus
- Zuletzt hier
- 23.11.18
- Registriert
- 22.09.06
- Beiträge
- 10.555
- Kekse
- 59.154
Angeregt durch eine Diskussion zum Thema mp3 im https://www.musiker-board.de/pa-mischpulte-pa/492986-behringer-x32-userthread.html habe ich mal ein bisschen was zusammengeschrieben.
Theorie
Bei digitalen Audio-Formaten unterscheidet man nach Rohdaten, verlustfreier Komprimierung und verlustbehafteter Komprimierung.
Rohdaten sind Daten, die vom Analog-Digital-Wandler kommen, genannt Samples. Also einzelne Zahlenwerte, die die Lautstärke des jeweiligen Samples repräsentieren. Bei 24 Bit hat man also 224 --> etwa 16 Millionen Raster zur Einteilung der Lautstärke. Die müssen nicht unbedingt linear sein (zur Optimierung der SNR), aber das interessiert uns an der Stelle nicht. Und bitte nicht verwechseln: Hier reden wir von Fixed Point Signalverarbeitung, wie sie für die Speicherung auf Datenträgern genutzt wird. Die 40 Bit Floating Point, mit denen das x32 intern arbeitet, können damit nicht verglichen werden.
Ein Rohformat schreibt also pro Sekunde einen Haufen Samples (wie oft hängt von der Abtastrate ab, also z.B. 48.000 mal bei 48 kHz) irgendwo auf ein Speichermedium. Jetzt gibts noch verschiedene Formen, wie die Samples geschrieben werden - z.B. ob die Zahl von vorn nach hinten geschrieben wird oder umgedreht. Deshalb gibt es auch verschiedene Rohdaten-Formate.
Die Datenmenge kann man sich ausrechnen, in dem man die Wortbreite (Bitrate) mit der Abtastrate multipliziert - gibt die Datenmenge für eine Sekunde pro einem Kanal - und das ganze dann mit der Anzahl der Kanäle und der Zeit verrechnet. Die Verwaltungsdaten, die da nebenbei anfallen, fallen größenmäßig unter den Tisch.
Bei komprimierten Formaten ist das aber etwas anders. Um die Datenmenge zu reduzieren, gibt es verschiedene Wege.
Verlustfreie Komprimierung funktioniert ähnlich wie z.B. das Zip-Format: Vereinfacht gesagt wird in einem Haufen vorliegender Daten nach (durchaus sehr komplexen) wiederkehrenden Mustern gesucht. Das Muster muss man nur ein mal abspeichern und kann an den entsprechenden Stellen daruaf verweisen --> spart Daten. Die Audio-Qualität bleibt voll erhalten. Der maximal mögliche Komprimierungsgrad hängt von der Art der Musik, aber auch von der Wortbreite und Abtastrate ab. FLAC kann z.B. zwischen 75 % und 30 % komprimieren. Für maximale Komprimierung wird aber auch Zeit und Rechenpower benötigt, um die entsprechenden Muster zu finden. Wichtig bei komprimierenden Audio-Codecs (egal ob verlustbehaftet oder nicht) ist aber auch, dass die Datenstruktur so aufgebaut ist, dass die Nutzdaten in Echtzeit decodiert (entpackt) werden können - sonst könnten diese Formate ja nur verzögert abgespielt werden.
Für verlustbehaftete Komprimierung reicht die Datenreduzierung aber noch nicht. Deshalb werden hier noch diverse psychoakustische Tricks angewandt, um Daten herauszuschneiden, die das Gehirn sowieso nicht wahrnimmt. Bei mp3 z.B. wird der Maskierungseffekt auf die Frequenzbreite und soweit ich weiß auch im Zeitspektrum angewandt. Dazu gehört auch ein LowPass, der die Töne über einer bestimmten Frequenz abschneidet, da sie sowieso nicht mehr hörbar sind.
Diese Parameter zur Datenreduzierung kann man jetzt natürlich bis zur Grenze und darüber hinaus treiben. Spätestens seit es youtube gibt, wissen wir alle, wie das (nicht) klingt.
Übrigens wird bei komprimierten Formaten Qualität nicht mehr in Wortbreite und Abtastrate angegeben (wie auch?!), sondern in der Menge von Durchlaufdaten - in Kilobit pro Sekunde (kbps). Dass damit die Qualität angegeben wird, ist streng genommen nicht mal richtig. Wie oben geschrieben hängt der Komprimierungsgrad auch von der Art der Musik ab. Zwei Audioschnipsel mit gleichem Datendurchsatz und unterschiedlichem Komprimierungsgrad haben also eine unterschiedliche Qualität. Was bedeutet, dass eine mp3 mit fester Bitrate im Song selbst eine schwankende Qualität hat. Deshalb wurden variable Bitraten eingeführt, bei denen man nicht die Bitrate, sondern eine (ohne Erfahrung wenig aussagekräftige und nicht mit andern Encodern* vergleichbare) Qualitätsstufe angibt. Aber nicht vergessen: Wir sind hier im Theorie-Teil...
*im Zweifelsfall nicht mal mit anderen Versionen desselben Encoders Vergleichbar
Praxis
Ich hatte mich mal für eine Studienarbeit hingesetzt und einen Vergleich gemacht. Einen geeigneten Song (volles Frequenzspektrum, klare Transienten, knackige Bässe) im FLAC Format genommen, davon eine mp3 mit 256 kbps fixer Bitrate und eine Ogg Vorbis mit vergleichbarer Qualität (auch fixer Bitrate) erstellt und die 3 miteinander verglichen - also jeweils FLAC mit mp3, FLAC mit ogg und mp3 mit ogg.
Fazit: Bei aktuellen Encodern ist die schlechte Auflösung und der dumpfe Sound Geschichte (vorausgesetzt es werden die höheren Bitraten benutzt). Klangliche Unterscheide sind trotzdem da. Bei beiden verlustbehaftet komprimierten Formaten war der Brillanzbereich und etwas darüber überbetont im Vergleich zum Original (also der FLAC Datei). Ich vermute, dass damit versucht wird, das Hirn von der LowPass-Filterung abzulenken.
Im Endeffekt waren die Unterschiede alle nur sehr klein. Ohne Direktvergleich könnte ich die Formate niemals voneinander unterscheiden (wenn man nicht zufällig grade einen Song hat, in dem bei gewissen Passagen Komprimierungsartefakte auftreten - kommt hin und wieder vor). Ogg klang im Vergleich zu mp3 etwas besser und war auch näher am Original. Aber alles, wie gesagt, nur sehr minimal.
Test-Equipment war ein TC Electronics Interface der Konnekt Serie, betrieben mit 44,1 kHz; daran eine Syrincs M3 220 und ein Beyerdynamic DT 770 pro. Abgespielt wurden die Files von Reaper - also die versteckte Auto-Verschönerung mancher Media Player ausgeschlossen.
An dieser Stelle soll noch gesagt werden, dass das menschliche Ohr die wahrgenommene Lautstärke über die Summe aller Tonsignale bestimmt. Damit sind verlustbehaftet komprimierte Audiodateien (aus denen bestimmte Töne herausgeschnitten wurden) im Vergleich zum Original per Definition leiser. Auswirkungsbereich: eher im homöopathischen Bereich - möglicherweise spürbar. So wirklich hörbar nicht.
Es ist wohl unnötig zu erwähnen, dass die Konvertierung einer Datei in ein qualitativ besseres Format sinnlos ist - das wäre als ob man ein kleines Bild groß zoomen würde.
Korrekturen bitte per PN an mich.
Theorie
Bei digitalen Audio-Formaten unterscheidet man nach Rohdaten, verlustfreier Komprimierung und verlustbehafteter Komprimierung.
Rohdaten sind Daten, die vom Analog-Digital-Wandler kommen, genannt Samples. Also einzelne Zahlenwerte, die die Lautstärke des jeweiligen Samples repräsentieren. Bei 24 Bit hat man also 224 --> etwa 16 Millionen Raster zur Einteilung der Lautstärke. Die müssen nicht unbedingt linear sein (zur Optimierung der SNR), aber das interessiert uns an der Stelle nicht. Und bitte nicht verwechseln: Hier reden wir von Fixed Point Signalverarbeitung, wie sie für die Speicherung auf Datenträgern genutzt wird. Die 40 Bit Floating Point, mit denen das x32 intern arbeitet, können damit nicht verglichen werden.
Ein Rohformat schreibt also pro Sekunde einen Haufen Samples (wie oft hängt von der Abtastrate ab, also z.B. 48.000 mal bei 48 kHz) irgendwo auf ein Speichermedium. Jetzt gibts noch verschiedene Formen, wie die Samples geschrieben werden - z.B. ob die Zahl von vorn nach hinten geschrieben wird oder umgedreht. Deshalb gibt es auch verschiedene Rohdaten-Formate.
Die Datenmenge kann man sich ausrechnen, in dem man die Wortbreite (Bitrate) mit der Abtastrate multipliziert - gibt die Datenmenge für eine Sekunde pro einem Kanal - und das ganze dann mit der Anzahl der Kanäle und der Zeit verrechnet. Die Verwaltungsdaten, die da nebenbei anfallen, fallen größenmäßig unter den Tisch.
Bei komprimierten Formaten ist das aber etwas anders. Um die Datenmenge zu reduzieren, gibt es verschiedene Wege.
Verlustfreie Komprimierung funktioniert ähnlich wie z.B. das Zip-Format: Vereinfacht gesagt wird in einem Haufen vorliegender Daten nach (durchaus sehr komplexen) wiederkehrenden Mustern gesucht. Das Muster muss man nur ein mal abspeichern und kann an den entsprechenden Stellen daruaf verweisen --> spart Daten. Die Audio-Qualität bleibt voll erhalten. Der maximal mögliche Komprimierungsgrad hängt von der Art der Musik, aber auch von der Wortbreite und Abtastrate ab. FLAC kann z.B. zwischen 75 % und 30 % komprimieren. Für maximale Komprimierung wird aber auch Zeit und Rechenpower benötigt, um die entsprechenden Muster zu finden. Wichtig bei komprimierenden Audio-Codecs (egal ob verlustbehaftet oder nicht) ist aber auch, dass die Datenstruktur so aufgebaut ist, dass die Nutzdaten in Echtzeit decodiert (entpackt) werden können - sonst könnten diese Formate ja nur verzögert abgespielt werden.
Für verlustbehaftete Komprimierung reicht die Datenreduzierung aber noch nicht. Deshalb werden hier noch diverse psychoakustische Tricks angewandt, um Daten herauszuschneiden, die das Gehirn sowieso nicht wahrnimmt. Bei mp3 z.B. wird der Maskierungseffekt auf die Frequenzbreite und soweit ich weiß auch im Zeitspektrum angewandt. Dazu gehört auch ein LowPass, der die Töne über einer bestimmten Frequenz abschneidet, da sie sowieso nicht mehr hörbar sind.
Diese Parameter zur Datenreduzierung kann man jetzt natürlich bis zur Grenze und darüber hinaus treiben. Spätestens seit es youtube gibt, wissen wir alle, wie das (nicht) klingt.
Übrigens wird bei komprimierten Formaten Qualität nicht mehr in Wortbreite und Abtastrate angegeben (wie auch?!), sondern in der Menge von Durchlaufdaten - in Kilobit pro Sekunde (kbps). Dass damit die Qualität angegeben wird, ist streng genommen nicht mal richtig. Wie oben geschrieben hängt der Komprimierungsgrad auch von der Art der Musik ab. Zwei Audioschnipsel mit gleichem Datendurchsatz und unterschiedlichem Komprimierungsgrad haben also eine unterschiedliche Qualität. Was bedeutet, dass eine mp3 mit fester Bitrate im Song selbst eine schwankende Qualität hat. Deshalb wurden variable Bitraten eingeführt, bei denen man nicht die Bitrate, sondern eine (ohne Erfahrung wenig aussagekräftige und nicht mit andern Encodern* vergleichbare) Qualitätsstufe angibt. Aber nicht vergessen: Wir sind hier im Theorie-Teil...
*im Zweifelsfall nicht mal mit anderen Versionen desselben Encoders Vergleichbar
Praxis
Ich hatte mich mal für eine Studienarbeit hingesetzt und einen Vergleich gemacht. Einen geeigneten Song (volles Frequenzspektrum, klare Transienten, knackige Bässe) im FLAC Format genommen, davon eine mp3 mit 256 kbps fixer Bitrate und eine Ogg Vorbis mit vergleichbarer Qualität (auch fixer Bitrate) erstellt und die 3 miteinander verglichen - also jeweils FLAC mit mp3, FLAC mit ogg und mp3 mit ogg.
Fazit: Bei aktuellen Encodern ist die schlechte Auflösung und der dumpfe Sound Geschichte (vorausgesetzt es werden die höheren Bitraten benutzt). Klangliche Unterscheide sind trotzdem da. Bei beiden verlustbehaftet komprimierten Formaten war der Brillanzbereich und etwas darüber überbetont im Vergleich zum Original (also der FLAC Datei). Ich vermute, dass damit versucht wird, das Hirn von der LowPass-Filterung abzulenken.
Im Endeffekt waren die Unterschiede alle nur sehr klein. Ohne Direktvergleich könnte ich die Formate niemals voneinander unterscheiden (wenn man nicht zufällig grade einen Song hat, in dem bei gewissen Passagen Komprimierungsartefakte auftreten - kommt hin und wieder vor). Ogg klang im Vergleich zu mp3 etwas besser und war auch näher am Original. Aber alles, wie gesagt, nur sehr minimal.
Test-Equipment war ein TC Electronics Interface der Konnekt Serie, betrieben mit 44,1 kHz; daran eine Syrincs M3 220 und ein Beyerdynamic DT 770 pro. Abgespielt wurden die Files von Reaper - also die versteckte Auto-Verschönerung mancher Media Player ausgeschlossen.
An dieser Stelle soll noch gesagt werden, dass das menschliche Ohr die wahrgenommene Lautstärke über die Summe aller Tonsignale bestimmt. Damit sind verlustbehaftet komprimierte Audiodateien (aus denen bestimmte Töne herausgeschnitten wurden) im Vergleich zum Original per Definition leiser. Auswirkungsbereich: eher im homöopathischen Bereich - möglicherweise spürbar. So wirklich hörbar nicht.
Es ist wohl unnötig zu erwähnen, dass die Konvertierung einer Datei in ein qualitativ besseres Format sinnlos ist - das wäre als ob man ein kleines Bild groß zoomen würde.
Korrekturen bitte per PN an mich.
- Eigenschaft
Zuletzt bearbeitet: