Kurze Frage zu Firewire-Interfaces - 96 kHz/192 kHz?

Davon mal abgesehen sollte man ungerade Berechnungen generell vermeiden und von späterer DAW Wandlung ist allgemein eher abzuraten. Aber ich will jetzt keine leidige SRC Diskussion starten und deren Qualitätsunterschiede ausdiskutieren.

Also was tun, wenn man schlecht plant und im Homestudio keine vernünftigen und sündhaft teuren SRC parat hat? Die Antwort ist relativ simpel und praktisch.

Einem korrekt implementiertem Resampler ist es egal wie das Verhältnis von Ein- zu Ausgangsrate ist.

Bei geradem Verhältnis (zB 1/2 von 88.1 zu 44.1 kHz) muss genauso mit einem Tiefpass gefiltert werden wie bei einem ungeraden (zB 147/160 von 48 auf 44.1 kHz). Die Denkweise "aber bei geradem Verhältnis muss man ja nur jedes 2. Sample wegwerfen" ist falsch.

Gute Resampler gibts gratis, bestes Beispiel: SoX. Super konfigurierbar und arbeitet sauber bis -170 dB (wenn man das braucht...). Solche Filter findet man in keinem DA- oder AD-Wandler. Zugegebnermaßen wäre das auch sinnlos...
 
Bei einer Produktion geht es eher darum unnötigen Aufwand und mögliche Qualitätsverluste zu vermeiden. Das schliesst Konvertierung und Rundungsgenauigkeit mit ein.
 
Bei einer Produktion geht es eher darum unnötigen Aufwand und mögliche Qualitätsverluste zu vermeiden. Das schliesst Konvertierung und Rundungsgenauigkeit mit ein.
Ich würde argumentieren, dass die Qualität bei Konvertierung von höheren Sampleraten auf zB. von 96 auf 44.1 kHz höher ist als direkt mit 44.1 kHz aufzunehmen bzw. zu arbeiten. (Nicht notwendigerweise hörbare Unterschiede..)

Ein Lavry AD122-96 MKII ($ 7500) schafft unter idealsten Bedingungen rund 21 ENOB (effective number of bits). Der erwähnte Resampler schafft locker über 23 ENOB (also perfekt für 24 Bit Dateien). Von Rundungsfehlern kann also nicht die Rede sein.

Ob es den Aufwand Wert ist eine Konvertierung durchzuführen muss jeder selbst beurteilen, sofern man von Aufwand sprechen kann (2 Klicks und mehrere 5.1 Tracks werden innerhalb weniger Sekunden umgewandelt).


edit: Ach ja, Lavry baut soweit ich weiß nur max. 96 kHz Wandler, u.a. aus oben genannten Gründen.
 
Ich würde argumentieren, dass die Qualität bei Konvertierung von höheren Sampleraten auf zB. von 96 auf 44.1 kHz höher ist als direkt mit 44.1 kHz aufzunehmen bzw. zu arbeiten. (Nicht notwendigerweise hörbare Unterschiede..)

Was willst Du denn mit 96khz im Audiobereich und was soll nach der Konvertierung auf 44.1 kHz eine höhere Qualität aufweisen?
 
Was willst Du denn mit 96khz im Audiobereich und was soll nach der Konvertierung auf 44.1 kHz eine höhere Qualität aufweisen?
Was ich argumentieren will habe ich doch geschrieben. Ich habe nichts von der Verwendung von 96 kHz für die Reproduktion von Audio geschrieben.

Zum zweiten Punkt: viele ADCs (als auch DACs) haben Filter die alles andere als perfekt sind. Sieh dir die Filter einfach selbst mal an. Viele erreichen den Sperrbereich erst ein Stück nach Fs/2. Das führt zu (starkem) Aliasing im obersten Frequenzbereich. Vielleicht hast du ja schon mal von halfband Tiefpassfiltern gehört, die werden da gerne verwendet, weil es Rechenzeit spart. Nur leider beträgt deren Dämpfung bei Fs/2 nur 6.02 dB. Es gibt auch Filter die einfach bei 20 kHz abschneiden.

Mit Software kann man praktisch beliebige Dämpfung im Sperrbereich erreichen. Die Welligkeit im Durchlassbereich geht ebenso gegen Null. Phasengang ist ebenso frei konfigurierbar von minimal bis linear. Durchlassbereich kann ebenso konfiguriert werden, bei SoX bis zu 99% (rund 21800 Hz).

Die "höhere Qualität" hängt natürlich stark vom ADC ab. Zum Beispiel sind manche bei 44.1 kHz mies und bei 48, 96 kHz gut. Andere sind bei 44.1 und 48 kHz vergleichbar. Und so weiter..

Ich könnte noch mehr ins Detail gehen aber das ist schon ziemlich off-topic. Ich denke die grundlegenden Punkte hinter meinem Argument wurden genannt.


edit: Ich verstehe die Angst vor Abstastratenkonvertierung nicht. Die Zeiten linearer Interpolation sind doch schon lange vorbei..

edit2: Nichtlineare Effekte arbeiten ebenfalls sauberer mit höheren Abtastraten.
 
zulu schrieb:
Was ich argumentieren will habe ich doch geschrieben. Ich habe nichts von der Verwendung von 96 kHz für die Reproduktion von Audio geschrieben.

Du hast aber geschrieben, dass die Qualität bei Konvertierung von höheren Sampleraten wie 96 auf 44.1 kHz höher ist als direkt mit 44.1 kHz aufzunehmen. Und 44.1 werden nunmal im Audiobereich verwendet.

Wenn die Qualität durch Deine Konvertierungstheorie positiv beeinflusst wäre, dann würde ab morgen jedes mastering Studio einen 96kHz Mix für die Audioproduktion verlangen.

Ich verstehe die Angst vor Sampleratenkonvertierung nicht. Die Zeiten linearer Interpolation sind doch schon lange vorbei..

Es geht nicht um SRC Angst sondern um überflüssiges konvertieren.

Für Audio und Radio/Filmproduktion gibt es Standards. In der Regel wird einem sogar gesagt welche Samplingraten vorliegen sollen. Ich wüsste nicht weshalb man sich nicht daran halten sollte.

Es kann zwar vorkommen, dass eine Produktion auf SRC zurückgreifen muß, Radiospot oder Filmsound auf Audio CD oder sonst irgendwas. Aber es ist sehr unwahrscheinlich das die Post production bzw. Mastering Studio dafür Deine anfangs erwähnten kostenlosen SRC Plug ins einsetzen würde.
 
Du hast aber geschrieben, dass die Qualität bei Konvertierung von höheren Sampleraten wie 96 auf 44.1 kHz höher ist als direkt mit 44.1 kHz aufzunehmen. Und 44.1 werden nunmal im Audiobereich verwendet.
Ja, zur Wiedergabe von Audio wird meist 44.1 kHz verwendet. Aber zur Aufnahme und zum Mixen etc. kann man praktisch beliebige Abtastraten verwenden.

Wenn die Qualität durch Deine Konvertierungstheorie positiv beeinflusst wäre, dann würde ab morgen jedes mastering Studio einen 96kHz Mix für die Audioproduktion verlangen.
Jedes Mastering Studio das ich kenne nimmt gerne 96 kHz Mixes auch wenn das Ergebnis letztendlich "nur" eine Audio CD wird. Aber Grundsätzlich ist es deine Entscheidung welche Abtastrate du verwendest, ein Mastering Studio sollte einem da mM nach nicht dreinreden. Ansonsten könnten sie von dir ja auch verlangen, dass du den Wandler X und die Mics Y an Position Z mit den Instrumenten A, B und C und ... verwendest, weil es die Qualität des Mixes positiv beeinflussen würde..

Es geht nicht um SRC Angst sondern um überflüssiges konvertieren.
Wie gesagt, einige Plugins haben nichtlineare Effekte die zu Aliasing führen wenn das Plugin intern nicht upsampled. Also muss es bei niedrigen Abtastraten 4x oder 8x upsamplen .. eine überflüssige Konvertierung wenn man den Mix in höherer Abtastrate vorliegen haben könnte. Auch so etwas simples wie ein EQ kann nahe Fs/2 stark verzerrte Frequenz- und Phasengänge produzieren. EQ bei 10 kHz ist keine Seltenheit, aber bei 40 kHz schon bzw. ist es dort oben egal wie es aussieht.

Für Audio und Radio/Filmproduktion gibt es Standards. In der Regel wird einem sogar gesagt welche Samplingraten vorliegen sollen. Ich wüsste nicht weshalb man sich nicht daran halten sollte.
Wir sprechen hier schon wieder von Wiedergabe.

Es kann zwar vorkommen, dass eine Produktion auf SRC zurückgreifen muß, Radiospot oder Filmsound auf Audio CD oder sonst irgendwas. Aber es ist sehr unwahrscheinlich das die Post production bzw. Mastering Studio dafür Deine anfangs erwähnten kostenlosen SRC Plug ins einsetzen würde.
Müssen sie auch nicht. Die haben genug Geld sich teure Resampler zu leisten, die zB noch geringere CPU-Auslastung verursachen und vielleicht nicht bis -170 sondern -180 dB sauber arbeiten. Wahrscheinlich legen die auch auf bezahlten Support Wert. Wer's braucht..



edit: Und noch was zu überflüssigen Konvertierungen. Mit einem guten Resampler kannst du von 192 kHz nach 64 kHz und dann nach 88.2 kHz und dann nach 96 kHz und dann nach 176.4 kHz und dann wieder nach 192 kHz und abschließend nach 44.1 kHz umwandeln. Das Ergebnis ist praktisch identisch mit einer direkten Umwandlung auf 44.1 kHz. Man müsste wahrscheinlich ein paar hundert Umwandlungen machen, um ein Ergebnis zu erreichen das bei 24 Bit Dateien einen Unterschied machen würde...
 
Zuletzt bearbeitet:
Grundlegend: Veröffentlichungen auf CD oder per mp3 finden bei 44,1kHz statt. Der Ton für Videos ist meist in 48kHz. Das heißt selbst mit "nur" 96kHz bist du für beides bestens gerüstet.

Was ist die Samplerate überhaupt? Nun: Die Rate (das heißt Häufigkeit pro Sekunde) mit der Samples genommen werden, d. h. das analoge Signal abgetastet wird. Grundlegend gilt zwar: Je höher desto detaillierter, de facto arbeiten allerdings die wenigsten mit 192kHz, da es die Rechnerleistung und den Speicherplatzbedarf um ein vielfaches erhöht, ohne eine wirkliche Qualitätssteigerung, die sich mit den Worten "Tag und Nacht" beschreiben ließe. Darüber hinaus besteht ein Interface aus mehr als nur dem Konverter-Chip... und günstigere Interfaces sind bisweilen nicht unbedingt in der Lage, einen Prozess 192.000 mal pro Sekunde so präzise durchzuführen, wie sie das 44.100 mal pro Sekunde schaffen. Das kann dann zu Jitter oder Knacksern, Clicks und Pops führen, die dir eine Aufnahme ruinieren können.

Ein häufiges, zu kurz gedachtes, Argument, das ich mir nicht vorwerfen lassen möchte: "Wenn ich mit 44,1kHz veröffentliche, dann brauche ich doch keine höhere Sampleraten?" Vielleicht wird der Denkfehler klar, wenn man die Parallele zur Fotobearbeitung zieht: Wenn ich in einem 640*480 JPG den Kontrast und den Weißabgleich ändere und Pickel retuschiere, sieht das am Ende nicht so gut aus, wie wenn ich das in der ursprünlichen 22-Megapixel-Datei mache und sie dann runterrechne. Ähnlich ist es beim Ton: Je mehr Detail ich z. B. meinen Reverb-Plugins während dem Mix füttern kann, und je später ich runterrechne, desto besser.

Allerdings langt dafür doppelte Redundanz vollkommen. Ich persönlich arbeite für CDs/mp3s also mit 88,2kHz und für Videos mit 96kHz. Auf diese Weise ist meine Samplerate immer exakt die doppelte des Nötigen, was die Umrechnung dann auch einfacher macht. Den Sinn für höhere Sampleraten sehe ich nicht, solange die Medien der Veröffentlichung sich nicht ändern.

Faktor zur Wahl des Audio-Interfaces wäre es für mich jedenfalls auf keinen Fall. Da gibt es wirklich wichtigere Aspekte (Preamps, analoge Schaltungen, Converter-Chips, Anschlussmöglichkeiten, Treiberstabilität...).


Ein Wort zum Nyquist, der Threadersteller darf's gern ignorieren: Ich bin da kein Experte, ich glaube aber das hier vorliegende Missverständnis besteht darin, dass dieser Mensch zwei grundlegende Sachen gesagt hat:

1. Das Nyquist-Theorem: Die höchste aufzunehmende Frequenz verdoppelt ergibt die nötige Samplerate (also: 44,1kHz langt für alles, was bis 22,05kHz klingt)

2. Bei der Hälfte der Samplerate liegt eine Frequenz, um die herum entstehen irgendwelche - und hier kenne ich mich nicht wirklich aus, deklariere meinen Post also als gefährliches Halbwissen und nur als Diskussionsgrundlage für Leute, die's besser wissen, wie Signalschwarz - Falteffekte. Das wird häufig als Argument GEGEN wirklich hohe Sampleraten verwendet. Will sagen: wenn unsere Samplerate 88,2kHz ist, liegt diese Faltfrequenz bei 44,1kHz. Mit "Faltfrequenz" (Ich weiß aus dem Kopf nicht mehr, wie Nyquist das nannte) meine ich, dass Dinge, die beispielsweise 20kHz über dieser Frequenz passieren (also bei 64,1kHz) Auswirkungen auf Dinge haben, die 20kHz darunter passieren (also bei 24,1kHz). Das kann ungewollte konstruktive oder destruktive Interferenzen bewirken, sprich: Resonanzen oder Auslöschungen. Heißt: Damit, dass wir Zeug aufnehmen, das wir gar nicht brauchen und hören können, schädigen wir möglicherweise Zeug im hörbaren Bereich. Und die Quelle für den Schaden liegt im unhörbaren Bereich. Deswegen verwenden Konverter unter anderem auch Tiefpassfilter (deren Qualität beispielsweise für mich eines dieser aussagekräftigeren Kaufargumente wäre als die maximale unterstützte Samplerate), die z. B. ab 35kHz nichts mehr aufnehmen. Und nach dem Nyquist-Theorem (S. Punkt 1) brauchen wir dann auch keine Samplerate über 70kHz. Die gibt's aber nicht, also nehme ich 88,2. Puh.

Besser wissen und erklären können tut das alles der Herr Lavry, der sehr angesehene Konverter baut und das hier geschrieben hat: http://lavryengineering.com/pdfs/lavry-sampling-theory.pdf
 
Ihr hängt euch viel zu sehr an den Abtastfrequenzen auf, dabei spielen die eine eher untergeordnete Rolle im Vergleich zu solchen Themen wie Rauschen und Linearität. Man kann mal getrost davon ausgehen, dass die meisten Interfaces und speziell alle im Compuer verbauten Karten kaum auf 90dB(sfdr) kommen und damit gerade 16 Bit auslasten.

Die erhöhte Abtastrate ist nur bei Aufnahmen nutzbringend, wo die Mikros das auch hergeben, die anschließende Analogkette bis weit jenseits der 20kHz linear genug ist (was sie meistens NICHT ist), die Wandlung auf echten 24Bit/192 beruht (da wird oft mit dem oversampling gemogelt und derselbe Wandler eingesetzt) und die gesamte Mischkette inklusive der letztlichen Filterung gut und genau genug ist.

Wer am Ende nur für 44kHz CDs produziert kann guten Gewissens direkt mit 44kHz aufnehmen und produzieren. Solange er eine ordentliche Aussteuerung gewähren kann reichen sogar 16 Bit.

Und wer unterstellen muss, dass seine Konsumenten gar reduzierte Formate hören wie MP3 etc.. - bzw sich die Musik über schlechte Lautsprecher oder gar Billigkopfhörer reinziehen, der braucht sich um das Thema Aufnahmequalität keine Gedanken zu machen. Da reicht die Technik von vor 20 Jahren!

Der Unterschied von 48kHz auf 96kHz und 192kHz liegt technisch je nach Filtergrenzfrequenz und Güte im Bereich von einigen % bis 10% im oberen Spektrum, da sich da im Audiobereich aber meist wenig tut (S und T -Laute generieren hier den grössten Anteil) ändert sich am Gesamtmix oft nur wenig und der Gewinn liegt meist deutlich unter 1%, um die an näher an das unverfälschte Ideal rankommt. Normale Lautsprecher haben aber schon Verzerrungen um 5% Nichtlinearität, billige Kopfhörer bis zu 20% inklusive unwillkürlicher Oberwellen.

Das MP3-Format ändert /normiert ein Signal im Oberwellengehalt sogar um bis zu 70%. Die Differenz zwischen mp3 und audio.wav ist , wenn man sie mal ausdrücklich bildet und abhört, direkt unverstärkt hörbar. Da sind noch 8-10 Bits wirklich authentisch! Der Fehler, der durch das Rauschen billiger Soundchips im Computer generiert wird, ist da oft schon kleiner.

Die Diskussion um die 96kHz war vor 10 Jahren mal aktuell, als man noch davon ausging, dass sich -ausgehend vom Hi-Fi/Hi-Com Sektor - bessere Anlagen würden etablieren lassen und man mit der DVD und vor allem der SACD Erfolg haben könnte. Da machte der Umstieg auf 96k-Ausstattung richtig Sinn. Dann aber setzte sich mp3 immer mehr durch, weil die Smartphones in Mode kamen und nun nicht nur MP3-Player sondern auch die Telefone dudelten. Auch die Nicht-Elektroingenieure hier im Forum können sich an 3 Fingern abzählen, was mit DA-gewandelten analogen Signalen passiert, die in einem solchen Gerät geführt werden, in dem ansonsten high-speed digitale Signale ihr Unwesen treiben und dies in nur wenigen mm-Abstand. Die ganzen Leitungen und Kapazitäten wirken wie schlecht optmierte NF-Filter und führen je nach niederfrequentem Anteil der HF-Störungen zu Störfrequenzen im kompletten Spektrum und eben auch zu hörbaren Frequenzen. Beim IPhone z.B. gemessenen -32dB. Damit liegen diese für einen mittleren Pegel von -10dB schon im Bereich von 1% Störanteil des Signals -> es sind nicht einmal 7 Bit komplett sauber.:D

Die 192kHz haben ihre Berechtigung, wenn es um Feinheiten geht - in der Regel und im Consumerbereich ist das Augewischerei. Die meisten Wandler werden einfach mit einem Faktor 2 weniger oversampling gefahren und produzieren dann statt 256x 96kHz einfach 128x 192kHz. Eingangsfilter und Qualität bleiben dieselbe. Ganz genau genommen, wird es sogar minimal schlechter :p

Mit 192kHz sollte man z.B. dann aufnehmen, wenn man später für 96kHz und auch 44kHz produzieren will. Je grösser der Abtastüberhang, desto besser wirken die digitalen Filter, die man später einsetzen muss, um AA zu verhindern und downconversion zu betreiben, weil die 44kHz nicht in die 192k reinpassen.
Das Sauberste ist nach wie vor, direkt in 44k aufzunehmen und wiederzugeben, lediglich wenn umfangreich bearbeitet werden soll lohnt mehr Abtastung, dann aber möglichst ganzzahlig! Komischerweise unterstützen aber viele Wandler und Protokolle keine 88kHz oder die benötigten 176kHz.

Die meisten Geräte werden halt nach Marketinggesichtspunkten gebaut und nicht nach technischen.....:redface:

- - - Aktualisiert - - -

Einem korrekt implementiertem Resampler ist es egal wie das Verhältnis von Ein- zu Ausgangsrate ist.
...

Wie definierst Du einen "korrekt" implementierten Resampler? Bei nicht ganzzahligen Verhältnissen muss der Interpolieren und je nach Filtertyp hast Du damit Verzerrungen = neue Frequenzen. Idealerweise liegen die weit jenseits von Nyquist und fallen damit dem späteren AAF bei der DAC zum Opfer, aber ein solches Filter lässt sich nur sehr aufwändig implementieren und besitzt unweigerlich lineare Verzerrungen unterhalb von Nyquist, weil es keinen idealen steilen Filter gibt.

Bei geradem Verhältnis (zB 1/2 von 88.1 zu 44.1 kHz) muss genauso mit einem Tiefpass gefiltert werden wie bei einem ungeraden (zB 147/160 von 48 auf 44.1 kHz). Die Denkweise "aber bei geradem Verhältnis muss man ja nur jedes 2. Sample wegwerfen" ist falsch.

Das ist so nicht ganz richtig. Bei einem Ganzzahlverhältnis kann man sehr wohl jedes zweite Sample weglassen, ohne einen zusätlzichen Fehler zu begehen, siehe Grundlagen DDC und DUC- solange die GF genügend weit unterhalb Nyquist/2 liegt. Davon muss man ausgehen, wenn man bei Audio von 48k auf 96k+ hochgeht. Wenn man das nicht tut unterstellt man, dass die GF höher liegt, was a) oft eben nicht der Fall ist und b) dann Sinn macht, wenn man auch auf 96k wiedergibt und der AA Filter des Zielsystems das Problem beseitigt. Wer später wieder auf 44 runter will, schafft sich nur die Aufgabe, sauberer zu interpolieren, als es der AD-Chip und sein optmierter AA-Filter im 96k-System tut und kann. Das ist zwar möglich, wie Du beschreibst - aber ohne Nutzen, da man ein Problem löst, dass man ohne die 96k und die Unsicherheit der initial GF des Eingangs-AA-Filters gar nicht erst hätte.

Fazit: Man arbeitet bei 44kHz und einem z.B. AA-Filter bei 3dB@16kHz mit genügender Sperrwirkung bei 20kHz. Passt.

Die Alternative, ein flaches und weniger verzerrendes Filter mit GF bei z.B. 25kHz@96kHz mit Sperrband ab 40kHz sieht zwar erst mal viel besser aus, bedarf aber dann bei der Umwandlung von 96k auf 44k eines digitalen Filters, der dann doch wieder einen Kompromiss mit der Grenzfrequenz eingehen muss. Ergebniss 2 hintereinandergeschalte Filter mit 2x Verzerrungen statt einmal.
 
  • Gefällt mir
Reaktionen: 2 Benutzer
Das MP3-Format ändert /normiert ein Signal im Oberwellengehalt sogar um bis zu 70%. Die Differenz zwischen mp3 und audio.wav ist , wenn man sie mal ausdrücklich bildet und abhört, direkt unverstärkt hörbar. Da sind noch 8-10 Bits wirklich authentisch! Der Fehler, der durch das Rauschen billiger Soundchips im Computer generiert wird, ist da oft schon kleiner.
Was soll das bedeuten (70%)?

Wenn ich einen Track mit durchschnittlicher RMS-Amplitude von -39 dB mit lame V0 kodiere, und dann eine einfache Differenz der beiden Dateien nehme hat das, was übrig bleibt eine durchschnittliche RMS-Amplitude von -74 dB.

Dann aber setzte sich mp3 immer mehr durch, weil die Smartphones in Mode kamen und nun nicht nur MP3-Player sondern auch die Telefone dudelten. Auch die Nicht-Elektroingenieure hier im Forum können sich an 3 Fingern abzählen, was mit DA-gewandelten analogen Signalen passiert, die in einem solchen Gerät geführt werden, in dem ansonsten high-speed digitale Signale ihr Unwesen treiben und dies in nur wenigen mm-Abstand. Die ganzen Leitungen und Kapazitäten wirken wie schlecht optmierte NF-Filter und führen je nach niederfrequentem Anteil der HF-Störungen zu Störfrequenzen im kompletten Spektrum und eben auch zu hörbaren Frequenzen. Beim IPhone z.B. gemessenen -32dB. Damit liegen diese für einen mittleren Pegel von -10dB schon im Bereich von 1% Störanteil des Signals -> es sind nicht einmal 7 Bit komplett sauber.:D
Sowas habe ich noch nie gehört und widerspricht auch allen Messungen, die ich gesehen habe. Unter welchen Bedingungen wurden diese Messungen durchgeführt?
Die iDevices sind durchaus gute Audioquellen (schlagen so manches billig Interface) und auch darauf optimiert Kopfhörer anzutreiben (was man sogar von manchen "pro" Audio-Interfaces nicht behaupten kann..).

Mit 192kHz sollte man z.B. dann aufnehmen, wenn man später für 96kHz und auch 44kHz produzieren will. Je grösser der Abtastüberhang, desto besser wirken die digitalen Filter, die man später einsetzen muss, um AA zu verhindern und downconversion zu betreiben, weil die 44kHz nicht in die 192k reinpassen.
Das Sauberste ist nach wie vor, direkt in 44k aufzunehmen und wiederzugeben, lediglich wenn umfangreich bearbeitet werden soll lohnt mehr Abtastung, dann aber möglichst ganzzahlig! Komischerweise unterstützen aber viele Wandler und Protokolle keine 88kHz oder die benötigten 176kHz.

Die meisten Geräte werden halt nach Marketinggesichtspunkten gebaut und nicht nach technischen.....:redface:
Das "nicht reinpassen" von 44.1 in 192 ist kein (technisches) Argument für bessere Audioqualität.

Wie definierst Du einen "korrekt" implementierten Resampler?
Korrekt implementierte Resampler sind solche, die Filter verwenden, welche (für bspw. 16 bit / 44.1 kHz Audio)
- minimale Welligkeit im Durchlassbereich haben
- dem Format entsprechende Unterdrückung im Sperrbereich haben (~125 dB)
- einen entsprechend hohe Grenzfrequenz haben (~21 kHz, idealerweise konfigurierbar)
- der Sperrbereich entsprechend früh beginnt (~23.1 kHz mit erlaubtem Aliasing, 22.05 kHz ohne)
- Phasengang ist eigtl. nur bei niedrigeren Abtastraten entscheidend (idealerweise konfigurierbar)

Bei nicht ganzzahligen Verhältnissen muss der Interpolieren und je nach Filtertyp hast Du damit Verzerrungen = neue Frequenzen. Idealerweise liegen die weit jenseits von Nyquist und fallen damit dem späteren AAF bei der DAC zum Opfer,
Nein, mit entsprechendem Filter hat man keine zustätzlichen Verzerrungen und diese Filter benötigt man in beiden Fällen (ob der Faktor fraktional oder ganzzahlig ist ist egal).
Über Nyquist können keine neue Frequenzen erzeugt werden, daher heißt es ja auch Aliasing - alle Frequenzen über Nyquist werden "zurückgespiegelt", somit können sie auch nicht einem AAF eines DACs zum Opfer fallen.

aber ein solches Filter lässt sich nur sehr aufwändig implementieren und besitzt unweigerlich lineare Verzerrungen unterhalb von Nyquist, weil es keinen idealen steilen Filter gibt.
Das ist richtig und in einem ADC kann aufgrund der Komplexität kein beliebig komplexer Filter verwendet werden. In einem Software-Resampler, der offline arbeitet, schon.

Das ist so nicht ganz richtig. Bei einem Ganzzahlverhältnis kann man sehr wohl jedes zweite Sample weglassen, ohne einen zusätlzichen Fehler zu begehen, siehe Grundlagen DDC und DUC- solange die GF genügend weit unterhalb Nyquist/2 liegt.
Egal wo die GF liegt, entscheidend ist doch dass "keine" Frequenzen >= Nyquist/2 enthalten sind wenn man jedes zweite Sample wegwerfen möchte. Nur ist das in der Praxis leider so gut wie nie der Fall. Selbst wenn zb ein Mic über 22.05 kHz nichts mehr aufnimmt würde das Rauschen > 22.05 kHz in den hörbaren Bereich zurückgespiegelt werden. Außerdem wäre so ein Signal reine Platzverschwendung.
Auch würde man in diesem speziellen Fall (wegwerfen von Samples) nicht von Resampling sondern Downsampling sprechen.

Davon muss man ausgehen, wenn man bei Audio von 48k auf 96k+ hochgeht.
Ähm, jetzt gehts auf einmal um das Erhöhen der Abtastrate oder verstehe ich dich falsch? In dem Fall bräuchte man erst recht einen Tiefpassfilter.

Wenn man das nicht tut unterstellt man, dass die GF höher liegt, was a) oft eben nicht der Fall ist und b) dann Sinn macht, wenn man auch auf 96k wiedergibt und der AA Filter des Zielsystems das Problem beseitigt. Wer später wieder auf 44 runter will, schafft sich nur die Aufgabe, sauberer zu interpolieren, als es der AD-Chip und sein optmierter AA-Filter im 96k-System tut und kann. Das ist zwar möglich, wie Du beschreibst - aber ohne Nutzen, da man ein Problem löst, dass man ohne die 96k und die Unsicherheit der initial GF des Eingangs-AA-Filters gar nicht erst hätte.
Hier steige ich aus. Aber ich habe keine Lösung eines Problems beschrieben, sondern nur argumentiert, dass ein Resampler dank komplexer Filter praktisch jeden Hardware-Wandler mit dessen integrierten Filtern schlägt. Rein messtechnisch betrachtet natürlich.

Fazit: Man arbeitet bei 44kHz und einem z.B. AA-Filter bei 3dB@16kHz mit genügender Sperrwirkung bei 20kHz. Passt.

Die Alternative, ein flaches und weniger verzerrendes Filter mit GF bei z.B. 25kHz@96kHz mit Sperrband ab 40kHz sieht zwar erst mal viel besser aus, bedarf aber dann bei der Umwandlung von 96k auf 44k eines digitalen Filters, der dann doch wieder einen Kompromiss mit der Grenzfrequenz eingehen muss. Ergebniss 2 hintereinandergeschalte Filter mit 2x Verzerrungen statt einmal.
Beide Fälle sind aber unrealistisch. ADCs haben typischerweise linearphasige "brickwall" Filter verbaut, die zB ab 20 khz (fs=44.1 kHz) hart abschneiden.
Um nochmal an mein Anfangsbeispiel zurückzukommen: wenn du mit 96 kHz aufnimmst dann wird bei 22.05 kHz nichts verzerrt, da der Filter in höheren Frequenzbereichen arbeitet (der Sperrbereich muss ja erst bei 48 kHz erreicht werden und ein Vorteil ist somit, dass der Filter mehr Raum zum Arbeiten hat). Mit dem Software-Resampler danach auf 44.1 kHz runterrechnen ist für Frequenzen kleiner ~21 kHz praktisch verzerrungsfrei.
 
Zuletzt bearbeitet:
Das schaffen wir jetzt im Leben nicht, das alles en detail aufzudröseln und es auch noch so darzustellen, dass ein Leser den Tenor richtig mitnimmt.

nur 2 Punkte:

>minimale Welligkeit im Durchlassbereich haben
Genau das ist der Punkt. Diese "minimale" RestW liegt im Bereich von einigen %ten und damit ist eben nichts mit korrekter Abbildung. Damit ist entscheidend, wo der Filter beginnt. Im 96kHz++ Fall ist es möglich, die Grenzfrequenz eben auf 30kHz zu setzen, die bei 40 schon gut genug sperren (48 wäre Nyquist). Ein Filter der bei 30k erst nennenswert arbeitet, ist bei 20k eben noch auf nahezu 100% wellenfrei. Wenn Du Dir mit einem einschlägigen Filterkoeffezientendesigner mal ansiehst, dann kannst Du Dir ein Bild machen, wieviele Taps man braucht, um da mal 90dB oder besser hinzubekommen.

Zusammengefasst: Die 96k oder besser nutzen nur, wenn die gesamte Kette inklusive der Filter des Widergabesystems darauf angepasst sind. Sonst geht die zwischenzeitliche Güte, die man beim Aufnahmen gewinnt und beim Mischen noch aufrecht erhöten kann, wieder in die Binsen. Insbesondere beim Abspielen bei 44kHz kommen wieder Filter ins Spiel, die einen extremen Kompromiss zwischen Sperrbanddämpfung und Welligkeit im Durchlassband haben. Das gilt auch ganz generell und nicht nur für Audio. (Ich mache seit Jahren nix anderes, als SV, HBF und ähnliches), teilweise Radar, Laser etc). Das Thema Audio nimmt hier nur eine Sonderstellung ein, weil man es sich aufgrund des geringen Energieanteils im oberen Spektrum leisten kann, oberhalb der 10kHz/15kHz ein wenig ungenau zu sein, ohne dass es gross auffällt. Daher haut das so einigermassen hin mit den 44k. Wenn wie Du es ansprichst, ein Filter typisch bei 20k eingesetzt wurde, ist es fast wurscht, ob man bei 48k oder 96k gesampelt hat. Dann geht auch die von mir angedeutete DDC durch Weglassen bei ganzzahligen Verhältnissen.

Das andere Thema Resampling ist davon unberührt. Das geht theoretisch perfekt - trotzdem ist es das Einfachste, man überspringt das Problem, indem man es vermeidet.

Beim Thema MP3 kommt es sehr auf das Ausgangsmaterial an. Wenn in Deinem Beispiel das Verhältnis -30dB/-70dB der Fall war, hast Du eben durchschnittliche 40dB "Störabstand" wenn man das noch so nennen kann. Macht Faktor 100 = 7 Bit Güte.
 
Zur Technik mal kurz , Cakewalk Sonar X2 kann die Engine auf 64bit und Samplingfreqenz auf 384Khz eingestellt werden .

Z.B hat Pionier die Av Tuner auch teils mit 384Khz ausgestattet , für eine CD zum abspielen .Die Argumente sind dem Original Sinus-Ton am nahesten zu kommen.

Für mich zum aufnehmen reichen 24bit und 44,1khz , worauf ich wert lege ist die Dynamik und da habe ich leider schon mit Interfaces schlechte Erfahrung gemacht.

Zu Mp3 das ist eine feine Sache fürs Autoradio zum abspielen , aber fürs Recording ist die Qualität für mich ungeeignet , das hört man .
 
>minimale Welligkeit im Durchlassbereich haben
Genau das ist der Punkt. Diese "minimale" RestW liegt im Bereich von einigen %ten und damit ist eben nichts mit korrekter Abbildung. Damit ist entscheidend, wo der Filter beginnt. Im 96kHz++ Fall ist es möglich, die Grenzfrequenz eben auf 30kHz zu setzen, die bei 40 schon gut genug sperren (48 wäre Nyquist). Ein Filter der bei 30k erst nennenswert arbeitet, ist bei 20k eben noch auf nahezu 100% wellenfrei. Wenn Du Dir mit einem einschlägigen Filterkoeffezientendesigner mal ansiehst, dann kannst Du Dir ein Bild machen, wieviele Taps man braucht, um da mal 90dB oder besser hinzubekommen.
Bei aktuellen ADCs von Cirrus liegt die Welligkeit im Bereich +/- 0,0x dB und bei DACs eine Zehnerpotenz niedriger.

Die benötigten Taps verringern sich enorm, wenn man dem Filter mehr Raum zum arbeiten gibt:
20 - 22.05 kHz, 90 dB, Fs=44.1k kHz, W=0.01 dB: rund 130 Taps
30 - 48 kHz, 90 dB, Fs=96 kHz, W=0.01 dB: rund 30 Taps

Hier der Filter eines ADCs bei 48 kHz (das rote ist Aliasing):
adc441.png
0.4 entspricht 19.2 kHz.


Zusammengefasst: Die 96k oder besser nutzen nur, wenn die gesamte Kette inklusive der Filter des Widergabesystems darauf angepasst sind. Sonst geht die zwischenzeitliche Güte, die man beim Aufnahmen gewinnt und beim Mischen noch aufrecht erhöten kann, wieder in die Binsen. Insbesondere beim Abspielen bei 44kHz kommen wieder Filter ins Spiel, die einen extremen Kompromiss zwischen Sperrbanddämpfung und Welligkeit im Durchlassband haben. Das gilt auch ganz generell und nicht nur für Audio. (Ich mache seit Jahren nix anderes, als SV, HBF und ähnliches), teilweise Radar, Laser etc). Das Thema Audio nimmt hier nur eine Sonderstellung ein, weil man es sich aufgrund des geringen Energieanteils im oberen Spektrum leisten kann, oberhalb der 10kHz/15kHz ein wenig ungenau zu sein, ohne dass es gross auffällt. Daher haut das so einigermassen hin mit den 44k. Wenn wie Du es ansprichst, ein Filter typisch bei 20k eingesetzt wurde, ist es fast wurscht, ob man bei 48k oder 96k gesampelt hat. Dann geht auch die von mir angedeutete DDC durch Weglassen bei ganzzahligen Verhältnissen.
Die genannten Kompromisse sind beim Abspielen geringer als beim Aufnehmen, ansonsten hätte ich das Thema gar nicht erwähnt. Zusätzlich kann man beim Abspielen auch noch Abtastratenkonvertierung betreiben, was manche High-End DACs auch machen um bessere Performance zu erreichen.

Der Filter greift nur mit Fs=44.1 kHz bei 20 kHz, bei höherer Abtastrate haben die Filter auch ein höhere Grenzfrequenz. Somit nochmal, gibt es in der Praxis beim Recording kein Audiosignal wo man einfach Samples wegwerfen kann.


Das andere Thema Resampling ist davon unberührt. Das geht theoretisch perfekt - trotzdem ist es das Einfachste, man überspringt das Problem, indem man es vermeidet.
Wieso Problem? Aber es ist natürlich einfacher direkt in 44.1 aufzunehmen.

Beim Thema MP3 kommt es sehr auf das Ausgangsmaterial an. Wenn in Deinem Beispiel das Verhältnis -30dB/-70dB der Fall war, hast Du eben durchschnittliche 40dB "Störabstand" wenn man das noch so nennen kann. Macht Faktor 100 = 7 Bit Güte.
Naja so funktioniert das aber nicht mit den Bits.
 
>Bei aktuellen ADCs von Cirrus liegt die Welligkeit im Bereich +/- 0,0x dB und bei DACs eine Zehnerpotenz niedriger.
0,0? - also weder eine Welligkeit im GF-Bereich noch grundsätzliche Nichtlinearität noch sonstige Artefakte? Ich nehme an, Du arbeitest für die Marketingabteilung von Cirrus. :D

Also jetzt mal im ernst: Ich arbeite ja industrietechnisch permanent mit hochgenauen Messverstärkern und setze dazu auch hochauflösende Audio ADCs ein, wenw es von der APP her passt und deren Datenblätter stehen bei mir im Büro. Direkt daneben stehen die Ordner mit den Amplituden- und Phasenmessdiagrammen, die wir selber angefertigt haben, weil wir den Datenblättern nicht trauen, bzw Chargenqualifizierung betreiben. Diese Kurven sehen "etwas" anders aus :D

> Hier der Filter eines ADCs bei 48 kHz
Du willst mir hoffentlich nicht verklickern, dass die Beispielgrafik ein reales AA Filter darstellt(?)
Das ist aus MATLAB oder die geplottete Filterkurve. Und selbst da scheint mir noch die Quantisierung zu fehlen.
In jedem Fall fehlt schon mal der weiter fortgesetzte alias in den hörbaren Bereich hinab.

Andererseits kann man an dieser Kurve schön erkennen, dass der Anteil des Alias durchaus absolut gering ist, wenn man wie bei typischem Audio, relativ weniger Anteile im oberen Spektralbereich hat. Somit ist auch die Wirkung der Erhöhung der Abtastfrequenz abschätzbar: Gering eben.
 
Die Daten sind aus Datenblättern und natürlich mit Vorsicht zu genießen. Wenn in einer Messung oder konkreten Implementierung diese Daten um eine oder sogar mehrere Zehnerpotenzen schlechter sind ändert es am Prinzip ... nichts.

Natürlich ist das Aliasing gering, aber mit höherer Abtastfrequenz und Resampling noch geringer. :p
 

Ähnliche Themen


Unser weiteres Online-Angebot:
Bassic.de · Deejayforum.de · Sequencer.de · Clavio.de · Guitarworld.de · Recording.de

Musiker-Board Logo
Zurück
Oben