Ihr hängt euch viel zu sehr an den Abtastfrequenzen auf, dabei spielen die eine eher untergeordnete Rolle im Vergleich zu solchen Themen wie Rauschen und Linearität. Man kann mal getrost davon ausgehen, dass die meisten Interfaces und speziell alle im Compuer verbauten Karten kaum auf 90dB(sfdr) kommen und damit gerade 16 Bit auslasten.
Die erhöhte Abtastrate ist nur bei Aufnahmen nutzbringend, wo die Mikros das auch hergeben, die anschließende Analogkette bis weit jenseits der 20kHz linear genug ist (was sie meistens NICHT ist), die Wandlung auf echten 24Bit/192 beruht (da wird oft mit dem oversampling gemogelt und derselbe Wandler eingesetzt) und die gesamte Mischkette inklusive der letztlichen Filterung gut und genau genug ist.
Wer am Ende nur für 44kHz CDs produziert kann guten Gewissens direkt mit 44kHz aufnehmen und produzieren. Solange er eine ordentliche Aussteuerung gewähren kann reichen sogar 16 Bit.
Und wer unterstellen muss, dass seine Konsumenten gar reduzierte Formate hören wie MP3 etc.. - bzw sich die Musik über schlechte Lautsprecher oder gar Billigkopfhörer reinziehen, der braucht sich um das Thema Aufnahmequalität keine Gedanken zu machen. Da reicht die Technik von vor 20 Jahren!
Der Unterschied von 48kHz auf 96kHz und 192kHz liegt technisch je nach Filtergrenzfrequenz und Güte im Bereich von einigen % bis 10% im oberen Spektrum, da sich da im Audiobereich aber meist wenig tut (S und T -Laute generieren hier den grössten Anteil) ändert sich am Gesamtmix oft nur wenig und der Gewinn liegt meist deutlich unter 1%, um die an näher an das unverfälschte Ideal rankommt. Normale Lautsprecher haben aber schon Verzerrungen um 5% Nichtlinearität, billige Kopfhörer bis zu 20% inklusive unwillkürlicher Oberwellen.
Das MP3-Format ändert /normiert ein Signal im Oberwellengehalt sogar um bis zu 70%. Die Differenz zwischen mp3 und audio.wav ist , wenn man sie mal ausdrücklich bildet und abhört, direkt unverstärkt hörbar. Da sind noch 8-10 Bits wirklich authentisch! Der Fehler, der durch das Rauschen billiger Soundchips im Computer generiert wird, ist da oft schon kleiner.
Die Diskussion um die 96kHz war vor 10 Jahren mal aktuell, als man noch davon ausging, dass sich -ausgehend vom Hi-Fi/Hi-Com Sektor - bessere Anlagen würden etablieren lassen und man mit der DVD und vor allem der SACD Erfolg haben könnte. Da machte der Umstieg auf 96k-Ausstattung richtig Sinn. Dann aber setzte sich mp3 immer mehr durch, weil die Smartphones in Mode kamen und nun nicht nur MP3-Player sondern auch die Telefone dudelten. Auch die Nicht-Elektroingenieure hier im Forum können sich an 3 Fingern abzählen, was mit DA-gewandelten analogen Signalen passiert, die in einem solchen Gerät geführt werden, in dem ansonsten high-speed digitale Signale ihr Unwesen treiben und dies in nur wenigen mm-Abstand. Die ganzen Leitungen und Kapazitäten wirken wie schlecht optmierte NF-Filter und führen je nach niederfrequentem Anteil der HF-Störungen zu Störfrequenzen im kompletten Spektrum und eben auch zu hörbaren Frequenzen. Beim IPhone z.B. gemessenen -32dB. Damit liegen diese für einen mittleren Pegel von -10dB schon im Bereich von 1% Störanteil des Signals -> es sind nicht einmal 7 Bit komplett sauber.
Die 192kHz haben ihre Berechtigung, wenn es um Feinheiten geht - in der Regel und im Consumerbereich ist das Augewischerei. Die meisten Wandler werden einfach mit einem Faktor 2 weniger oversampling gefahren und produzieren dann statt 256x 96kHz einfach 128x 192kHz. Eingangsfilter und Qualität bleiben dieselbe. Ganz genau genommen, wird es sogar minimal schlechter
Mit 192kHz sollte man z.B. dann aufnehmen, wenn man später für 96kHz und auch 44kHz produzieren will. Je grösser der Abtastüberhang, desto besser wirken die digitalen Filter, die man später einsetzen muss, um AA zu verhindern und downconversion zu betreiben, weil die 44kHz nicht in die 192k reinpassen.
Das Sauberste ist nach wie vor, direkt in 44k aufzunehmen und wiederzugeben, lediglich wenn umfangreich bearbeitet werden soll lohnt mehr Abtastung, dann aber möglichst ganzzahlig! Komischerweise unterstützen aber viele Wandler und Protokolle keine 88kHz oder die benötigten 176kHz.
Die meisten Geräte werden halt nach Marketinggesichtspunkten gebaut und nicht nach technischen.....
- - - Aktualisiert - - -
Einem korrekt implementiertem Resampler ist es egal wie das Verhältnis von Ein- zu Ausgangsrate ist.
...
Wie definierst Du einen "korrekt" implementierten Resampler? Bei nicht ganzzahligen Verhältnissen muss der Interpolieren und je nach Filtertyp hast Du damit Verzerrungen = neue Frequenzen. Idealerweise liegen die weit jenseits von Nyquist und fallen damit dem späteren AAF bei der DAC zum Opfer, aber ein solches Filter lässt sich nur sehr aufwändig implementieren und besitzt unweigerlich lineare Verzerrungen unterhalb von Nyquist, weil es keinen idealen steilen Filter gibt.
Bei geradem Verhältnis (zB 1/2 von 88.1 zu 44.1 kHz) muss genauso mit einem Tiefpass gefiltert werden wie bei einem ungeraden (zB 147/160 von 48 auf 44.1 kHz). Die Denkweise "aber bei geradem Verhältnis muss man ja nur jedes 2. Sample wegwerfen" ist falsch.
Das ist so nicht ganz richtig. Bei einem Ganzzahlverhältnis kann man sehr wohl jedes zweite Sample weglassen, ohne einen zusätlzichen Fehler zu begehen, siehe Grundlagen DDC und DUC- solange die GF genügend weit unterhalb Nyquist/2 liegt. Davon muss man ausgehen, wenn man bei Audio von 48k auf 96k+ hochgeht. Wenn man das nicht tut unterstellt man, dass die GF höher liegt, was a) oft eben nicht der Fall ist und b) dann Sinn macht, wenn man auch auf 96k wiedergibt und der AA Filter des Zielsystems das Problem beseitigt. Wer später wieder auf 44 runter will, schafft sich nur die Aufgabe, sauberer zu interpolieren, als es der AD-Chip und sein optmierter AA-Filter im 96k-System tut und kann. Das ist zwar möglich, wie Du beschreibst - aber ohne Nutzen, da man ein Problem löst, dass man ohne die 96k und die Unsicherheit der initial GF des Eingangs-AA-Filters gar nicht erst hätte.
Fazit: Man arbeitet bei 44kHz und einem z.B. AA-Filter bei 3dB@16kHz mit genügender Sperrwirkung bei 20kHz. Passt.
Die Alternative, ein flaches und weniger verzerrendes Filter mit GF bei z.B. 25kHz@96kHz mit Sperrband ab 40kHz sieht zwar erst mal viel besser aus, bedarf aber dann bei der Umwandlung von 96k auf 44k eines digitalen Filters, der dann doch wieder einen Kompromiss mit der Grenzfrequenz eingehen muss. Ergebniss 2 hintereinandergeschalte Filter mit 2x Verzerrungen statt einmal.