Die Aus- und Bewertung von Messdaten von Audiosystemen ist der Knackpunkt und ein ungelöstes und vermutlich auch unlösbares Problem.
Wir betrachten die Daten gerne im Frequenzbereich (Spektrum), weil es so einfacher zu interpretieren scheint ("welche Frequenz ist wie laut"). Man muss sich aber bewusst sein, dass dadurch die zeitliche Ebene unsichtbar wird. Ein Spektrum wird immer über einen Betrachtungszeitraum gebildet. Die Frequenzauflösung ist invers proportional zum Betrachtungszeitraum. Man kann das Spektrum über 20 µs bilden, erhält dann aber ein Spektrum mit 50 kHz Auflösung. Mit anderen Worten, man sieht im Audio-Bereich gar nichts. Zur Bewertung von transienten Vorgängen ist das Spektrum im Grunde nicht geeignet.
Selbst wenn man das außen vor lässt, bleibt immer noch die Aufgabe, die Differenz zwischen 2 Spektren in einen Zahlenwert abzubilden, um eine Metrik zu erhalten, anhand derer man dann eine Bewertung vornehmen kann. Nimmt man hier eine maximale oder eine durchschnittliche Abweichung? Müssen verschiedene Frequenzbereiche unterschiedlich gewichtet werden? Ab wann ist eine Abweichung relevant in Hinblick auf Amplitude und Bandbreite? Mir sind hier keine allgemeinen Standards bekannt, was für mich heißt, dass hierüber in der Wissenschaft keine Einigkeit herrscht.
Als Beispiel kann man sich mal die Übertragungsfunktion verschiedener IRs von Gitarrenboxen + Mikrofon anschauen. Ein optisch kleiner Unterschied kann bei einem stark verzerrten Signal (sehr viele Obertöne, ohne die Filterung durch die IR auch weit über 10 kHz hinaus) in einem für mich deutlichen Klangunterschied enden. Wie groß muss der Unterschied sein, um relevant zu sein? Ist das gleich bei 200 Hz und 2 kHz?
Man kann die Daten auch im Zeitbereich betrachten, also direkt die aufgenommen Messwerte. Und es lassen sich natürlich Differenzwerte zu einer vorher definierten Referenz bestimmen. Nur fällt eine anschauliche Bewertung hier noch viel schwerer. Wie will man aus einer Differenzkurve im Zeitbereich einen Zahlenwert für eine Metrik ableiten? Und anhand welcher Maßstäbe will man das dann bewerten?
Im Bereich der klangreproduzierenden Systeme, deren Ideal eine unverfälschte Wiedergabe der Eingangssignale ist, haben wir gewisse Parameter und Eigenschaften, die wir messen und danach Systeme bewerten können (lineare und nicht-lineare Verzerrungen in erster Linie). Und selbst da gibt es Grenzen und Meinungsverschiedenheiten. Ist ein THDN von -80 dB jetzt gut genug? Welchen IMD-Grenzwert muss ein "gutes" Gerät einhalten?
Bei klangerzeugenden Systemen (alle Musikinstrumente) ist das viel schwieriger, weil sich hier kaum allgemeingülte Zielvorgaben formulieren lassen.
Aus diesen Gründen werden in der Audiotechnik immer noch Hörtests neben allen Messungen durchgeführt. Diese sind aber nur wissenschaftlich belastbar, wenn bei der Durchführung gewisse Randbedingungen eingehalten werden. Ein Verfahren ist der sogenannte ABX-Test. Dabei werden 2 Geräte/Prüflinge/Systeme etc. miteinander verglichen. Die Teilnehmenden hören erst Gerät A, dann Gerät B, dann entweder Gerät A oder Gerät B und müssen dann entscheiden, ob X A oder B war. Selbstverständlich muss sichergestellt werden, dass niemand optische, akustische, haptische oder sonstige Hinweise bekommt, was A oder B ist. Die Bedingungen (Anregung, Position im Raum bei Lautsprechern etc.) für die Systeme muss identisch sein. Mit ausreichend Teilnehmenden lässt sich dann eine Statistik erstellen, anhand derer man bewerten kann, ob ein wahrnehmbarer Unterschied zwischen den getesteten Systemen statistisch nachweisbar ist oder nicht. Und selbst dieses Ergebnis gilt dann nur als Durchschnitt über die Teilnehmenden. Ich durfte schon an ein paar solcher Tests teilnehmen und das Ergebnis war nie eindeutig. Es gab immer einzelne, die Unterschiede hören und andere, die diese nicht wahrnehmen.
Diese Tests werden z.B. bei der Bewertung von Codecs zur Datenkompression eingesetzt. Wenn das Ergebnis lautet, dass die Mehrheit keinen Unterschied wahrnimmt, muss das noch nicht für jedes Individuum gelten.
Man kann aus solchen Tests in Kombination mit der Messtechnik Dinge ableiten wie "im Durchschnitt nehmen Menschen eine Pegeländerung von 1 dB wahr" (rein fiktives Beispiel), das heißt aber nicht, dass es nicht auch Menschen gibt, die schon kleinere Abweichungen bemerken können.
Wenn wir das auf das Thema übertragen, wird die Komplexität klar. Ein solcher Test kann nicht durchgeführt werden, wenn die Gitarre von einem Menschen gespielt wird. Am Ende ist er nur für ein aufgenommenes Signal relevant, nicht für die Spielenden selbst. Denn in dem Moment, in dem man die Gitarre in der Hand hat, sind die Grundvoraussetzungen für so einen Test nicht mehr gewährleistet. Der unabschaltbare Bias beeinflusst das Ergebnis.
In dem Kontext finde ich die "Blindtests" bei Andertons immer spannend. Wenn die mit Gitarren durchgeführt werden, wird mindestens so viel Zeit mit der Haptik (Hals, Kopfplatte, Bedienelemente) verbracht, wie mit dem eigentlichen Sound. Und die Schlüsse werden zum großen Teil daraus gezogen. Wenn es rein ums Hören geht (z.B. Pedale), sind die Ergebnisse meist überraschender. Auch wenn diese Tests natürlich keinen wissenschaftlichen Anspruch haben, zeigen sie dennoch deutlich in eine Richtung: Wir werden immer von dem beeinflusst, was wir sehen, fühlen und "gelernt" haben. Nur "hören" findet in unserer Realität quasi nie statt.
Daraus sollte klar werden, warum es so schwierig ist, Audio-Messdaten zu bewerten. Hören ist eine höchst subjektive Eigenschaft. Zwischen unseren Ohren sitzt ein wahnsinnig leistungsfähiger Signalprozessor, den wir meiner Ansicht nach noch nicht vollständig verstehen und der noch dazu bei jedem etwas anders arbeitet. Es gibt keine allgemein gültige "Wahrheit", nur subjektives Empfinden.
Damit spreche ich den Audio-Messungen keinesfalls ihre Legitimation ab, ganz im Gegenteil. Sie können helfen, Dinge zu verstehen und zu erklären. Man muss nur sehr vorsichtig bei deren Aus- und Bewertung sein. Keinesfalls sollte man sie nutzen, um daraus neue Dogmen abzuleiten. Ich halte es auch nicht für wissenschaftlich, einem Parameter seine Relevanz abzusprechen, nur weil ein anderer einen größeren Einfluss hat. Wir reden wie gesagt bei Audio nicht von etwas, das sich in einem einzelnen Zahlenwert vollständig abbilden lässt. Ein Gegenbeispiel wäre z.B. das Gewicht der Gitarre. Hier kann ich relativ einfach untersuchen, welche Komponenten welchen Einfluss haben und zum Beispiel das Gewicht der Saiten als nicht relevant einstufen.
Klang lässt sich nicht quantifizieren.
Was ich mir aber auf der anderen Seite auch wünsche, ist dass wir uns alle bei Bewertungen von Instrumenten und den Einflussfaktoren einzelner Komponenten mehr dessen bewusst sind, dass unsere Wahrnehmung eben unsere individuelle Wahrnehmung ist und daraus keine allgemein gültigen Grundsätze ableitbar sind. Es ist vollkommen legitim zu sagen "alle Gitarren mit Korpusholz X, die ich bisher in der Hand hatte, hatten für mich die klangliche Eigenschaft Y". Leider wird daraus dann meistens "alle Gitarren mit Korpusholz X haben die klangliche Eigenschaft Y auf Grund des Korpusholzes X". Und das ist es, wogegen ich und meiner Wahrnehmung nach sich viele andere hier auch wehren.