Stereo separiert ...oder nur getrennte Signale!
Von der Schallplattenrille (oder den Bits der CD) bis zum Gehör mit seiner Analyse des Schallverlaufs liegt meistens eine Stereo-Anlage. Von den in den zwei Flanken einer Schallplattenrille gespeicherten Informationen bis zu den durch das Gehör daraus wieder separierten Informationen, ist es eine weiter Weg: durch den Tonabnehmer, Phono-Entzerrer (bei CDs den DA-Wandler), Vorverstärker, Endstufen und Boxen.
All diese elektrischen und technischen Komponenten können das Signal - und damit die darin enthaltenen Informationen - verändern. Jede Veränderung wird also - mehr oder weniger - die Möglichkeiten des Gehörs beeinflussen, die Informationen der einzelnen Schallquellen - die ja alle nur als Summensignal in dem Stereo-Signal gespeichert sind - zu analysieren.
Eine wichtige Analyse des Gehörs ist sicherlich die Separierung der einzelnen Schallquellen (mit ihren „Informationen“) aus den an den Ohren ankommenden Summensignalen (siehe Artikel Stereo = Separtion).
Denn, in den überwiegenden Fällen sind in den Aufnahmen mehrere Schallquellen (Instrumente, Sänger, Nebengeräusche etc.), die mehr oder weniger alle zusammen spielen. Das Stereo-Signal ist dabei immer die Summe all dieser gleichzeitig wiederzugebenden Schallquellen.
Bevor das Gehör also überhaupt aus diesen zwei Summensignalen etwas „wahrnehmen“ kann, müssen die Schallquellen separiert werden – damit das Gehör sie als einzelne Informationen „verarbeiten“ kann.
Wenn z. B. zwei Sänger, eine Geige und ein Klavier gleichzeitig spielen, werde ich die Sänger als Sänger und das Klavier als Klavier sowie die Geige als Geige erst erkennen, wenn das Gehör die zugehörigen Schallanteile separiert hat!
Wie gut ich unterscheiden kann, ob es eine Frauenstimme oder eine Männerstimme ist, ob ich verstehe was sie singen, welche Töne das Klavier und die Geige spielt, ob es ein Flügel von Bechstein oder von Steinway ist oder gar nur ein Klavier, ob es eine Geige von Guarneri oder von Stradivari ist… all das hängt davon ab, wie gut dem Gehör die Separation gelingt!
Also macht es Sinn, die möglichen Veränderungen des Stereo-Signals durch die Wiedergabenanlage in Bezug auf ihre Auswirkungen auf die Separation zu betrachten.
In dem Artikel Stereo = Separation habe ich ja eine Möglichkeit aufgezeigt, wie das Gehör das wahrscheinlich macht: gleitende Kreuzkorrelation. Was das ist und wie man sich das vorstellen kann ist im besagten Artikel erläutert.
Die Kreuzkorrelation funktioniert (prinzipiell), weil in den beiden Kanälen, die analysiert werden, immer zwei gleiche Anteile einer Quelle vorhanden sind und weil deren Unterschiede zueinander bekannt sind.
Im Grunde ist es gar nicht mal so wichtig, wie das Gehör das macht.
Daß es die einzelnen aufgenommenen Schallquellen aus den zwei Kanälen separieren muss, ist eigentlich klar (wie sonst sollte es Stimmen, Instrumente, Nebengeräusche etc. als solche erkennen, auseinanderhalten und auch auswerten – siehe Beispiel oben). Und auch, das es nur die zwei Stereo-Kanäle dazu hat – bzw. was von denen an die Ohren gelangt (siehe Artikel Schallreproduktion).
Die Stereokanäle enthalten prinzipiell bereits die Informationen aller aufgenommenen Schallquellen (immer als Summe aller Schallquellensignale) mit deren Unterschieden bez. Laufzeiten und Pegel. Also bereits in der Form, wie sie das Gehör z. B. mit einer gleitenden Kreuzkorrelation, wieder aus diesen Summensignalen separieren kann.
Wenn also an dem zeitlichen Bezug und den Pegelunterschieden beider Kanäle zueinander nichts verändert wird, kann das Gehör die Informationen jeder aufgenommenen Schallquelle separieren und entsprechend auswerten.
Einfacher gesagt: Die Signalform und der zeitliche Bezug beider Kanäle zueinander darf nicht verändert werden.
Insbesondere alles, was nur an einem Kanal verändert wird, behindert die Möglichkeiten der Separierung einer oder aller im Stereo-Signal „enthaltenen“ Schallquellen (siehe Artikel Stereo = Separation ).
Damit kommt der Symmetrie beider Kanäle der Anlage eine besondere Bedeutung zu.
Gerade bei Boxen sind hier z. T. gewaltige Unterschiede.
Unterschiede bei den Chassis, den Bauteilen der Frequenzweiche und auch bei den Gehäusen verschlechtern die Separierung.
Damit erklärt sich auch sehr gut der Einfluss von sog. Raumkorrekturprogrammen - z. B. DIRAC. Neben der Beseitigung mancher Raumeinflüsse, sorgt DIRAC vor Allem für die Symmetrie zwischen beiden Kanälen.
Als Ergebnis wird fast immer von einer deutlichen Verbesserung der Lokalisierung und auch von einer Verbesserung der Wahrnehmung von Details wie z. B. Nebengeräuschen berichtet. Genau die Aspekte, die als Folge einer Verbesserung der Separierung wahrscheinlich sind (siehe Artikel Stereo = Separation ).
Es gibt aber noch einen anderen Aspekt einer Anlage der Einfluss auf die Separierung hat: Signalform-abhängige Signalveränderungen.
Was ist darunter zu verstehen?
Jeder kennt die Sprung- oder Impulsantworten üblicher Mehrwege-Boxen mit dynamischen Chassis. Auf einen (1) steilflankigen Signalanstieg reagiert die Box mit mehreren aufeinanderfolgenden Signalwechseln (oft sogar in die gegenteilige Richtung).
Hier mal einige Beispiele von Sprungantworten:
Auch DA-Wandler haben ein solches Verhalten. Deren FIR-Filter im Ausgang sorgen bei steilflankigen Signalformen für sog. Pre- und Postringing.
Dieses Signalreproduktionsverhalten, kommt im wesentlichen nur bei steilflankigen Signalabschnitten vor. Ist die Signalform eher „flach“ mit geringen Anstiegen, wird das Signal dagegen kaum verändert.
Damit ist es eine Signalveränderung, die von der Signalform abhängt – die also nicht auf den ganzen Signalverlauf gleichmässig wirkt (wie es z. B. bei Frequenzgangfehlern von Boxen der Fall ist).
Da sich die Signalformen beider Stereo-Kanäle praktisch immer unterscheiden (siehe Artikel Schallreproduktion), wird ein solches Verhalten immer zu einer unsymmetrischen Veränderung führen - und damit die Voraussetzung für die Separation des Gehörs beeinflussen!
Diese „Nachschwinger“ werden den Signalverlauf überlagern und ihn damit verändern.
Um die Größenordnung mal zu verdeutlichen der Signalverlauf eines Bach-Konzerts und darunter massstäblich die Impulsantworten von Boxen und eines DA-Wandlers:
Das erklärt sehr schön, was eine hohe Signalreproduktionstreue z. B. bei Chassis wie dem MSW, ESLs oder guten Breitbändern bewirkt: Sie erhalten die für die Separation der Schallquellen benötigten Inhalte und die Symmetrie der Stereo-Kanäle.
Der Vergleich der Sprungantworten im ersten Bild zeigt dies besonders eindrucksvoll:
Bei einem (1) steilflankigen Signalanstieg wird die Signalform durch MSW oder ESL deutlich weniger verändert, als z. B. bei Mehrwegboxen mit dynamischen Chassis. Auch wenn eine solche Signaländerung in normaler Musik nicht vorkommt, zeigt es doch das prinzipiell unterschiedliche Signalreproduktionsverhalten.
Auch hier passen die Schilderungen der Höreindrücke von Anlagen z. B. mit MSWs, oder Breitbändern, sehr gut zu den Auswirkungen guter Separation durch das Gehör.
Ohnehin kann man recht gut den Zusammenhang von guter Separation und guter Lokalisation „erhören“.
Je besser man die einzelnen Instrumente und Interpreten lokalisieren kann, desto besser ist auch die Wahrnehmung kleinster Details oder Nebengeräusche und auch die Wahrnehmung der Instrumente und Interpreten an sich ist deutlich besser - inkl. Sprachverständlichkeit. Denn, je besser die einzelnen Instrumente und Interpreten vom Gehör separiert werden, desto besser können sie lokalisiert werden und desto vollständigere Informationen über das jeweilige Instrument, Interpret und allen anderen Schallquellen, sind für die Auswertung durch das Gehör/Gehirn vorhanden …sind „separiert“ worden!
Das zeigt wie wichtig eine gute Separation durch das Gehör für fast alle Aspekte des Hörens ist.
Damit ist auch klar, daß eine schlechte Impuls- oder Sprungantwort einen durchaus wahrnehmbaren Einfluss hat – und zwar auf die Separation.
Es auch ist völlig unerheblich, ob man den Unterschied zwischen einer guten und schlechten Sprungantwort beim Hören des Messsignals (des einzelnen Impulses oder Rechtecksignals) wahrnimmt oder nicht – solch ein einzelnes Signal kommt ja ohnehin nicht in Musik vor. Auch, ob diese „Messsignalantwort“ außerhalb bestimmter bekannter Hörschwellen liegt, ist belanglos.
Der Einfluss liegt nicht im Signal selbst, sonder in der Veränderung des Stereosignals und damit in der Beeinflussung der Separation der Schallquellen durch das Gehör.
Er ist indirekt und da er das Summensignal verändert wird der Einfluss praktisch noch vervielfacht.
Dieser Einfluss ist – wie im Artikel Stereo = Separation beschrieben - variabel und hängt von verschiedenen Dingen ab – z. B. von der Komplexität der Musik, von der Anzahl der in der Aufnahme enthaltenen Schallquellen etc..
Es wird also abhängig von der Musik „nur“ zu einer Verschlechterung der Lokalisation und anderer Höreindrücke kommen – aber eben zu einer Verschlechterung mehrere Höreindrücke, da fast alle vom Ergebnis der Separation abhängen.
Das passt auch gut zu den Höreindrücken, die man mit vielen Mehrwegeboxen hat: Bei „normaler“ Musik oder manchen Stücken (oder gar Musikrichtungen) ist durchaus eine gute Lokalisation vorhanden. Bei komplexeren Passagen mit mehreren gleichzeitig gespielten Instrumenten und Sängern wird die Lokalisation und auch die Erkennung und „Verständlichkeit“ der Instrumente und Sänger schwieriger – und zuhören wird oft „anstrengender“, was ein Anzeichen für eine gesteigerte „Aktivität“ des Gehirns ist (weil eben der „Aufwand“ für die Separation höher ist).
Je „besser“ die Anlage wird (mit Blick auf die für die Separation nötigen Eigenschaften), desto besser werden die Höreindrücke.
Wenn man dann die gleiche Musik über eine Anlage hört, die das Stereo-Signal wenig verändert – mit der die Separation durch das Gehör besser gelingt – hört man deutlich entspannter, die Lokalisation ist noch besser und alles wird deutlicher wahrnehmbar… man hört noch mehr Details und Nebengeräusche und man hat noch mehr den Eindruck von „Livehaftigkeit“ und „Realistischer Wiedergabe“.
Genau die Aspekte, die aufgrund der besseren Separation durch das Gehör zu erwarten sind.
Die Erfahrung, daß man über eine entsprechend gute Anlage die aufgenommenen Schallquellen sehr gut lokalisieren kann, die Instrumente und Interpreten „besser“ erkennt und auch den Eindruck hat, die Wiedergabe ist „realistischer“ und „Livehaftiger“, zeigt, daß die entsprechenden Informationen (für das Gehör) durchaus auf der Aufnahme sind – daß die zwei Stereo-Kanäle mit ihrer „Genauigkeit“ ausreichend sind.
Also auch eine Auflösung von 44.1kHz und 16bit ist mehr als ausreichend um mit einer (guten) Stereo-Anlage den Eindruck von „Livehaftigkeit“ und „Realismus“ zu erzeugen… wenn diese „Genauigkeit“ bis an die Ohren gelangt.
Selbst Aufnahmen mit mp3-Qualität können hervorragend klingen – und auch den Eindruck von „Livehaftigkeit“ und „Realismus“ erzeugen -, wenn die „Genauigkeit“ der Aufnahme bis zu den Ohren erhalten bleibt.
Nachtrag 28.12.2016:
Ich habe zu dem Thema Separation natürlich weiter recherchiert. Im Englischen wird dieses Thema als "Auditory Scene Analysis" (ASA) geführt und es gibt hier einige sehr interessante Studien und Beiträge (z. B. http://webpages.mcgill.ca/staff/Group2/abregm1/web/pdf/2004_Bregman_Woszczyk.pdf und generell auf der folgenden Webseite: http://webpages.mcgill.ca/staff/Group2/abregm1/web/index.htm ).
Prinzipiell gehen diese Arbeiten in die gleiche Richtung wie ich in meinen Artikel ausführe... Wer mehr darüber wissen will findet dort weitere sehr interessante Angaben.
Die Informationen in diesem Dokument werden ohne Rücksicht auf einen eventuellen Patentschutz veröffentlicht. Warennamen werden ohne Gewährleistung der freien Verwendbarkeit benutzt. Die Zusammenstellung von Texten und Abbildungen erfolgte mit größter Sorgfalt. Trotzdem können Fehler nicht vollständig ausgeschlossen werden. Die Verwendung der Informationen und Angaben in diesem Dokument erfolgt auf eigenes Risiko des Benutzers. Die Herausgeber und Verfasser können weder eine juristische Verantwortung noch irgendeine Haftung übernehmen.
Alle Rechte vorbehalten, auch die der fotomechanischen Wiedergabe und der Speicherung in elektronischen Medien. Die gewerbliche Nutzung der in diesem Dokument aufgeführten Angaben ist nicht zulässig.
Markennamen, Firmen- und Produktbezeichnungen die in diesem Dokument verwendet werden sind als eingetragene Markenzeichen geschützt. Da es zum Zeitpunkt der Erstellung nicht immer möglich war zeitnah zu ermitteln, ob ein Markenschutz besteht, erfolgt die Nennung ohne Kennzeichnung mit ®, ©, TM.
alias
Joachim Liepold
im Februar 2016