Viele Reflexionen = schlecht, Wenig Reflexionen = gut?

Viele Reflexionen = schlechte HiFi-Wiedergabe?
Wenig Reflexionen = gute HiFi-Wiedergabe?

Eine Hör-Geschichte von Joachim Liepold

Viele Reflexionen = schlechte HiFi-Wiedergabe?
Wenig Reflexionen = gute HiFi-Wiedergabe?

Das habe ich auch lange Zeit geglaubt! Heute sehe ich das völlig anders!

Aber der Reihe nach: Wie kam es zu diesem grundlegenden „Sinneswandel“?

Ich hatte mal eine recht gute Anlagen-Konstellation – also technische Zusammenstellung, Positionierung im Raum und Raumakustik „passten“:

Technisch gesehen handelt es sich bei den Boxen um zwei überarbeitete Manger Diskus S05, die je einen Manger Schallwandler vorne und hinten haben. Sie werden aktiv betrieben und decken den Bereich von 350Hz bis 35kHz ab; unter 350Hz kommen zwei Subwoofer mit je einem 21“-Chassis in 130L CB zum Einsatz.

Ich habe die Anlage über die Jahre stetig optimiert - inkls. mehrmaligem Umstellen von Boxen, Hörplatz und Einrichtung. Alle mir bis dahin bekannten Regeln bezüglich Aufstellung und Raumakustik wurden weitgehend berücksichtigt. Und obwohl es sich eigentlich um Boxen mit Manger Schallwandlern handelt (die ja angeblich irre klirren und verzerren und weder einen guten Frequenzgang noch ein gutes Rundstrahlverhalten haben) klang meine Anlage damals ausgesprochen gut.

Hier mal einige Auszüge von den Eindrücken unserer HiFi-Selbstbaugruppe (deren Mitglieder mehr Hörerfahrung haben und mehr gute Anlagen kannten als ich damals):

FlorianK: „Die Lautsprecher klingen unaufdringlich. Anfangs dachte ich - hier fehlt deutlich Bass. Anfangs eben. Aufgelegt haben wir verschiedene Scheiben von Jazz bis Rock und Pop.
Was auffiel: Völlig entspannte Wiedergabe aller Scheiben. Soll auch so sein oder ?
...dass Scheiben wie z.B. Supertramp usw., die teilweise sehr schlecht aufgenommen waren, hier deutlich gewannen. Ich habe teilweise auf die Stellen gewartet - man kennt sie ja - an denen man dann weiß, jetzt wird's haarig. Nun - das blieb oft aus
Die Konstellation von Diskus_GL blieb jederzeit Chef der Wiedergabe“

ExDreamAudio: „Der Manger hat an diesem Abend auch mir zum ersten mal seit langer Zeit wieder gezeigt was in ihm steckt, so man ihn denn auch richtig einsetzt. Supertramp hatte ich schon lange nicht mehr so überzeugend gehört, obwohl die Aufnahme nichts weltbewegendes hat, 10CC, Grace Jones...........
Ich habe mich irgendwann dabei erwischt das es mir nicht mehr um Technik ging, eher um Musik hören, Musik neu zu entdecken. Das muss doch das Ziel sein?“

nic-eniac: „Ich hatte ja auch das Vergnügen, mir diese wirkliche Tolle Zusammenstellung anzuhören.
Was sehr auffällig war, war die hervorragenden Wiedergabe, von Stücken die bekannter weise nicht so gut aufgenommen sind.
Dieses Set ist in der Lage sehr neutral zu spielen und denn noch nicht so guten Aufnahmen das gewisse ETWAS mit zu geben.
Eine Neutralist der SPASS macht........das hört man echt selten.

BertramXXL: „Das, was uns Diskus_GL am letzten Freitag präsentiert hat, ist der qualitativ größte Evolutionssprung, den wir bisher hören durften!!
.....haben wir bei Joachims Manger Boxen alle schön den Schnabel gehalten und nur noch gierig der Musik gelauscht .....
Ich habe es für eine Art Naturgesetz gehalten, dass man mit Boxen, die sehr hochwertig sind, keine mittelprächtigen Aufnahmen mehr mit Genuss hören kann. Und nun kommt der Diskus_GL mit seinen Manger-FAST um die Ecke und pulverisiert meine Erfahrungen.
.....aber ich muss noch was zum Sweetspot sagen: Den gibt's zwar durchaus, aber es ist kein ,,Spot'' - eher eine Area . Ja ich weiß, die Physik ist gegen mich und alle bisherigen Erfahrungen mit den MSW ebenfalls . Aber sei es die Dirac Messung über einen größeren Hörbereich oder die Dipolabstrahlung der Diskusse oder das ziemlich große Raumvolumen und damit einhergehend eine Menge Diffusschall oder alles Drei -egal, die Räumlichkeit ist einfach super und einzelne Schallereignisse sind stabil und leicht zu unterscheiden....“

Besonders eindrucksvoll war für alle - und auch für mich - die Räumlichkeit, die Lokalsation und die Feinauflösung einzelner Schallereignisse bei fast allen Aufnahmen, egal ob gute, mittelmäßige oder gar schlechte Aufnahme.

Dann habe ich mein Wohnzimmer renoviert und umgestaltet – neue Möbel und natürlich auch neue Positionen der Boxen:

Eigentlich habe ich bei der neuen Aufstellung und der „Bekämpfung von Reflexionen“ wieder alle „Regeln“ und „Weisheiten“, von denen ich (und die Mitglieder unserer HiFi-Selbstbaugruppe auch) glaubten das sie die Haupt-Ursachen für meine vorherige gute Anlagenkonstellation waren, berücksichtigt.

Trotzdem stellte sich der damalige Klangeindruck nicht mehr ein – vor allem die gute Räumlichkeit war weg!

In der Zwischenzeit habe ich auch neue Verstärker und DA-Wandler angeschafft. Die verbesserten zwar die Wiedergabe in Teilbereichen, aber an die damalige Räumlichkeit kam ich nicht mehr ran.

Das zeigte mir aber auch, daß die Elektronik nicht die Ursache sein kann – die neuen Komponenten sind eigentlich über jeden Zweifel erhaben (u. a. Spectral Audio Endstufen und Antelope-Zodiac DA-Wandler).
Die Positionen der Boxen und der Hörplatz zueinander waren wie damals, nur an etwas anderer Stelle im Raum. Die Einrichtung war natürlich jetzt anders – und damit auch die akustischen Eigenschaften des Raumes.

Auch an den Einstellungen der Manger Diskus wurde nichts verändert: Die hinteren Wandler liefen nach wie vor mit ca. -13 db, zusätzlich laufzeitverzögert und frequenzbegrenzt gegenüber den vorderen Wandlern – alles so wie damals!

Nach „allgemeiner Lehrmeinung“ hört der Mensch ja Schall, der um ca. 15db leiser ist gegenüber dem „Hauptschall“ nicht mehr. Mit -13db und dann noch nach hinten abstrahlend, kann der Schall der hinteren Wandler eigentlich keinen Einfluss haben – so meine Annahme (...und auch die unserer Gruppenmitglieder)!

Ich hatte mich fast schon damit abgefunden und es auf die jetzt nicht mehr so gute Raumakustik geschoben. Da ich aber nicht mehr die „alte“ Wohnungseinrichtung haben wollte, war für mich der Fall eigentlich schon erledigt.

Bei einem unserer Gruppentreffen machte Theo dann den Vorschlag, ich könne ja mal mit den hinteren Wandlern etwas mehr experimentieren – mal lauter und ggf. sogar die Diskus als Bipole betreiben, also so wie sie eigentlich seinerzeit ja konstruiert wurden.

Und das brachte mich dann meinem damaligen Höreindruck – speziell der Räumlichkeit – auf einen Schlag wieder deutlich näher!

Kaum hatte ich meine Diskus als Bipole eingestellt und die hinteren Wandler nur noch um ca. 2db leiser als die vorderen eingepegelt, war sie wieder da, die gute Räumlichkeit – sogar viel besser!

Mehr noch – ich konnte durch Verändern des Pegels der hinteren Wandler die Stärke der Räumlichkeit quasi einstellen.

Also, ohne auch nur irgend etwas an der Aufstellung oder technisch an der Anlage zu ändern, hatte ich eine Räumlichkeit, wie ich sie mir immer erträumt hatte. Und zu meiner Überraschung litt auch die Lokalisierung und Differenzierung kaum - wie es ja angeblich bei zu viel „schädlichen“ Reflexionen der Fall sein soll (Stichwort „Hallsoße“).
Es gab jetzt zwar ein paar andere „Probleme“ – u. a. einige tonale Effekte – aber offenbar sorgen die Reflexionen, die ja bisher generell als „schädlich“ angesehen wurden, für die gewünschte Räumlichkeit und das weitgehend ohne die Lokalisierung oder Detailauflösung allzu negativ zu beeinflussen.

Das ließ mir natürlich keine Ruhe, zeigte es doch eine Möglichkeit, trotz neuer Einrichtung (mit vermeintlich schlechter Akustik) zum alten guten Klang zu gelangen.

Da es offensichtlich mit den Reflexionen zusammenhing fing ich also an, mich damit zu beschäftigen.

Als erstes gelangte ich an das Buch „Zeitrichtige, klangrichtige und akustisch hochwertige Musik in…....“ von Peter M. Pfleiderer. Hier gibt es bereits einige gute Erklärungen und hier wird erklärt, daß sog. erste starke Reflexionen einen erheblichen Einfluss auf unser Hörempfinden haben – speziell auf die Räumlichkeit – und das Reflexionen keineswegs prinzipiell „schädlich“ sind für eine gute HiFi-Wiedergabe.

Das konnte ich nachvollziehen - ich war auf dem richtigen Weg!

Als eine maßgebliche Quelle für diese „Behauptung“ führte Pfleiderer das Buch „Räumliches Hören“ von Jens Blauert an – also galt es diese Lektüre zu studieren.

Das Buch „Räumliches Hören“ von Jens Blauert ist eine Sammlung von Versuchsergebnissen und Theorien, die einen Bezug zum Thema Räumliches Hören (also Hören in Räumen) haben.

Alle in Frage kommenden Aspekte der menschlichen Hörwahrnehmung in Räumen werden in Zusammenhang gebracht und es wird versucht zu erklären, wie räumliches Hören beim Menschen funktionieren könnte. Er liefert keinen absoluten wissenschaftlichen Beweis, wie unser Gehör funktioniert. Er erläutert „nur“ die Modelle und Theorien, die es aufgrund dazu passender Versuchsergebnisse plausibel erscheinen lassen das sie zutreffen - daß menschliches Hören so funktionieren könnte.
Allerdings ist seine Sammlung recht umfangreich und umfassend. Die aufgeführten Versuche und Studien werden sehr wissenschaftlich (im Sinne von kritischem Hinterfragen und Abgleich mit anderen Studien) betrachtet. Insofern kann man ruhigen Gewissens davon ausgehen, das unser Hörsinn so funktioniert, wie die in Blauerts Buch aufgeführten Mechanismen, Modelle und Theorien.
Zudem kamen mir viele der geschilderten Versuchsergebnisse bekannt vor und einige der Ergebnisse konnte ich ja sogar mit meiner eigenen Anlage nachvollziehen – für mich eine Grund mehr seinen Ausführungen Glauben zu schenken.

Beim Lesen von Blauerts Buch kamen mir dann eine Menge an Gedanken und Deja-Vues, von denen ich im Folgenden mal einige aufgeführt habe.

Zum besseren Verständnis habe ich die Textstellen aus Blauerts Buch mit aufgeführt.

Vorab noch etwas zu den Textstellen aus Blauerts Buch: Es werden eine Menge an Fach-Begriffen verwendet. Einige nicht so geläufige Begriffe habe ich an manchen Stellen etwas erläutert (nicht jedem sind Begriffe wie „interaural“ oder „Hüllkurve“ geläufig). Wer mehr wissen will, kann auf der hinter den Textstellen angegebenen Seitenzahl des Buches „Räumliches Hören“ (3. Ausgabe) die Zusammenhänge und Quellenangaben nachvollziehen.

Ich habe gewiss nicht alle Aspekte berücksichtigt und sicherlich ist vieles nicht vollständig zu Ende gedacht – das Buch hat immerhin über 400 Seiten - aber es ist der Versuch die dort aufgeführten Ergebnisse und Theorien in einen Bezug zur HiFi-Wiedergabe mit einer Stereo-Anlage in Wohnräumen zu bringen.

Viele der aufgeführten Versuche behandeln zwar immer nur spezielle Teilaspekte und die dabei beobachteten Phänomene gelten eigentlich auch nur für diese speziellen Bedingungen – trotzdem liefern sie Erklärungen für viele Höreindrücke, die ich beim Hören mit meiner und anderen Anlagen oft wahrgenommen habe aber bisher eben nicht genau erklären konnte. Sehr vieles erscheint mir jetzt „nachvollziehbarer“ und erklärbar.

„Räumliches Hören“ - „Räumlichkeit“

Betrachten wir zuerst einmal was „Räumliches Hören“ und „Räumlichkeit“ eigentlich ist:

Schallereignisse und Hörereignisse sind zeitlich, räumlich und eigenschaftlich bestimmt. Indem sie auftreten, treten sie an einem Ort, zu einer bestimmten Zeit und mit bestimmten Eigenschaften auf. In diesem Zusammenhang wird auch der Begriff „Räumliches Hören“ verständlich. Er beschreibt zunächst, daß die Hörereignisse räumlich bestimmt sind, und ist insofern tautologisch, denn „Unräumliches Hören“ gibt es nicht. In speziellerem Sinn werden unter dem Begriff „Räumliches Hören“ die Beziehungen zwischen den Hörereignisorten und anderen Parametern, insbesondere Schallereignismerkmalen, aber auch Merkmalen anderer (z. B. hirn-physiologischer) Größen zusammengefasst. (3)
...Weiterhin tritt in geschlossenen Räumen ein auditiver Effekt auf, der „Räumlichkeit“ genannt wird. Räumlichkeit bezeichnet eine charakteristische räumliche Aufweitung der Hörereignisse derart, daß diese einen größeren Raumbereich ausfüllen, als er durch die visuellen Konturen der Schallquelle (z. B. eines Orchesters) vorgegeben ist. (Anhang 1, 75)

Nun wird jeder HiFi-Enthusiast sofort die „zeitlich, räumlich und eigenschaftlich bestimmten Schallereignisse“ und die „Aufweitung“ der Hörereignisse in Bezug zur Aufnahme sehen – schließlich wollen wir ja die Interpreten und Instrumente der Aufnahme einzeln lokalisieren, deren Größe und „Aufweitung“ und auch den „Aufnahmeraum“ wollen wir bei uns zu Hause „wahrnehmen“.

Das ist auch erst mal richtig. Auch diese Informationen werden – so sie denn in entsprechender Form auf der Aufnahme sind - von den Boxen wiedergegeben und vom Hörsinn entsprechend ausgewertet.

Aber kommt die am Hörplatz wahrgenommene Räumlichkeit nun von der Aufnahme oder vom Raum?

Bei einem Livekonzert (z. B. in einer Konzerthalle) sind die Instrumente die Schallquellen und sie erzeugen die Hörereignisse – bei entsprechendem Raum mit Räumlichkeit hat man dann den Eindruck die Instrumente nehmen akustisch mehr Raum ein als man es mit den Augen sehen kann.

Bei der Stereo-Wiedergabe im Hörraum sind ja die Boxen die eigentlichen Schallquellen, deren wiedergegebene Hörereignisse der Aufnahme bei „Räumlichkeit“ aufgeweitet werden; die einen größeren Raumbereich ausfüllen als die visuellen Abstände und Entfernungen der Boxen.

Somit kann man Räumlichkeit auch als eine Eigenschaft der Boxen-Raum-Hörplatzkombination und den daraus entstehenden Reflexionen im Raum sehen! Es ist jedenfalls keine Eigenschaft der Anlage an sich - und in wieweit Räumlichkeit auf der Aufnahme überhaupt vorhanden ist bzw. aufgezeichnet werden kann ist noch fraglicher (...dazu später mehr).

Diese Betrachtungsweise macht Sinn und erklärt meine Verbesserung der „Räumlichkeit“, die durch den Betrieb meiner Diskus-Boxen als Bipole wahrnehmbar wurde. Da weder am Signal der Aufnahme noch an der Anlage etwas verändert wurde, können die Veränderungen in der Hörwahrnehmung nur durch die zusätzlichen Reflexionen vom Schall der hinteren Wandler in meinem Hörraum verursacht worden sein. Trotzdem – oder gerade deshalb – sind jetzt auch die Informationen des Aufnahmesignals besser wahrnehmbar!

Das würde aber bedeuten, das die Ergebnisse von Blauerts Buch auch für die Wiedergabe von Schall über im Raum stehende Boxen zu Hause gelten!

Eigentlich ist das auch logisch:
Schallwiedergabe aus Boxen im Raum ist auch Räumliches Hören!
Für unseren Hörsinn sind die Boxen an sich Schallerzeuger!

Solange wir den Einfluss des Raumes auf unser Hörempfinden nicht ausschließen können (z. B. durch Kopfhörer oder im Freien), wird unser Gehör die von den Boxen wiedergegebenen Schallsignale mit allem was der Raum mit ihnen macht, gemäß den Mechanismen für „Räumliches Hören“ analysieren – ob wir wollen oder nicht!

Eine wichtige Erkenntnis ist also, dass unsere Hörwahrnehmung in Räumen sehr wesentlich über Reflexionen funktioniert! Reflexionen sind also notwendig und nicht generell störend!

Somit ist es wichtig, dass die Boxen auch (ausreichende) Reflexionen in der „richtigen Form“ erzeugen!

Das Hörereignis ist räumlich ausgedehnter, wirkt „räumlicher“, wenn reflektierter Schall vorhanden ist, als wenn dies nicht der Fall ist. Das Ausmaß der Vergrößerung der Hörereignisausdehnung durch reflektierten Schall ist von der Verzögerung des reflektierten Schalls weitgehend unabhängig. Entscheidend ist der Pegelunterschied (Anhang 1, 53)
Eine akustische Darbietung in einem Raum hört sich weniger hallig an wenn man mit beiden Ohren zuhört, als wenn man eines verschließt. Die „Verschleifung“ durch den Nachhall macht sich binaural weniger bemerkbar. (Anhang 1, 58)
Wichtig ist besonders der Befund, daß das Ausmaß der Räumlichkeit, die durch einen Einzelrückwurf (oder auch Mehrfachrückwürfe) erzeugt wird, in einem großen Verzögerungsbereich (5ms …80ms) von der Verzögerungszeit weitgehend unabhängig ist. Weiterhin kommt es offenbar für die Räumlichkeit nicht darauf an, ob die seitliche Energie aus einem oder mehreren Rückwürfen stammt, kennzeichnend ist vielmehr das Verhältnis der seitlich eintreffenden Energie zur Gesamtenergie. (Anhang1, 82)
Die Räumlichkeit wächst mit steigendem Gesamtschallpegel (Anhang 1, 83)

Die Mechanismen, die unser Gehörs beim räumlichen Hören anwendet, betreffen aber nicht nur die Räumlichkeit, sondern beeinflussen darüber hinaus auch andere Hörwahrnehmungen (z. B. die empfundene Lautstärke und die Klangfarbe/Tonalität):

Der Rückwurf (Rückwurf = einzelne Schallreflexion) ist bereits bei Verzögerung von 1ms hörbar, denn das Hörereignis ist lauter und räumlich ausgedehnter als bei Primärschall alleine. Mit steigender Verzögerungszeit werden weitere Veränderungen am Hörereignis bemerkbar. Das Hörereignis verändert seine Klangfarbe und gewinnt an räumlicher Ausdehnung. (179)
Das Gehör besitzt offenbar beim Binauralen Hören (Hören mit zwei gesunden Ohren) die Fähigkeit, gewisse lineare Verzerrungen der Ohrsignale bei der Bildung der Hörereignisklangfarbe unberücksichtigt zu lassen (Annahme daß unser Gehör unter bestimmten Voraussetzungen die Orte aller an der Summenlokalisation beteiligten Schallquellen erkennt und daraufhin geeignete inverse Filterungen vornimmt). (Anhang 1, 49)

Das bedeutet, daß die Reflexionen auch die Dynamik und die Klangfarbe (Tonalität) beeinflussen!

Dynamik ist der Unterschied zwischen den leisen und lauten Passagen einer Wiedergabe. Je leiser die Passage, desto leiser natürlich auch die Reflexionen dieser Passagen... evt. sogar so leise, daß sie vom Gehör nicht mehr als solches wahrgenommen werden. Folgt jetzt eine laute Passage, sind auch deren Reflexionen lauter und werden somit vom Gehör wahrgenommen mit der Folge, daß sie den lauten Direktschall „verstärken“... was die wahrgenommene Dynamik verstärkt!

Mir ist bereits mehrmals aufgefallen, daß ein Verrücken oder Einwinkeln der Boxen die Dynamik z. T. deutlich verändert - auch wenn der Hörplatz immer im Sweetspot ist (in dem ja eigentlich der Direktschall für die wahrgenommene Dynamik verantwortlich sein sollte)!
Seinerzeit wusste ich nicht genau warum - Dynamik brachte ich immer eher mit den Chassis, dem Verstärker oder dem Player in Verbindung - jetzt wird klar, daß das veränderte Reflexionsbild am Hörplatz die Ursache war.

Daß Reflexionen die Tonalität beeinflussen ist ja bekannt - wenn auch eher deren negativen Einflüsse durch Interferenzen z. B. von Bodenreflexionen. Auch hier haben sich z. B. Stimmen ins nasale und nervige verändert, wenn ich meine Boxen umgestellt oder anders eingewinkelt habe - oft half hier dann ein Teppich, der ja dann die frühen Reflexionen und in der folge deren Interferenzen abmindert.

Weniger bekannt ist aber, daß - wie aufgeführt - bei guter Lokalisation (die ja durch die entsprechenden Reflexionen erst gut wird) lineare Verzerrungen zumindest weniger stark wahrgenommen werden.

Raumeindruck

Das „Erkennen“ eines Raumes - im weitesten Sinne - erfolgt auch über die Auswertung der Reflexionen in diesem Raum und ist offenbar eine intuitive Eigenschaft, die wir nicht bewusst wahrnehmen oder gar steuern.

Bei Versuchspersonen, die einem Schallfeld von der Art ausgesetzt werden, wie es in geschlossenen Räumen vorkommt, stellt sich spontan eine begriffliche Vorstellung über die Art, die Größe und die Eigenschaften des Raumes ein, in dem sie sich tatsächlich oder vermeintlich befinden. Diese begriffliche Vorstellung wird etwas ungenau als „Raumeindruck“ bezeichnet. Der im konkreten Fall entstehende Raumeindruck ist mit den spezifischen räumlichen, zeitlichen und eigenschaftlichen Merkmalen der auftretenden Hörereignisse aufs engste vernküpft. (225)
Die Fähigkeit, sich eine „Vorstellung“ von dem Schallfeld in Räumen zu machen (einen „Raumeindruck“ zu entwickeln) und die damit verbundenen Rückwurfkonfigurationen sinnvoll interpretieren zu können scheint eine Fähigkeit zu sein, die sich im Leben recht früh ausbildet (in den ersten Lebenswochen). Der Präzedenzeffekt wird sozusagen intuitiv wirksam. (Präzedenzeffekt = Gesetz der ersten Wellenfront: Auslöser für bestimmte Gehörmechanismen - u. a. sog. Verdeckung - anhand steiler Druckanstiegsflanken).
...Wenn sich eine plötzliche Änderung in der Rückwurfkonfiguration einstellt, die für den Zuhörer im Rahmen seiner Erwartung der Schallquellenbewegungen oder möglicher raumakustischer Veränderungen nicht „plausibel“ ist, wird die Rückwurfunterdrückung gestoppt und eintreffende Ohrsignale werden neu analysiert. Während diese Analyse erneut abläuft, kann die Lokalisationsunschärfe vorübergehend stark ansteigen. Dadurch können neben dem Präzedenzeffekt weitere Lokalisationseffekte betroffen sein. (Anhang 2, 59)

Wir verbinden also den kurz nach „Betreten“ eines Raumes gewonnenen Raumeindruck (unbewusst) mit den in diesem Raum wahrgenommenen Hörereignissen... wir haben quasi eine Erwartungshaltung bezüglich dessen was wir in diesem Raum fortan an Hörereignissen wahrnehmen. Wird diese nicht erfüllt, kommt unsere „gewohnte“ Höranalyse ins Stocken...

Das lässt jetzt ein paar weitere Gedanken zu.

Zum einen wäre es also von Vorteil, wenn man den Hörraum betritt und nur den Schall aus den Boxen wahrnimmt. Dann sollte einzig der Raumeindruck der auf der Aufnahme ist, wahrgenommen werden - soweit er in brauchbarer Form auf der Aufnahme ist.

Das wird meist schwerlich möglich sein... allein die Wahrnehmung der eigenen Stimme oder anderer Geräusche im Hörraum verschaffen uns sehr frühzeitig einen Raumeindruck. Ist dann der Raumeindruck von der Aufnahme aus den Boxen anders als der bekannte Raumeindruck des eigenen Hörraums, wird er vom Hörsinn als „nicht zum Raum passend“ erkannt ...mit den o. a. Folgen.

Es sei denn, der Schall aus den Boxen erzeugt am Hörplatz ähnliche Reflexionen, wie andere Schallquellen in diesem Raum (z. B. die eigene Stimme) - passt dann also zum bekannten Raumeindruck (den wir ja auch über die raumspezifischen Reflexionen wahrnehmen).

Dann wäre es denkbar, daß wir den zusätzlichen Raumeindruck von der Aufnahme als in diesem Raum befindliches (Schall-) Ereignis empfinden - zumindest aber nicht mehr als „unpassend“ (...und daraufhin laufende Analyseprozesse stoppen, mit den o. a. Folgen).

Die Ergebnisse solch intuitiv und unbewusst ablaufender Analyseprozesse werden allerdings auch nicht bewusst empfunden.

Wenn alles „stimmig“ ist, also alle Höreindrücke zum Raumeindruck „plausibel“ sind, werden wir das ja nicht bewusst so empfinden!
Umgekehrt werden wir ja auch nicht bewusst bemerken, wenn es nicht „stimmig“ ist; wenn Rückwurfkonfigurationen zum Raumeindruck „unplausibel“ sind!
Dies wird dann auch eine unbewusste Reaktion hervorrufen.

Es ist durchaus vorstellbar, das wir solche „unstimmigen“, „unplausiblen“ Wahrnehmungen als „Angestrengtheit“ oder „Nervigkeit“ empfinden; oder das man Schwierigkeiten hat z. B. einzelne Details in komplexer Musik auseinander zu halten (weil z. B. die Menge an neu gestarteten Analysen zu groß ist und weil dann die o. a. Auswirkungen auf Präzedenzeffekt und Lokalisationseffekte zum Tragen kommen).

Was heisst das jetzt für die Wiedergabekette - die Anlage?

Der Schall von den Boxen im Raum sollte am Hörplatz einen ähnlichen Raumeindruck erzeugen, wie alle anderen Schallereignisse in diesem Raum, - also ähnliche Rückwurfkonfigurationen. (analog z. B. der Rückwurfkombination unser eigenen Stimme).

Eine Voraussetzung ist da das möglichst symmetrische Abstrahlverhalten.
Wenn das Abstrahlverhalten der Boxen zu unsymmetrisch ist – also z. B. nach oben tonal anders als zur Seite – wird das von den Boxen erzeugte Reflexionsbild am Hörplatz nicht die typischen Reflexionen enthalten, die z. B. die eigene Stimme im Hörraum erzeugt.

Lokalisierung

Ein weiterer wichtiger Aspekt bei der HiFi-Wiedergabe ist die möglichst präzise Lokalisierung und Differenzierung von Instrumenten und Interpreten (also Schallereignissen) einer Aufnahme. Das führt uns zu den Begriffen „Lokalisiertheit“, „Lokalisation“ und „Lokalisationsunschärfe“.

Auch hierzu gibt es in Blauerts Buch interessannte „Erkenntnisse“:

Die Lokalisiertheit von Hörereignissen ist mehr oder minder präzise. So läßt sich z. B. Lage und Ausdehnung eines Hörereignisses „anhaltender Ton“ in einem halligen Raum nicht genau angeben. Der Ton ist diffus lokalisiert. Scharf lokalisiert und abgegrenzt ist hingegen z. B. ein Knall in einem reflexionsarmen Raum. Man beschreibt die Lokalisiertheit von Hörereignissen, indem man ihren Ort und ihre Ausdehnung angibt, und zwar im Vergleich zu Orten und Ausdehnungen von anderen Wahrgenommenem anderer Sinnesorgane, insbesondere Sehereignissen. (3)
Definition „Lokalisation“: Zuordnungsgesetz oder –regel zwischen dem Ort eines Hörereignisses (z. B. bezüglich Richtung und/oder Entfernung) und einem bestimmten Merkmal oder bestimmten Merkmalen eines Schallereignisses oder eines anderen, mit dem Hörereignis korrelierten Ereignisses.(30)
Definition Lokalisationsunschärfe: Kleinste Änderung eines bestimmten Merkmals/Merkmale des Schallereignisses oder eines anderen, mit dem Hörereignis korrelierten Ereignisses (z. B. Bewegen der Schallquelle), die gerade zu einer Ortsänderung des Hörereignisses (z. B. bezüglich Richtung und/oder Entfernung) führt. (30)
Die Lokalisationsunschärfe kennzeichnet die Tatsache, daß der Hörraum weniger differenziert ist als der Schallquellenraum (mit Hörraum ist hier der Raum gemeint, den sich unser Hörsinn anhand der Hörwahrnehmung als virtuellen Aufnahmeraum „einbildet“). Das räumliche Auflösungsvermögen des Gehörs ist geringer als das mit physikalischen Meßtechniken erzielbare. Einer punktförmigen Schallquelle ist ein über einen bestimmten Raumbereich verschmiertes Hörereignis zugeordnet. Weiterhin gehen die nichtdeterminierbaren, zeitlichen Schwankungen der Lokalisation in die Lokalisationsunschärfe ein. (30)

Neben diesen Definitionen und Versuchsergebnissen sind auch die aufgeführten Modellvorstellung wie unser Gehör funktionieren soll (in Bezug auf räumliches Hören) recht interessant:

Das Gehör verfügt über mindestens zwei Auswertemechanismen (für räumliches Hören), die weitgehend unabhängig voneinander funktionieren. (139)
Der erste Mechanismus wertet interaurale (zwischen beiden Ohrsignalen) zeitliche Verschiebungen der Trägerschwingungen der Ohrsignale aus. Sein Einfluß auf die Hörereignisauslenkung (also die Richtungserkennung) ist nur dann wesentlich, wenn die Signale keine Anteile oberhalb 1,6kHz enthalten. (139)
Der zweite Mechanismus wertet interaurale Schalldruckpegeldifferenzen und interaurale zeitliche Hüllkurvenverschiebungen aus (Hüllkurve = wird vom Gehör aus der Spektralanalyse gebildet - also aus dem Verhältnis der Einzeltöne des Schallsignals, das in der Basilarmembrane bezüglich der tonalität analysiert wurde - Die Hüllkurve ist eine „gröbere“ Größe, die für die weiteren Prozesse leichter analysiert werden kann). Sein Einfluß auf die Hörereignisauslenkung (also die Richtungserkennung) dominiert, sobald die Signale wesentliche Anteile oberhalb 1,6kHz enthalten. (139)
Der zweite Mechanismus ist zeitvariant, er kann z. B. durch Umlernen verändert werden. (139)
Die relative Rolle beider Mechanismen kann interindividuell (jeder Mensch hört anders) (139)
Der erste Mechanismus ist wahrscheinlich träger als der zweite. (139)

Diese Modellvorstellung ist – wie ich finde – auch durchaus interessant:

Demnach analysiert das Gehör Schallverläufe parallel und integrativ - betrachtet also Zeitabschnitte zusammenhängend und gleichzeitig in mehreren voneinander unabhängigen Prozessen.

Für die Lokalisierung werden zeitliche Unterschiede zwischen beiden (bereits vorher bez. Trägerfrequenz und Hüllkurve analysierten) Ohrsignalen ausgewertet.
Diese „Auswertung“ setzt natürlich voraus, dass die vorhergehende Analyse (Trägerschwingungen und Hüllkurven) beider Ohrsignale weitgehend identische Ergebnisse bringt (damit sie als „gleich“ erkannt werden um deren zeitliche Verschiebung zwischen beiden Ohren auswerten zu können).

Demnach ist Hören also weit mehr, als nur das Erkennen von Tönen.
Hören ist also nicht nur eine Frequenzanalyse (...damit wird der Spruch „Frequenzgang wird überbewertet“ verständlicher)!

Diese „Auswertemechanismen“ sind offenbar auch recht leistungsfähig und basieren auf dem Vergleichen beider Ohrsignale:

Das Gehör ist in der Lage, aus interaural teilkoherenten Ohrsignalen solche Anteile herauszufiltern, die interaural koherent sind, und jedem dieser Anteile ein separates Hörereignis zuzuordnen. Bleiben zusätzlich inkoherente Anteile übrig, so sind die Hörereignisse weniger scharf lokalisiert, als wenn dies nicht der Fall wäre. Enthalten die Ohrsignale keine oder nur sehr geringe koherente Anteile, so wird jedem Ohrsignal ein getrenntes Hörereignis zugeordnet und zwar das gleiche, wie es bei monotonischer Darbietung des jeweiligen Ohrsignals erscheinen würde. (195) (Anm.: koherent = übereinstimmend)

Das Gehör kann also aus einem sehr komplexen Signalverlauf mehrere „identische Muster“ erkennen und analysieren um damit die „Orte“ der Quellen zu bestimmen.

h. daß der Direktschall und die vielen Reflexionen, die ja fortlaufend als sich überlagende Schalldruckverläufe an jedes Ohr gelangen, hinsichtlich möglicher übereinstimmender Muster für jedes Ohrsignal separat analysiert werden, um dann den zeitlichen Versatz der bei beiden Ohrsignalanalysen als übereinstimmend erkannten Muster auszuwerten!

Zu wenig „identische Muster“ erschweren dann natürlich diesen Erkennnungsprozess oder lassen ihn gar nicht erst entstehen was dann zum „Zusammenbruch“ der Lokalisation führt.

Zu wenig „identische Muster“ kann es sowohl bei den Informationen des wiedergegebenen Signals geben – also der Aufnahme - aber auch bei der Wiedergabeanlage wenn z. B. die Boxen untereindander tonale Untertschiede haben (Stichwort Paargleichheit der Chassis und Frequenzweichen) oder eben auch, wenn die Reflexionen des Signals aus den Boxen im Hörraum zu unterschiedlich zum Hörer kommen.

Wie bereits beim Raumeindruck beschrieben, ist es auch hier vorstellbar, das z. B. ein unsymmetrisches Abstrahlverhalten der Boxen – also nach oben tonal anders als zur Seite – zu unterschiedliche Reflexionen erzeugt – als Folge werden zu wenig „identische Muster“ erkannt.

Es gibt aber noch einen Aspekt, der die Erkennung von „Mustern“ erschweren kann - der Präzenedzeffekt (Gesetz der ersten Wellenfront)!

Das Gehör ist prinzipiell in der Lage Informationen über das Signalspektrum bereits aus der ersten Wellenfront, das heißt innerhalb sehr kurzer Auswertezeit zu gewinnen. (95)
Bei der Lokalisation werden also die jeweils zuerst am Trommelfell eintreffenden Signalanteile berücksichtigt und die späteren bei der Auswertung unterdrückt (Gesetz der ersten Wellenfront). (163)
Es ist diskutiert worden, daß bei fortlaufenden „natürlichen“ Schallen (z. B. Sprache, Musik) die in den Schallen enthaltenen häufigen Anstiegsflanken die Rolle der konditionierenden Signale für den Aufbau des Präzedenzeffektes übernehmen. (Anhang 2, 53)

Es ist vorstellbar, daß zu viele steile Anstiegsflanken mit der daraufhin einsetzenden Verdeckung die „Mustererkennung“ erschweren - es fehlen dann ja Informationen durch die Verdeckung!

Anstiegsflanken können nicht nur vom Musiksignal kommen.
Übliche Mehrwegeboxen mit ihrem räumlichen Versatz der Chassis (und der zusätzlichen Laufzeitverzögerungen durch die Frequenzweiche) erzeugen aus einer Anstiegsflanke im Eingangssignal mehrere zeitlich hintereinander am Ohr eintreffende Anstiegsflanken.

Diese zusätzlichen Anstiegsflanken sind natürlich auch in den Reflexionen enthalten - und zusätzlich noch mit gegenüber dem Direktschall unterschiedlichen Zeitabständen - auch die seitlichen Reflexionen werden zeitlich unterschiedliche Anstiegsflanken gegenüber dem Direktschall und auch gegenüber den oberen Reflexionen haben! Alles keine gute Voraussetzungen für einen Mustervergleich oder ähnliche Erkennungsprozesse.
Im Bild oben ist diese Problematik mal sehr vereinfacht und idealisiert dargestellt - ohne den Einfluss von Frequenzweichen und den Eigenschaften der Chassis - das kommt ja noch hinzu!

Man sollte sich auch vor Augen halten, das diese zeitlichen Verzögerungen durchaus im Bereich der menschlichen Wahrnehmung liegt - ein räumlicher Versatz von 3,4 cm entspricht einer Laufzeitdifferenz von ca. 0,1 ms!
Die zeitliche Auflösung des menschlichen Gehörs liegt zwischen 0,006 ms und 0,02 ms - je nach durchgeführter Studie und individueller Hörausprägung.
Die Laufzeitdifferenzen üblicher Mehrwegeboxen liegen im Bereich von 0,1 ms bis 0,5 ms.

Einige Modelle legen nahe, dass die Lokalisation auch noch von anderen – ebenfalls parallel ablaufenden – Prozessen und der Kenntnis und Vertrautheit des Signals beeinflusst wird:

Bei unbekannten sehr kurzen impulshaltigen Signalen besteht ein Trend, das Hörereignis in den rückwärtigen Sektor der Medianebene zu verlegen. Sind diese kurzen impulshaltigen Signale bekannt, tritt dieser Effekt nicht auf. Beim Richtungshören in der Median ebene spielt also die Signalkenntnis eine Rolle. Bei schmalbandigen Signalen (<2 Terzen) hängt die Hörereignisrichtung nur von der Signalfrequenz ab. (36)
Für die Lokalisation zwischen Schallquellenentfernung und Hörereignisentfernung spielt die Vertrautheit mit dem Signal eine wichtige Rolle. Für wohlbekannte Signale, wie z. B. mit natürlicher Lautstärke vorgetragene menschliche Sprache, entspricht die Hörereignisentfernung recht gut der Schallquellenentfernung. Schon bei ungewöhnlicher Sprechweise ergeben sich jedoch Abweichungen. (37)
Kreuzkorrelationsmodell (Vermutung, daß auch bei der Festlegung des Hörereignisortes Korrelationsprozesse stattfinden – Kreuzkorrelationsanalyse beider Ohrsignale): u.a. Die Kurzzeit-Kreuzkorrelationsfunktionen aller Spektralanteile werden einem „mustererkennenden“ Rechner zugeführt. Dieser entscheidet, welchem Zeichenmuster aus einem vorgegebenen Vorrat das an den Eingängen anliegende Muster mit höchster Wahrscheinlichkeit entspricht. …Das Ergebnis geht dann bei der Bildung eines oder mehrerer räumlich bestimmter Hörereignisse mit ein (204)

Offenbar sind beim räumlichen Hören sog. Top-Down-Prozesse beteiligt. Top-Down-Prozess: Mustererkennung als hypothesengesteuerter Prozess. Das System stellt jeweils die Hypothese auf, daß ein bestimmtes Muster in der binauralen Aktivität enthalten ist. Diese Hypothese wird dann geprüft und entweder angenommen oder verworfen. – Das Konzept der Mustererkennung geht von der Idee aus, daß dem System spezielle Anordnungsrelationen von Merkmalen (Muster) in den Datensätzen der binauralen Aktivität bekannt sind. Diese Muster gehören zu bestimmten Schallquellenanordnungen. Das System analysiert nun die binauralen Aktivitäten mit dem Ziel, Muster der genannten Art darin zu identifizieren. Wenn dies gelingt, können daraufhin Hörereignisse in den zugeordneten Positionen und Ausdehnungen gebildet werden (Anhang 2, 49).

Die Vorstellung, das unser Hörsinn eine Mustererkennung macht, führt wieder zum Einfluss guter Signalreproduktion einer Anlage – je genauer die von der Anlage wiedergegebene „Signalform“ (das „Muster“) ist, desto leichter kann es mit einem „bekannten“ oder „vertrautem“ Muster verglichen werden... und entsprechend leichter können die Hörereignisse analysiert werden.

Ob ein Signal (bzw. ein als Muster analysierter Schalldruckverlauf) „vertraut“ ist, kann erlernt werden – z. T. reicht da ein sich wiederholendes Signal (das neu und damit nicht „bekannt“ ist) in einer Aufnahme.
Das würde erklären, warum z. B. die Schärfe der Lokalisation einzelner Instrumente oder Interpreten einer Aufnahme mit zunehmender Hördauer oder gar bei Wiederholung oftmals besser wird – das „neue“ Muster wird „vertrauter“.

Hier sei mal erwähnt, daß Schall ja ein zeitlicher Luftdruckverlauf ist. Signalreproduktionstreue bezieht sich auf die Wiedergabe des zeitlichen Luftdruckverlaufs - nicht auf Frequenzgänge oder andere mathematisch, statistische Auswertungen des zeitlichen Luftdruckverlaufs. Als Messgröße für die Signalreproduktionstreue haben sich Sprungantwort oder Impulsantwort bewährt.

Im folgenden Bild sind die gemessenen Sprungantworten einiger Boxen dargestellt. Die oberen zwei Diagramme zeigen das elektrische Eingangssignal und darunter die theoretisch zu erwartende ideale akustische Antwort (aufgrund der Tiefpasseigenschaften jedes bandbreitenbegrenzten Systems geht der anfängliche Luftdruckanstieg gleichmäßig wieder auf den Umgebungsdruck zurück).

Je mehr die gemessene Sprungantwort der Box diesem theoretischen Ideal entspricht, desto besser ist deren Signalreproduktionstreue.

Wenn man sich dann die „realen“ Sprungantworten von üblichen Mehrwegeboxen anschaut (die konventionellen Lautsprecherboxen), sieht man recht eindrücklich, dass schon ein so einfaches Eingangssignal wie ein Rechtecksprung mit einer steilen Anstiegsflanke und nur einem Druckwechsel gleich in mehrere Druckwechsel mit mehreren steilen Anstiegsflanken „zerlegt“ wird – somit ein völlig anderes „Muster“ erhält.

Das zeigt, das die bereits im vorherigen Bild sehr vereinfachte Darstellung in der Praxis oft noch viel schlimmer ist.

Die „realen“ gemessenen Sprungantworten zeigen auch anschaulich die Masse-Feder-Eigenschaften dynamischer Chassis: das „Zurückschwingen“ unmittelbar nach der Beschleunigung (der Anregung) - von jedem Chassis wird eine zusätzliche Anstiegsflanke „erzeugt“.

Man kann sich leicht vorstellen, daß eine solche Signalreproduktion es dem Gehör zumindest schwerer macht bekannte Muster wieder zu erkennen.

Bei solchen üblichen Mehrwegeboxen kommt ja noch hinzu, daß sich die Sprungantwort auf Achse deutlich von denen die zur Seite und nach oben abgestrahlt werden unterscheidet... was ja zur Folge hat, das sich die „Muster“ der Reflexionen vom „Muster“ des Direktschalls unterscheiden... mit den besagten Folgen (siehe vorheriges Bild).

Das wäre u. a. eine Erklärung warum vielen Breitbandsystemen oder sog. Zeitkorrigierten Mehrwegesystemen – die Prinzip bedingt eine recht gute Signalreproduktionstreue haben - eine „authentischere“ Wiedergabe mit besserer Lokalisierung und Räumlichkeit nachgesagt wird.

Es scheint einleuchtend, daß eine schlechte Signalreproduktionstreue der Anlage Hörprozesse, die auf der Mustererkennung oder auf dem Gesetz der ersten Wellenfront basieren, zumindest erschweren.

Soweit mal die „Zitate“ und Anmerkungen aus Blauerts Buch.

Im Folgenden habe ich noch ein paar der Gedanken, die mir so beim „studieren“ von Blauerts Lektüre kamen, zusammenfassend betrachtet - speziell in Bezug zur Wiedergabe von Musik über eine Stereo-Anlage in den eigenen Wohnräumen:

Welche Konsequenzen haben diese - für mich - neuen Erkennisse über das Hören in Räumen?
Wie kann ich damit die Wiedergabe von Musik über eine Stereo-Anlage generell verbessern?
Was bedeutet „Räumliches Hören“ für die Aufnahme von Musik - speziell der Aufzeichnung von Räumlichkeit und Raumeindrücken?

Stereo-Wiedergabe über Boxen in Wohnräumen

Wenn man mal all die bisher hier aufgeführten Aspekte und Gedanken zusammenfasst und bezüglich der Stereo-Wiedergabe in Wohnräumen betrachtet, komme ich zu einigen wichtigen Erkenntnissen:

Hören über Boxen in Wohnräumen ist Räumliches Hören!
Boxen in Wohnräumen erzeugen immer Reflexionen!
Der menschliche Hörsinn nutzt und benötigt für viele Hörwahrnehmungen und Höreindrücke Reflexionen (des Direktschalls), die in bestimmten Lautstärke-Verhältnissen, in bestimmten zeitlichen Verzögerungen und aus bestimmten Richtungen zum Hörer gelangen!
Diese im Hörraum erzeugten Reflexionen und die damit erzielte Räumlichkeit haben nichts mit der Räumlichkeit (oder dem Aufnahmeraum) auf der wiedergegebenen Aufnahme zu tun.
Ohne diese im Hörraum erzeugten Reflexionen wird die Wahrnehmung von Räumlichkeit sowie die Erkennung von Lokalisationen der Aufnahme schwieriger oder gar unmöglich!
Diese im Hörraum erzeugten Reflexionen verbessern u. a. die Tonalität, Lokalisation und Sprachverständlichkeit und ermöglichen Räumlichkeit!

So trivial diese Erkenntnisse auch klingen, so sind sie doch sehr wichtig.

Denn sie bedeuten, dass die Wiedergabe von Schall über Boxen in Wohnräumen, wie jedes andere Signal in diesem Wohnraum – z. B. der eigenen Stimme - vom Hörsinn mit den Mechanismen für Räumliches Hören verarbeitet wird.

Das heißt, es geht im Prinzip darum dem Gehör die Informationen aus den Boxen so zuzuführen, das es sie mit den Mechanismen für Räumliches Hören analysieren kann – und das heißt eben in Form von Direktschall und entsprechenden Reflexionen!

Es ist auch völlig egal was an Informationen in dem Signal aus den Boxen enthalten ist – wenn Informationen des Aufnahmeraums im Stereosignal sind (z. B. der Direktschall und dessen Reflexionen des Aufnahmeraums), werden sie vom Hörsinn besser analysiert wenn das wiedergegebene Signal mit den entsprechenden Reflexionen des Hörraums zum Hörer gelangt!

h. auch Lokalisationsinformationen oder Raumeindrücke der Aufnahme werden durch die entsprechenden Reflexionen im Hörraum besser wahrnehmbar!

Wenn die Reflexionen des Signals aus den Boxen anders sind (hinsichtlich Tonalität, Pegel und Richtung), als die anderer Schallquellen im Hörraum (z. B. der eigenen Stimme), kann es sein, daß das Signal aus den Boxen als „Fremdartig“ erkannt wird.

Des weiteren wird die Hörwahrnehmung des Signals aus den Boxen „erschwert“ bzw. manche Höreindrücke werden gar nicht erst möglich, wenn:

Reflexionen fehlen,
Reflexionen aus der falschen Richtung kommen,
Reflexionen gegenüber dem Direktschall tonal zu unterschiedlich sind,
Reflexionen gegenüber dem Direktschall und anderen Reflexionen bezüglich ihrer Signalform zu unterschiedlich sind,
Reflexionen gegenüber dem Direktschall zu laut oder zu leise sind,
Reflexionen gegenüber dem Direktschall zeitlich zu früh oder zu spät an die Ohren kommen.

Glücklicherweise ist der Spielraum für den Lautstärkeunterschied und die zeitlichen Verzögerungen, mit denen die Reflexionen vom Ohr für die „gewünschten“ Höreindrücke und der Verbesserung der Analyse benötigt werden, recht groß. Insofern kommt es hier nicht auf ein db oder gar eine Millisekunde an.

Folgend mal ein entsprechendes Diagramm. Das zeigt zwar das Ergebnis für einen seitlichen Rückwurf (also eine seitliche Reflexion), gilt aber prinzipiell entsprechend auch für andere Einfallswinkel und mehrere Rückwürfe.

Der große schraffierte Bereich wird mit „wünschenswerter Räumlichkeit“ bezeichnet, in dem der Mensch Räumlichkeit mehr oder weniger stark empfindet.
Dies kann auch als der Bereich angesehen werden, in dem unser Hörsinn Reflexionen für die geschilderten Mechanismen verwendet bzw. benötigt.

Wenn man das Diagramm mal analysiert, so ergibt sich, das Reflexionen (eine oder mehrere) frühestens nach ca. 5ms ans Ohr kommen sollten und Reflexionen die später als ca. 60 ms ankommen vermieden werden sollten (bzw. deutlich leiser als der Direktschall sein sollten).

Es zeigt auch, dass für das Empfinden von Räumlichkeit Reflexionen benötigt werden und dass Reflexionen bis zu einer Pegeldifferenz von mehr als -20db immer noch wahrgenommen werden!
(Bei Versuchen mit Sinustönen werden i. d. R. Töne, die um 15db leiser sind als andere gleichzeitig wiedergegebene Töne nicht mehr sicher erkannt. Demgegenüber werden Reflexionen, die um mehr als 25db leiser sind als der Direktschall, durchaus wahrgenommen – u. a. in Form von Räumlichkeit! Dies erklärt sich mit den unterschiedlichen Mechanismen zur Erkennung von Tönen und dem „Verarbeiten“ von Reflexionen).

In der Darstellung ist auch eine „Kurve gleicher Räumlichkeit“ eingezeichnet die darstellt, das die Testpersonen des Versuchs bei diesen Pegel- und Verzögerungszeiten den Eindruck gleichbleibender Räumlichkeit hatten. Das zeigt, dass der Räumlichkeitseindruck offenbar über einen weiten Bereich von der zeitlichen Verzögerung der (seitlichen) Reflexionen unabhängig ist und nur vom Lautstärkeverhältnis der (seitlichen) Reflexionen zum Direktschall abhängt.

Die Stärke der empfundenen Räumlichkeit ist zudem fast linear von der Lautstärke der (seitlichen) Reflexionen abhängig - was aus folgender Grafik ersichtlich wird:

Nun kommen ja die Reflexionen nicht nur aus seitlicher Richtung ans Ohr, es kommen zusätzlich welche von vorn aus der Mitte (z. B. von der Wand hinter den Boxen und von der Decke), in spitzen Winkeln (von den Seitenwänden) sowie von der Wand hinter dem Hörplatz.

Diese führen je nach ihrem Pegelverhältnis und ihrer Tonalität zueinander zu „Verschiebungen“ der Lokalisation, der Bühnenbreite und der Tiefenstaffelung (dies entscheidet ob wir eine breite, eine schmale oder gar enge Bühne, eine flache oder eben eine tiefe Bühnendarstellung „wahrnehmen“).

Ideal ist es offenbar, wenn die meisten lauten Reflexionen direkt von der Seite kommen – also im 90° Winkel. Wenn sie unter spitzeren Winkeln ans Ohr gelangen, müssen sie lauter sein, um die gleiche Räumlichkeit zu erzielen. Dies wird aus dem folgenden Diagramm gut ersichtlich:

Die Tonalität von Reflexionen aus bestimmten Richtungen spielt dabei noch eine besondere Rolle. Zum Einen kann das Gehör Reflexionen mit zu großen tonalen Unterschieden (zum Direktschall und zu den anderen Reflexionen), keinem Direktschall zuordnen – womit viele der Hörwahrnehmungen und Analysen des Hörsinns dann gar nicht erst erfolgen.

Zum Anderen erfolgt über die Tonalität eine Lokalisierung bezüglich oben, unten, vorne und hinten, wenn an beiden Ohren identische Direktschall- und identische Reflexionsbilder erkannt werden; die Schallquelle also in der Medianebene (mittig vor, über oder hinter uns ist).

Hieraus kann man auch wieder auf die Notwendigkeit einer möglichst hohen Symmetrie der Reflexionen schliessen.

Diese Eigenschaft des Hörsinns würde erklären, warum bei manchen Anlagen Instrumente oder Interpreten „höher“ erscheinen, als über andere Anlagen und/oder in anderen Räumen. Ursache könnten „Betonungen“ bestimmter Frequenzbereiche der Reflexionen in bestimmter Form durch die Anlage oder den Raum sein.

Optimierung der Anlage

All diese Erkenntnisse brachten mich auf die Idee, die bisherige Vorgehensweise bei der Konfiguration oder Optimierung einer Anlage zu überdenken.

Wenn man eine Anlage oder gar neue Boxen sucht (oder entwickeln will) geht es eigentlich immer darum bestimmte Höreindrücke am Hörplatz zu Hause zu erhalten (oder zu verbessern).

Warum also nicht mal die für die gewünschten Höreindrücke notwendigen Vorraussetzungen von Seiten des Hörplatzes aus betrachten um daraufhin dann die Anforderungen an die Anlage und den Raum zu definieren.
Damit sollte es vielleicht besser möglich sein, geeignete Anlagenkomponenten – speziell Boxen – auswählen zu können (oder eben entwickeln zu können) und auch, wie sie dann besser im Raum positioniert werden.

Was ist also nötig, um am Hörplatz eine gute Räumlichkeit zu empfinden, verbesserte Sprachverständlichkeit zu haben, eine breite und tiefe Bühne sowie das von den Boxen wiedergegebene Signal möglichst gut analysieren zu können?

Nach den o. a. Ergebnissen aus Blauerts Buch braucht es am Hörplatz offenbar folgendes (Reihenfolge ohne Priorisierung!):

Direktschall mit hoher Signaltreue und ausgewogener Tonalität.
Erste Reflexionen die überwiegend aus seitlicher Richtung und mind. 5ms später als der Direktschall zum Hörplatz kommen.
Diese ersten seitlichen Reflexionen müssen am Hörplatz eine gewisse Lautstärke haben (die Lautstärke dieser Reflexionen bestimmt den Grad der Räumlichkeit).
Reflexionen aus der Mitte und von hinten sowie Reflexionen die mit weniger als 5ms Verzögerung zum Hörplatz kommen sind zu vermeiden bzw. sollten (in der Summe) min. 25db leiser sein als der Direktschall.
Das Reflexionsbild der Boxensignale darf sich tonal nicht zu sehr von den Reflexionen anderer Schallquellen in diesem Raum (z. B. der eigene Stimme) unterscheiden.

Daraus ergeben sich dann folgende Anforderungen an Anlagenkomponenten, Raumakustik und der Positionierung von Boxen und Hörplatz.

Punkt 1 und 5 geben vor, das die Anlage eine gute Signalreproduktionstreue haben und tonal ausgewogen sein sollte. Das Abstrahlverhalten sollte tonal und bez. Signalreproduktion möglichst symmetrisch sein (damit z. B. die Wiedergabe des Signals nicht als „fremdartig“ empfunden wird).

Wenn diese Voraussetzungen an die Anlage erfüllt sind, gilt es „nur noch“ die geeignete Kombination aus Abstrahlverhalten der Box, Boxenpositionen, Hörplatz und reflektierenden Flächen zu finden, um die „gewünschten Reflexionen“ zu erhalten (Punkt 2, 3 und 4).

Hier sind jetzt durchaus mehrere geeignete „Kombinationen“ möglich – in Abhängigkeit des Abstrahlverhaltens und der Einwinkelung der Boxen sowie den Reflexionsmöglichkeiten der den Boxenpositionen naheliegenden Flächen (die ja ggf. auch bedämpft werden können/müssen).

Im Prinzip gibt es zu einer vorgegebenen Boxenkonstruktion – speziell deren Abstrahlverhalten – nur bestimmte „passende“ Räume/Positionen. Oder andersherum: zu jedem vorgegebenen Raum (resp. Positionen) gibt es nur bestimmte „passende“ Boxen.

In der Praxis ist ja meist eine oder mehrere dieser „Variablen“ vorgegeben.
Ist z. B. der Raum und Raumakustik bzw. die Position der Boxen und des Hörplatzes nur beschränkt veränderbar, gilt es die dazu passenden Boxen (speziell bezüglich deren Abstrahlverhalten) und deren Position und Einwinkelung zu finden.
Bei vorgegebenen Boxen gilt es deren Position und Einwinkelung sowie die Reflexionseigenschaften der Wände aufeinander abzustimmen.

Wichtig ist immer die Reflexionen des von den Boxen wiedergegebenen Schalls in Bezug auf den Hörplatz hin zu ermitteln bzw. abzuschätzen.
Dazu reicht es die Hauptreflexionen zu betrachten. Schall wird ja gemäß den Spiegelungsgesetzen reflektiert, so dass man rein aus den geometrischen Gegebenheiten die Richtung und mit Hilfe der Schallgeschwindigkeit (340m/s) die Verzögerungen und auch den Pegel der Reflexionen am Hörplatz ermitteln kann.

Frühe Reflexionen (< 5ms) sollten soweit wie möglich vermieden werden - vor allem die Bodenflächen vor den Boxen sollten schalldämpfend sein (z. B. Teppiche).
Idealerweise kennt man die Abstrahleigenschaften der Boxen – um damit den Pegel der seitlichen Reflexionen ermitteln zu können.

Da dies ja auch von der Einwinkelung der Boxen abhängt, kann man damit die seitlichen Reflexionen auch etwas beeinflussen – allerdings werden bei stärkerer Einwinkelung meist mehr Reflexionen von der Wand hinter den Boxen erzeugt, was man durch entsprechenden Abstand zu der Wand und/oder entsprechende Dämpfungsmassnahmen an dieser Wandfläche verhindern kann.

Einen gewissen Vorteil können Boxen bieten, die nach vorne und nach hinten Schall abstrahlen – also Dipole oder Bipole.
Die Reflexionen der hinteren Schallabstrahlung sind ja vom Prinzip her schon mal „länger unterwegs“ womit sie über den Umweg der hinteren und seitlichen Raumwände am Hörplatz fast immer mehr als 5ms Verzögerung gegenüber dem Direktschall haben. Da der rückwärtige Schall meist auch gleichlaut wie nach vorne abgestrahlt wird, kommen die Reflexionen vom hiteren Schall auch lauter beim Hörer an, als z. B. bei normalen Boxen (also Monopolen) deren Reflexionen am Hörplatz von dem pegelmäßig leiseren seitlich abgestrahlten Schall der (vorderen) Chassis kommen.

Das erklärt, warum u. a. die Räumlichkeit bei Dipolen oder Bipolen meist stärker ist als bei normalen Boxen (also Monopolen).

Voraussetzung ist aber auch bei Dipolen oder Bipolen eine „richtige“ Positionierung. Man muss hier ja neben den seitlichen Reflexionen der vorderen Schallabstrahlung auch noch die Reflexionen der hinteren Schallabstrahlung berücksichtigen - es kann hier durchaus zu unerwünschten Interferenzen kommen, die sich dann tonal bemerkbar machen.

Bei Dipolen gibt es weniger seitliche Schallabstrahlung – durch die seitlichen Auslöschungen aufgrund der Dipol-Wirkungsweise. Oft kann man diese Boxen deshalb dann näher an eine Seitenwand stellen.

Im folgenden mal ein Beispiel für die Abschätzung der Reflexionen (hier für Dipole mit vorderem und hinterem Chassis in einem ca. 40qm grossen Wohnraum mit zusätzlichen Reflexionsflächen hinter den Boxen).

Im Bild sind die Laufzeit- und Pegeldifferenzen in Bezug auf den Direktschall am Hörplatz für einige Reflexionen des vorderen und des hinteren Chassis eingezeichnet. Für eine Abschätzung der Pegeldifferenz am Hörplatz muss man berücksichtigen, das die Reflexionen des vorderen Chassis vom seitlich abgestrahlten Schall kommen, der ja meist schon mit deutlich geringerem Pegel abgestrahlt wird, als der Direktschall.

Das Beispiel zeigt auch gut, das eine Schallabstrahlung nach hinten mit den Reflexionen an den hinteren und seitlichen Raumwänden schon prinzipbeding zu deutlich grösseren Laufzeitdifferenzen führt als die Reflexionen der seitlichen Abstrahlung des vorderen Chassis.

Im gezeigten Beispiel macht dies den Unterschied von „guten Reflexionen“ (>5ms) und „schlechten Reflexionen“ (<5ms) aus.

In jedem Fall wird es ein Probieren und Experimentieren, aber man kann mit dem Wissen, wie die benötigten Reflexionen „beschaffen“ sein müssen, zielgerichteter vorgehen.

Man kann sich jetzt auch mal die „idealen“ Boxen vorstellen, mit denen man möglichst viele Einflussmöglichkeiten hat, um in vielen Räumen und Aufstellpositionen die geeigneten Reflexionen zu erzeugen.

Ideal wären demnach aktive Bipole/Dipole mit je einem separaten Breitband- oder Koax-Chassis vorne und hinten. Jedes dieser Chassis sollte beeinflussbar sein (z. B. per DSP), um Pegel, Frequenzgang, Laufzeiten und Polarität der hinteren Chassis verändern zu können.

Perfekt wäre es dann noch, wenn die hinteren Chassis in ihrer Abstrahlrichtung veränderbar sind (um sie z. B. mehr zur Seite oder nach oben ausrichten zu können)...

Bewertung von Anlagen

Wenn so wichtige Höreindrücke wie Räumlichkeit, Lokalisierung, Sprachverständlichkeit und sogar Klangfarbe/Tonalität und Dynamik von den Reflexionen im Raum z. T. erheblich mitbestimmt werden, muss man die bisherige Bewertung von Boxen und Anlagen durch Hören generell überdenken!

Nehmen wir nochmal einige der Aussagen zu meiner damaligen Anlagen-Konstellation:

„.....aber ich muss noch was zum Sweetspot sagen: Den gibt's zwar durchaus, aber es ist kein ,,Spot'' - eher eine Area ...die Räumlichkeit ist einfach super und einzelne Schallereignisse sind stabil und leicht zu unterscheiden....“

„Die Lautsprecher klingen unaufdringlich. ...Völlig entspannte Wiedergabe aller Scheiben....dass Scheiben wie z.B. Supertramp usw., die teilweise sehr schlecht aufgenommen waren, hier deutlich gewannen.“

Jeder sieht diese Aussagen erstmal in Bezug auf die Qualität der Anlage und der Boxen, vielleicht noch bezogen auf die Raumakustik generell.

Sicherlich erfüllt meine Anlage einige der o. a. Voraussetzungen, aber die damaligen Höreindrücke – speziell die Räumlichkeit und die gute Wiedergabe schlechter Aufnahmen – kamen wohl im Wesentlichen von den „passenden“ Reflexionen – auch durch die hinteren Wandler.

Denn, die gleichen Boxen und Anlagenkomponenten im veränderten Raum mit anderer Aufstellung ergaben natürlich ein anderes Reflexionsbild - und brachten nicht mehr diese Höreindrücke.

Erst die Änderung des Reflexionsbildes – jetzt bewußter und entsprechend den Erkenntnissen aus Blauerts Buch - brachten trotz verändertem Raum und anderer Aufstellung wieder die damaligen Höreindrücke... und lassen sich auch durch die in Blauerts Buch aufgeführten Erkenntnisse auch erklären!

Das bedeutet im Umkehrschluss, dass Höreindrücke von Boxen und Anlagen – speziell deren Räumlichkeit und Lokalisierungsschärfe, aber auch Tonalität, Sprachverständlichkeit oder Dynamik – weit weniger mit den Boxen oder der Anlage zu tun haben als bisher angenommen! Viel mehr hängt es davon ab, ob „passende“ Reflexionen am Hörplatz ankommen.

Wenn man mal von groben „Fehlern“ einer Box absieht, wird damit eine Bewertung von Boxen ohne die Kenntnis des Reflexionsbildes am Hörplatz wertlos... speziell, wenn man von diesen Boxen „lernen“ will, um ähnliche Höreindrücke im eigenen Raum zu erzeugen.

Anstatt bei all den Hörtest in Zeitschriften akribisch die verwendeten Komponenten aufzulisten (bis hin zu den Kabeln und Netzfiltern etc.) wäre es für eine Bewertung wesentlich hilfreicher, den Raum, die Aufstellung, das Rundstrahlverhalten der Boxen und als Folge dieses Zusammenwirkens dann das Reflexionsbild in Bezug auf den Hörplatz zu erläutern.

Räumlichkeit und Raumeindruck auf Aufnahmen

Sowohl Pfleiderer als auch Blauert gehen in ihren Büchern auch auf die Aufzeichnung von Räumlichkeit und Rauminformationen die im Aufnahmeraum auftreten ein. Beiden ist klar, daß dies die Aufzeichnung der an einem „Hörplatz“ im Aufnahmeraum eintreffenden Rückwurfkombination bedeutet. Also das Aufzeichnen der Reflexionen in der entsprechenden Form, wie sie Blauert für das Funktionieren von Räumlichen Hören beschreibt.

Jens Blauert beschreibt ein mögliches Aufnahmeverfahren: die Kunstkopfstereophonie. Die Wiedergabe solcher Aufnahmen ist allerdings nur mit Kopfhörer möglich.

Auch Peter Pfleiderer beschreibt ein entsprechendes Aufnahmeverfahren - das sog. Pfleid-Marrot-Mixing. Diese Aufnahmemethode wird allerdings kaum angewendet.

Auf den allermeisten Aufnahmen sind also keine Informationen aufgezeichnet, die es ermöglichen, bei der Wiedergabe über eine Stereo-Anlage zu Hause am Hörplatz die Räumlichkeit oder die Lokalisationsinformationen die während der Aufnahme (an einem bestimmten Platz!) wahrnehmbar gewesen wäre, wahrzunehmen!

Andererseits hat man aber oft den Eindruck Unterschiede bei den Aufnahmen bez. der „Räumlichkeit“ zu hören. Es kommt auch oft vor, daß man meint, die eine oder andere Anlagenkomponente würde mehr oder weniger „räumlich“ klingen… wie kann das sein?

Unbestritten ist, daß bei den meisten Aufnahmen ein „Raumeindruck“ wahrnehmbar ist – also man kann z. B. unterscheiden, ob die Aufnahme in einer Kirche, einer Jazzkneipe oder einem Freiluftkonzert stattgefunden hat (bzw. stattgefunden haben soll) – und das eben auch über Kopfhörer, wenn keine Reflexionen aus dem Wiedergaberaum vorhanden sind.

Nun ist die Wahrnehmung eines Raumeindruckes etwas anderes als Räumlichkeit - diese zwei Begriffe bzw. diese zwei Höreindrücke werden offenbar oft verwechselt – auch, weil sie vom Höreindruck ähnlich sind und auch weil sie zusammenhängen.

Interessanterweise gibt es hierzu auch bei einer der Quellen von Blauerts Recherchen eine interessante Untersuchung: Wagner, B. „Räumliche Verteilung der Hörrichtungen in synthetischen Schallfeldern“.

Diese Arbeit betrachtet den Einfluss von einzelnen und mehreren seitlichen Reflexionen in Verbindung mit Nachhall auf die Räumlichkeit und die Lokalisierungsschärfe.

In der Untersuchung geht es zwar mehr um die Erzeugung von Rauminformationen auf der Aufnahmeseite durch Hinzumischen von Hall, aber die Versuchsergebnisse lassen auch Rückschlüsse für die Wiedergabekette zu.

Ein Ergebnis dieser Versuche ist, dass sehr starker (lauter und diffus verteilter) Nachhall zwar für eine ausgeprägte Räumlichkeit sorgt, aber die Lokalisierungsschärfe darunter leidet – einzelne Schallereignisse werden fast nur noch diffus wahrgenommen. Zudem werden erste starke Reflexionen nicht mehr richtig wahrgenommen, bzw. haben kaum noch Einfluss auf die Hörwahrnehmung.

Ein weiterer Versuch war die Unterscheidung von Raumeindrücken (Wiener Musikvereinssaal im Vergleich zu typ. Wohnzimmer, Vortragsraum mit Deckenreflektor, Kirche, grosser flacher Saal, Stadthalle Göttingen) anhand des Nachhalls und einiger erster starker Reflexionen des jeweiligen Raumes.

Hierbei kam heraus, dass die Unterscheidung des Raumes - also der Raumeindruck -offenbar mehr vom Nachhall abhängt als von den ersten starken Reflexionen.

In Blauerts Buch findet sich folgendes Fazit u. a. des o. a. Versuchs:

Mitbestimmend dafür, daß ein bestimmter Raumeindruck zustande kommt, ist z. B. das charakteristische zeitliche Verschleifen der Hörereignisse infolge späten Rückwürfen und Nachhall. (Anhang 1, 75)
Die Auswirkung des Nachhalls auf die räumlichen Attribute der Hörereignisse ist deutlich unterschiedlich von derjenigen früher lateraler Rückwürfe. Nachhall führt z. B. dazu, das die Entfernung der Primärhörereignisse bezüglich der Zuhörer anwächst. Weiterhin nehmen die Zuhörer bei Tonhöhen- und Lautstärkewechseln sowie bei plötzlichem Verstummen der Schallquelle charakteristische abklingende Hörereingisanteile wahr, die stark raumfüllend sind. Die auditiven Wirkungen des Nachhalls sind für den Raumeindruck insgesamt mitbestimmend. (Anhang 1, 81)

Das würde gut erklären, warum auch bei Aufnahmen, die nicht die „passenden“ Reflexionen enthalten, ein Raumeindruck gut wahrnehmbar ist. Nachhall ist bez. dessen Eigenschaften für die Hörwahrnehmung wesentlich unkritischer als die ersten starken Reflexionen, die ja bez. Richtung, Pegel und Verzögerung einige Bedingungen erfüllen müssen um vom Hörsinn entsprechend auswertbar zu sein!

Nachhall kann auch recht einfach einer aufnahme zugemischt werden... was ja auch oft genug gemacht wird.

Aber selbst bei Aufnahmen die ohne Beimischung von Nachhall aufgenommen werden, ist solcher "Nachhall" auf der Aufnahme.

Bei den meisten Aufnahmen werden mehrere Instrumente/Interpreten mit mehreren Mikrofonen, die zudem noch nah an den Instrumenten/Interpreten sind, zugleich oder auch nacheinander aufgezeichnet. Anschließend werden diese separaten Aufnahmen (Tonspuren) dann im Tonstudio zusammengemischt.
Es ist einsichtig, das hierbei die aufgezeichneten Reflexionen im Aufnahmeraum (wenn es denn nur einer ist!) von all den Mikrofonen nach einer Abmischung auf die zwei Stereo-Kanäle weder zeitlich noch pegelmäßig und schon gar nicht richtungsmäßig „zusammenpassen“. Selbst durch separate Mikrofone, die den Raumeindruck aufzeichnen sollen – wie ja oft bei Aufnahmen eingesetzt – werden die Reflexionen der Instrumente bei den Stereo-Kanälen weder zeitlich noch richtungsmäßig noch bez. des Pegels im richtigen Verhältnis zum direkt am Instrument aufgezeichneten Direktschall der Instrumente sein.
Zudem wird ein nah am Instrument platziertes Mikrofon auch den Schall anderer Instrumente und auch die Reflexionen im Aufnahmeraum aufzeichnen – wenn auch mit deutlich geringem Pegel, stark laufzeitverzögert und zeitlich nicht „passend“ zu den entsprechenden Aufzeichnungen der anderen Mikrofone.

Reflexionen, die weder zeitlich noch richtungsmäßig zusammenpassen und vor allem einen deutlich größeren Laufzeit- und Pegelunterschied zum Direktschall haben (und auch sonst nicht zum Direktschall passen) werden vom Hörsinn eher als „Nachhall“ angesehen.

Dieser Nachhall kann für einen Raumeindruck sorgen – zumindest aber zum Unterscheiden gegenüber den Raumeindrücken von anderen Aufnahmen.

Dies wäre eine Erklärung, warum wir bei Aufnahmen, einen Raumeindruck wahrnehmen oder zumindest den eines anderen Raumes als den eigenen bzw. unterschiedliche Raumeindrücke bei verschiedenen Aufnahmen.

Es würde auch erklären, warum z. B. über Kopfhörer oder bei stark gerichtet abstrahlenden Boxen, ein „Raumeindruck“ wahrnehmbar ist – der allzuoft als „Räumlichkeit“ interpretiert wird.

Diese Betrachtung fürht aber noch zu einer anderen „Erkenntnis“:

Dieser „Nachhall“ hat auf der Aufzeichnung (also dem Wiedergabesignal) gegenüber dem Direktschallsignal einen sehr geringen Pegel bzw. die Form von rel. kleinen Pegeländerungen des zeitlichen Signalverlaufs.

Wie gut diese Informationen mit ihren geringen „Pegelschwankungen“ gegenüber dem Direktschallsignal vom Gehör wahrgenommen werden, hängt somit entscheidend von der Signalreproduktionstreue der Anlage ab – speziell, wie gut eine Anlage solche kleinsten Signaländerungen überhaupt wiedergeben kann!

Mit anderen Worten: Anlagenkomponenten, die in der Lage sind kleinste Signaländerungen gut wiederzugeben, sollten demnach besser in der Lage sein Raumeindrücke auf der Aufnahme bzw. den „Nachhall“ zu reproduzieren und unterscheidbarer zu machen.

Das passt wiederum gut zu den Höreindrücken, die man z. B. über Unterschiede zwischen DA-Wandlern liest – Stichwort Antialiasing-Filter und Impulsantwort. Hier wird ja oft von einer verbesserten Raumabbildung, verbesserten Räumlichkeit (wobei das ja dann eher der Raumeindruck ist) und besserer Detailauflösung berichtet… was ja passen würde!

Hohe Signalreproduktionstreue ist ja auch eine der Voraussetzungen der Anlage um das für das Gehör passende Reflexionsbild am Hörplatz zu erzeugen, damit u. a. eine gute Räumlichkeit wahrgenommen wird.

….somit wird auch die vermeintlich bessere „Räumlichkeit“ von Anlagenkomponenten durchaus „erklärbar“.

Fazit

Soweit mal meine Gedanken zu „Räumlichen Hören“ und Hören in Räumen.

Für mich brachten diese Erkenntnisse sehr schnell Fortschritte bei meiner Anlage – sicherlich auch, weil ich „passende“ Reflexionen recht einfach durch die separate Ansteuerung meiner hinteren Diskus-Wandler erzeugen kann.

Das zeigte mir recht eindrücklich, welch enormen Einfluss Reflexionen auf viele Hörempfindungen haben… nicht nur auf Räumlichkeit und Lokalisation, auch Tonalität, Dynamik und Sprachverständlichkeit werden durch die passenden Reflexionen positiv beeinflusst.

Das konnte ich zwar auch früher schon bei manchem Umstellen meiner Boxen bemerken - speziell, dass sich bez. Dynamik und Tonalität etwas ändert - aber damals kannte ich die Zusammenhänge noch nicht. Die wurden mir erst durch die Lektüre von Blauerts Buch klarer – jetzt erklären sich viele Höreindrücke.

Für mich gilt jetzt: Viele (passende) Reflexionen = gute HiFi-Wiedergabe!

Diskus_GL

alias
Joachim Liepold

im April 2015

Nachtrag 05.06.2015:

Ich habe mich in der Zwischenzeit auch ein wenig mit Kopfhörerwiedergabe beschäftigt und dabei gab es auch einige Erfahrungen, die recht gut zum obigen Artikel passen.

Über Kopfhörer habe ich immer so gut wie keine räumliche Lokalisation (außer bei Kunstkopf-und Binaural-Aufnahmen). Alles spielt sich im Kopf ab, und zwar weitgehend in einer Ebene zwischen den Ohren. Bei manchen Aufnahmen erscheinen einzelne Instrumente schon mal etwas vor oder hinter dieser Ebene, aber es ist alles sehr eng – kein Vergleich mit der breiten und tiefen Bühnendarstellung meiner Anlage im Raum. Zudem klingen viele Aufnahmen recht „trocken“ und irgendwie nach kleinem (stark gedämfptem) Studio.

Gemäß den Ausführungen von Blauert ist das ja auch erklärbar, da über Kopfhörer keinerlei Reflexionen des Raums vorhanden sind und auch die Unterschiede des Direktschalls bez. Tonalität (Aussenohrübertragungsfunktionen) und Laufzeiten zwischen beiden Ohren nicht existieren – zumindest bei den meisten, nach „üblichen“ Verfahren erstellten und abgemischten Aufnahmen.

Interessanterweise gibt es die Möglichkeit, bei der Wiedergabe diese fehlenden „Informationen“ zu erzeugen. Ich habe mir dafür ein Software-PlugIn gekauft (ToneBoosters Isone), mit der die sog. HRTF (Head Related Transfer Funktion) simuliert werden kann. Dabei wird - wie beim Hören ohne Kopfhörer - das Signal einer Seite Laufzeitverzögert sowie mit anderer Intensität und Tonalität der jeweils anderen Seite zugeführt – so wie es beim Hören ohne Kopfhörer ja auch der Fall ist.
Man kann dies über zwei Parameter (Kopfgrösse und Ohrgrösse) und in seiner Gesamtwirkung einstellen.
Nach der persönlichen Kalibrierung (entsprechend der Anleitung im Handbuch), ist die virtuelle Bühne in Breite und Tiefe merklich vergrössert - nicht dramatisch, aber durchaus so, daß einzelne Hörereignisse jetzt räumlich besser auseinander zu halten sind.
Es spielt sich (bei mir) zwar immer noch alles im engen Bereich um meinen Kopf herum ab… (so ca. 10 bis 20cm Umkreis) aber gerade nach vorne und nach hinten ist die Bühne grösser - bei einzelnen Instrumenten jetzt sogar deutlich vor anderen Instrumenten (...bei anderen mehr nach hinten und mehr zur Seite)!

Eine weitere Funktion dieser Software ist die Simulation von Räumen.
Dies erfolgt über die Parameter Raumgröße (Raumvolumen), Pegel der frühen Reflexionen, Diffusionsgrad des Schalls von den Wänden und der T60 Zeit (Nachhallabklingzeit). Damit lassen sich einige der Parameter einstellen, die bei Wiedergabe von Schall über Boxen im Raum einen Einfluss haben (… und die beim Hören über Kopfhörer ja fehlen!).
Ein paar Räume sind als Presets abrufbar - unter anderem verschieden grosse Abhörstudios und auch ein schalltoter Raum. Allein bei diesen Räumen ist es interessant, wie unterschiedlich dabei die Wiedergabe klingt.

Man erreicht zwar bei weitem nicht die Höreindrücke wie sie bei Wiedergabe über Boxen in einem Raum mit „guten“ Reflexionen sind, aber es lässt sich sehr gut nachempfinden, welchen Einfluss diese Parameter auf die Wiedergabe haben! Für mich klingen die Aufnahmen damit deutlich „authentischer“ – es ist mehr Luft um die Interpreten und Instrumente und der „trockene“, studiomäßige Eindruck ist komplett weg.

Die veränderbaren Parameter dieses PlugIns entsprechen ja im Wesentlichen den Eigenschaften von Reflexionen in einem Raum – also dem, was im obigen Artikel beschrieben wird.
Somit lassen sich damit recht schön die Einflüsse von Reflexionen simulieren.
Allein die Tatsache, daß es über Kopfhörer mit der Simulation eines Raumes deutliche Unterschiede bei der Lokalisation und anderer Wiedergabeeigenschaften gibt, zeigt, welche Bedeutung Reflexionen auf die Höreindrücke haben!

Nachtrag 31.03.2017:

Seit geraumer Zeit betreibe ich die hinteren MSW mit einem elektrischem Delay von 5ms (pre DSP, gegenüber den vorrderen MSW).
Ich kam darauf, als ich bemerkte, das offenbar auch vom hinteren MSW zu frühe Reflexionen vom Boden den klangeindruck veränderten - wenn ich den Pegel der hinteren MSW erhöht habe hat sich der Klang (vor Allem im Mitteltonbereich) verändert. Es kommt halt nicht alles an Schall über die Rück- und Seitenwände bzw. die Reflektorscheiben zum Ohr. Vor Allem im Mitteltonbereich hat der MSW ja ein breites Abstrahlverhalten und da strahlt eben auch ein Teil zum Boden und kommt somit zu früh an die Ohren.

Nachdem ich ein festes Delay per DSP eingestellt habe kommt somit alles vom hinteren MSW - egal ob über die Wände und Reflektorscheiben oder vom Boden - mit min. 5ms Delay gegenüber dem Direktschall. Damit ist für das Gehör ein klare Trennung zwischen Direktschall und Reflexionen gewährleistet.

Die tonale Veränderung, wenn ich den Pegel der hinteren MSW erhöhe, ist jetzt nahezu weg - es funktioniert also.

Nachtrag 19.07.2017:

Bisher habe ich flache Flächen (zuletzt Glasscheiben) als Reflektoren verwendet. Diese brachten (mehr oder weniger) gerichtete Reflesxionen in den Raum. Diese waren entweder auf die Seitenwände oder die Decke gerichtet. Sicherlich wurden durch die Wand- und Deckenflächen die Reflexionen diffuser, aber vor Allem ausserhalb des Sweetspots gab es "Fokusbereiche" 8bei denen man den Eindruck hatte Lokalisation ist unschärfer und mehr zu einer Seite verschoben

Seit ein paar Tagen habe ich die Reflexionsflächen mit Halbkugeln versehen, die den rückwärtigen Schall direkt diffusser verteilen.

Damit verringern sich die "Fokusbereiche", die Lokalisationsschärfe - vor allem ausserhalb des Sweetspots - wird besser und der Raumeindruck wird größer. Der sinnvoll nutzbare Pegelbereich der hinteren Wandler (bei dem eine Verbesserung erzielt wird) verschiebt sich und ist auch größer geworden.

Offenbar ist eine mehr diffuse Schallverteilung der Reflexionen insgesammt besser....

Nachtrag 01.03.2019 (zusammengefasst mit Nachtrag vom 13.03.2018):

In einem Themenbeitrag bin ich auf neue Publikaltionen von Siegfried Linkwitz gestossen, die sehr schön zum Thema passen:

http://www.linkwitzlab.com/AES123-final2.pdf

Und in teilweiser Übersetzung von mir: Der Effekt eines rueckwaertigen Hochtoeners

Er beschreibt darin weitgehend die gleichen Erfahrungen wie ich sie in diesem Artikel ausgeführt habe..und kommt auch zu ähnlichen Ergebnissen.

Aufgrund dieser Publikation von Sigfried Linkwitz habe ich erneut ein wenig mit den hinteren MSW und deren Reflexionen experimentiert.

Bei meinen Überlegungen was den „typischen“ Schallplattenklang ausmacht, kam ich zudem auf das Übersprechverhalten als eine klangbestimmendes Eigenschaft (Näheres siehe Schallplatte versus CD ). ein akustisches Übersprechen der Reflexionen realisiere ich seitdem durch das Vertauschen der Kanäle der hinteren MSW - aus dem hinteren Wandler der rechten Box kommt jetzt das Signal des linken Kanals und umgekehrt.

Als nächstes habe ich für die Rear-MSW eine Hochtonanhebung (highshelf ab 5000Hz, +5db gegenüber Front-MSW) eingeführt und auch insgesammt den Pegel der interen MSW deutlich erhöht - fast genauso laut wie die vorrderen (was der Linkwitz-Box ja entspricht).

Dies führte unmittelbar zu mehr räumlicher Tiefe und deutlich "losgelösterem Klang von den Boxen" - speziell an den aussermittigen Hörplätzen.

Linkwitz schreibt zwar, daß man den Hochton des rückwärtig abgestrahlten Schalls nicht anheben sollte, aber er geht ja von Boxen aus, die mit Kallottenhochtönern ein rel. breites Abstrahlverhalten im Hochton haben. Der MSW hat demgegenüber eine zunehmende Bündelung (bzw. eine sog. "Keulenbildung") ab ca. 3kHz. Aufgrund dieses Abstrahlverhaltens des MSW könnte das „Mehr“ an Hochton (durch den High-Shelf bei 5000Hz) über die Reflexionen dem Klang am Hörplatz wiederum gut tun – offenbar funktioniert das auch.

Des Weiteren habe ich mit der Stellung der hinteren Reflektoren etwas gespielt – also in welche Richtungen der hintere Schall im Wesentlichen „gelenkt“ wird. Das habe ich zwar auch vorher schon mal gemacht, aber die Unterschiede sind jetzt mit der Pegel- und Hochtonanhebung der hinteren MSW deutlicher.

In den folgenden Bildern habe ich mal die prinzipiellen Unterschiede in der Bühnenabbildung dargestellt (ohne hintere MSW, mit hinteren MSW und den zwei Stellungen der Reflektoren - inkls. Vertauschen der Kanäle der hinteren MSW).

Nachtrag 12.07.2019:

Im Zuge der Beschäftigung mit Zielkurven ( http://www.audioclub.de/index.php/clubleben/angehoert/94-zielkurven ) ist mir aufgefallen, daß die Lokalisation offenbar auch von der Tonalen Balance abhängt.
Es ist möglich, durch Betonung oder Absenkung bestimmter Frequenzbereiche (z. B. mittels einer DRC-Zielkurve) z. B. einen Sänger in den Vorrdergrund zu "positionieren".
Das würde bedeuten, daß das Reflexionsbild eher auf die "Loslösung des Klangs von den Boxen" einen Einfluss hat (wie von Linkwitz bemerkt), als auf die Lokalisation bzw. Bühnentiefe an sich. Lokalisation bzw. Bühnentiefe wird natürlich besser, je losgelöster der Klang von den Boxen ist (weil dann ja die Informationen der Aufnahme vom Gehör besser analysiert werden).
Insofern kann es bei meinen vorherigen "Spielereien" durchaus zu sich gegenseitig beeinflussenden Effekten gekommen sein, deren Ursache ich bisher anders gedeutet habe.

Nachtrag 04.05.2020:

Folgend eine Grafik, die die prinzipielle Größenordnung der Reflexionen im Raum etwas veranschaulicht.
Es sind zwar nur die einige Reflexionen aufgeführt, und die Lautstärken sind nur anhand deren Entfernung zum Mikrofon ermittelt (also ohne evt. Abschwächung durch Reflexionsoberflächen o. ä.), aber sie vermittelt einen Eindruck von der Größenordnung des Einflusses von Reflexionen.

Die Höhe der einzelnen Balken in dem unteren Diagramm ist proportional zur Lautstärke des Direktschalls der Geige (80db) in der Form, daß bei -60db der Balken keine Höhe mehr hätte (entspricht der Annahme, daß Reflexionen die 20db leiser sind als der Direktschall nicht mehr gehört werden).

Die Darstellung veranschaulicht auch, wie groß der Anteil der Reflexionen am an den Ohren ankommenden Schall ist. Prinzipiell ist es ja egal ob der Schall an einem Mikrofon ankommt oder an einem Ohr.

Der darunter abgebildete reale Signalverlauf ist zwar zeitlich synchron, aber hier nur symbolhaft. Das soll nur verdeutlichen, das sich dieser Signalverlauf zu einem nicht unerheblichen Teil durch die Überlagerung des Direktschalls und all den vielen Reflexionen zusammensetzt... und die Reflexionen zudem zeitlich "versetzt". Man kann daran sehr schön sehen, daß anhand des Signalverlaufs kein direkter Bezug zum Schall eines der darin enthaltenen Instrumente getroffen werden kann - selbst Impulse im Direktschall eines der Insturmente können durch die zeitliche Überlagerung mit den Reflexionen im Summensignal "untergehen" (..das Gehör kann das aber durchaus hören!).

Die Informationen in diesem Dokument werden ohne Rücksicht auf einen eventuellen Patentschutz veröffentlicht. Warennamen werden ohne Gewährleistung der freien Verwendbarkeit benutzt.
Die Zusammenstellung von Texten und Abbildungen erfolgte mit größter Sorgfalt. Trotzdem können Fehler nicht vollständig ausgeschlossen werden.
Die Verwendung der Informationen und Angaben in diesem Dokument erfolgt auf eigenes Risiko des Benutzers.
Die Herausgeber und Verfasser können weder eine juristische Verantwortung noch irgendeine Haftung übernehmen.

Markennamen, Firmen- und Produktbezeichnungen die in diesem Dokument verwendet werden sind als eingetragene Markenzeichen geschützt.
Da es zum Zeitpunkt der Erstellung nicht immer möglich war zeitnah zu ermitteln, ob ein Markenschutz besteht, erfolgt die Nennung ohne Kennzeichnung mit ®, ©, ^TM.