Das vom Institut für Rundfunktechnik (IRT) aus München entwickelte Verfahren „Binaural Sky“ bietet dreidimensionale Audio-Wiedergaben über ein leicht zu installierendes Lautsprecher-Array.
Bei der Wellenfeldsynthese, eines der bekanntesten und aufwändigsten binauralen Wiedergabesysteme, kommt ein Lautsprecher- Array zum Einsatz, das um den Hörer herum aufgebaut ist. Aber gerade in Betriebsräumen oder bei beengten Platzverhältnissen, wie im Ü-Wagen oder auch im heimischen Wohnzimmer, ist eine solche Aufstellung kaum zu realisieren. Diesem Problem haben sich Forscher am Institut für Rundfunktechnik angenommen, die im Bereich Wellenfeldsynthese und binauralen Verfahren über Jahre viel Erfahrung gesammelt haben.
Anzeige
Bereits Ende der 90er-Jahre entwickelte das IRT das BRS (Binaural Room Synthesis), ein System für die Kopfhörerwiedergabe, welches auf Basis von gemessenen oder synthetisierten binauralen Raumimpulsantworten einen beliebigen realen (Mehrkanal-)Abhörraum virtuell darstellt und ein perfektes Erlebnis der Surround Sound Lautsprecher- Wiedergabe auch unter akustisch ungünstigen Abhörbedingungen erlaubt. Der nächste Schritt lag also auf der Hand, nämlich ein System für die Lautsprecherwiedergabe zu entwickeln.
Konzept und Technik
Der normale Weg, um binaurale Signale über Lautsprecher wiederzugeben, ist das so genannte transaurale Stereo, bei dem das unerwünschte Übersprechen zwischen Lautsprechern und den Ohren unterdrückt wird. Dies erfolgt mit so genannten „Crosstalk Cancelation Filters” (XTC). Nun ist es aber so, dass bei einer Kopfbewegung des Zuhörers die XTC-Filter entsprechend angepasst werden müssen, um die kopfbezogenen Übertragungsfunktionen (engl.: Head Related Transfer Function, Abk. HRTF) hinreichend genau kompensieren zu können.Theoretisch müsste man die Transaural-Lautsprecher mit dem Kopf mitdrehen, um die problematische Nachsteuerung der XTC-Filter zu umgehen (s. a. Abb. 1). Dies gestaltet sich natürlich in der Praxis als undurchführbar. Der im IRT gewählte Lösungsansatz basiert auf der Wellenfeldsynthese (WFS), mit der sich virtuelle Punktschallquellen generieren lassen. Die im Raum einfach zu bewegenden fokussierten Quellen ersetzen die normalen Transaural- Lautsprecher. Der Schall wird direkt vor den Ohren konzentriert, sodass ein „virtueller Kopfhörer” entsteht (s. a. Abb. 2).
Da die Ausrichtung des Kopfes mit Hilfe eines Headtracking-Systems dynamisch ausgewertet und davon abhängig das passende WFS-Renderingfilter verwendet wird, halten die fokussierten Quellen auch bei Kopfbewegungen immer eine stabile Position an den Ohren des Hörers ein. Bekannte Probleme der binauralen Wiedergabe über Lautsprecher lassen sich auf diesem Wege lösen. Die Technik ermöglicht die Synthese eines Mehrkanal-Abhörraumes mit Hilfe des BRS-Verfahrens, ohne dass Kopfhörer getragen werden müssen. Der Hörer lokalisiert die virtuellen Lautsprecher bezüglich Richtung und Entfernung korrekt in der Horizontalebene und dank der Headtracking-Steuerung unabhängig von der Kopfausrichtung.
Das Erzeugen der fokussierten Quellen erfolgt über ein WFS-Lautsprecher-Array, welches über dem Hörer angeordnet ist. Anstelle eines linearen Arrays kommt ein zirkulares Array zur Anwendung. Das realisierte Array befindet sich 40 Zentimeter über dem Kopf und besteht aus 22 Breitbandlautsprechern mit acht Zentimeter Durchmesser, die im Kreis angeordnet sind. Für die Wiedergabe tiefer Frequenzen unter 120 Hz ist ein Lautsprecher mit 20 Zentimeter Durchmesser in der Mitte angeordnet, der als Subwoofer fungiert. Der Vorteil der Anordnung liegt auf der Hand: Sie lässt sich sehr leicht unterbringen. Selbst das Prädikat „wohnzimmertauglich” könnte man dem Verfahren bedenkenlos verleihen.
Audio-Processing
Zurzeit wird das Signal-Processing auf einem Linux-Rechner durchgeführt, der mit einer RME-Hammerfall-Audiokarte ausgestattet ist. Die Signalverarbeitung erfolgt in drei Blöcken. Zunächst wird eine Binaural Room Synthesis unter Berücksichtigung der Kopfausrichtung vorgenommen. Dabei fließen ausschließlich Azimuth-Informationen ein, also ohne Berücksichtigung der Kopfneigung. Das binaurale Ausgangssignal könnte in diesem Stadium theoretisch mit einem Kopfhörer abgehört werden. Es folgt eine Stufe mit den XTC-Filtern und dann die Renderingfilter der Wellenfeldsynthese, welche – ebenfalls unter Berücksichtigung der Kopfausrichtung – die 23 Signale für die Ansteuerung der Lautsprecher errechnen.
Praxis
Ich konnte mich auf dem Internationalen VDT-Symposium „5.1 Surround – Aesthetics and Tools” im November letzten Jahres von dem System selbst überzeugen und muss sagen, dass ich stark beeindruckt war. Es ist eine kleine Sensation, dass Lautsprecher, die sich über dem Hörer befinden, tatsächlich nicht lokalisiert, stattdessen aber die virtuellen Lautsprecher-Anordnungen stabil im Raum, in Ohrhöhe und in gebührendem Abstand wahrgenommen werden. Dies bedeutet in der internationalen Fachwelt ein bemerkenswertes Ergebnis.
Entscheidende Bedeutung fällt natürlich der Klangbeurteilung des Systems zu. Das XTC-Filter stellt in diesem Zusammenhang einen zentralen Punkt in der Leistungsfähigkeit des Systems dar. Die idealen Übertragungsfunktionen sind die inversen HRTFs für beide Außenohren, welche die Wirkung der eigenen Ohren vollständig aufheben und dadurch eine korrekte Reproduktion der „fremden” binauralen (BRS-)Signale gewährleisten. Dies gelingt auch bis zu 7 kHz sehr gut. Die XTC-Transferfunktionen unterdrücken das Übersprechen in diesem Frequenzbereich um 20 dB. Zurzeit wird lediglich die Kopfrotation im Sweet Spot bei der Berechnung berücksichtigt, nicht die Kopfposition. Kopfbewegungen außerhalb des Sweet Spots verursachen wahrnehmbare Filterungsfehler. Das Audio wird deshalb stumm geschaltet, wenn der Hörer sich außerhalb dieses Sweet Spots bewegt, denn er ist ohne Positions-Headtracking lediglich zehn Zentimeter groß.
Überprüft wurde u. a. die Lokalisation von virtuellen Schallquellen im Azimuth (Richtung in der horizontalen Ebene) und der Elevation (Erhebungswinkel). Es hat sich gezeigt, dass die Abbildung im Azimuth sehr gut funktioniert. Bei der Elevation ergab sich ebenfalls eine gute Übereinstimmung, aber mit größeren Abweichungen (bis zu zehn Grad), ähnlich wie bei der gewöhnlichen BRS-Kopfhörerwiedergabe. In einer weiteren Untersuchung wurden Klangverfärbungen in Abhängigkeit von der Position der Schallquellen überprüft. Auch hier hat man ähnliche Ergebnisse wie bei einer Kopfhörerwiedergabe gefunden. Der „virtuelle Kopfhörer” beeinträchtigt das Ergebnis kaum wahrnehmbar. Der Einfluss ist sogar deutlich kleiner als der, der von Unterschieden individueller Lautsprecher verursacht wird.
Interview mit Helmut Wittek und Günther Theile
Die Entwickler des patentierten Systems, Helmut Wittek (ehemals IRT, nun Schoeps) und Dr. Günther Theile (IRT, Leitung Sachgebiet Audiosystemtechnik) sind seit längerer Zeit maßgeblich an der WFS-Forschung beteiligt. Sie konzentrierten sich dabei im Wesentlichen auf künstlerisch- ästhetische Aspekte der Wellenfeldsynthese und brachten mit ihren praktisch orientierten Veröffentlichungen die WFS vor allem den Tonmeistern nahe. Die Implementierung des Prototyps des Binaural Sky realisierte Daniel Menzel, Student an der TU München.
Arbeitet man noch an den Beschränkungen des Systems wie Hören außerhalb des Sweet Spots und den Betrieb mit mehreren Hörern?
H.Wittek: Ja, am IRT ist man dabei, das bestehende Prototyp-System weiter zu entwickeln. Man darf nicht vergessen, dass es ja in kürzester Zeit entstanden ist, um die generelle Funktion praktisch zu überprüfen und zu demonstrieren. Es gibt einige Punkte, die wir in unseren ersten praktischen Versuchen gelernt haben und die schon im Laufe dieses Jahres in unseren nächsten Prototyp eingebaut werden sollen. Hier wird es kleine Veränderungen in der Hardware und der Geometrie sowie der Headtracker- Behandlung geben.Wir erwarten dadurch z. B. die Vergrößerung des Sweet Spots und eine Verbesserung in der Klangfarbe. Auch der Betrieb mit zwei nebeneinander sitzenden Hören wird im IRT Gegenstand der kommenden Untersuchungen sein.
Wann wird die Marktreife des Binaural Sky avisiert? Gibt es schon Partner?
G.Theile: Das Konzept des Binaural Sky ist im Prinzip erfolgreich nachgewiesen und kann somit für unterschiedliche Anwendungen optimiert und implementiert werden. Ein wichtiger nächster Schritt ist die praxisgerechte Erweiterung der Hörzone. Bei der ersten Vorstellung beim VDT-Symposium in Hohenkammer fanden wir großes Interesse, und es gab viel versprechende Reaktionen und Ideen. Selbstverständlich arbeiten wir mit Partnern zusammen, die mit uns spezielle Anwendungen avisieren wollen. Interessenten sind jederzeit zu einer Demo ins IRT eingeladen.
Ist eine Integration in einem Prozessor angedacht, oder wird es ein PC-gestütztes System bleiben?
H.Wittek: Nun, das hängt auch wieder von der Anwendung ab. Unser Prototyp-System sollte einfach, schnell, flexibel und kostengünstig implementiert werden. Deshalb kam nur die PC-Lösung in Frage. Hat man eine spezielle Anwendung im Sinn, ist eine Prozessor-Lösung nicht mehr so schwer herzustellen. Das wäre etwas, was ein potenzieller Industrie-Partner übernehmen könnte.
Sind auch Konsumer-Anwendungen angedacht, und welche Bedeutung spielt die Mehrkanalwiedergabe über Binaural Sky? Welche ersten Anwendungen neben dem professionellen Einsatzbereich „virtueller Abhörraum“ verfolgen Sie zunächst?
G.Theile: Wir denken im Augenblick stark über das Thema „Hören im Auto” nach. Man braucht ja für den Binaural Sky über dem Hörer ein Dach oder eine Decke, an der die Lautsprecher installiert werden können. Sie wäre im Auto vorhanden. Auch bewegt sich der Fahrzeuginsasse kaum weit aus dem Sweet Spot heraus, eine weitere günstige Randbedingung. Hochwertige Surround-Wiedergabe wäre im Auto ohne aufwändige Lautsprecherinstallationen möglich. Aber auch zu Hause ist das Hören ohne störende Lautsprecherboxen interessant. Allgemein kann die Möglichkeit der virtuellen räumlichen Anordnung beliebiger Schallquellen hohen Mehrwert bringen, für Kommunikations- oder Navigationssysteme ebenso wie im Bereich Computerspiel. Eine besonders interessante Anwendung ist der Einsatz des virtuellen Kopfhörers als Hörhilfe für Schwerhörige. Wir gehen davon aus, dass die Headtracking-Technologie sehr schnell Fortschritte macht und der Kostenfaktor dafür schon bald wesentlich kleiner sein wird. Unsere neuesten Ergebnisse werden wir natürlich während der 24. Tonmeistertagung im November 2006 in Leipzig vorstellen.
Wo sehen Sie sonstige Anwendungsbereiche des Binaural Sky?
H.Wittek: Das Thema „Augmented Reality”, also „aufgesetzte Realität”, wird in der Zukunft eine große Rolle spielen. Der Vorteil des Binaural Sky liegt darin, dass gleichzeitig echte und virtuelle Schallquellen vorhanden sein und sogar verknüpft werden können. Ein Beispiel dafür sind vielleicht Flugsimulatoren: Die virtuellen Geräusche der Turbinen überdecken sich mit den echten Geräuschen und Signalen im Cockpit, die bei Bedarf noch beliebige räumliche Bearbeitung oder Verzerrung in Echtzeit erfahren können. Der Fantasie sind hier keine Grenzen gesetzt, und die Zukunft wird uns sicher zeigen, was hier für Anforderungen entstehen. Es gibt aber noch eine Reihe von ganz anderen Anwendungen, bei der Kopfhörerwiedergabe einfach nicht möglich ist, aber dennoch räumliche Wiedergabe höchster Qualität benötigt wird, z. B. die Hörgeräteanpassung. Man sieht, hier öffnet sich vielleicht ein weites Feld, das wir noch gar nicht übersehen können.
Fazit
Als Fazit ist zu sagen, dass die Qualität von Binaural Sky der Kopfhörer-gestützten BRS-Wiedergabe sehr nahe kommt. Das System eignet sich z. B. für die Wiedergabe von Mehrkanalton bei Konsumenten oder auch für den professionellen Einsatz in technischen Umgebungen und Räumen, wie im Ü-Wagen, bzw. für den Einsatz in Museen oder anderen Festinstallationen. Ein Manko für die Praxis bildet zurzeit noch die Beschränkung der Wiedergabe auf den Sweet-Spot-Bereich und darauf, dass nur ein Hörer den 3D-Sound genießen kann. Aber Produktreife war natürlich in dieser Entwicklungsphase noch nicht angestrebt. Vielmehr ging es um den prinzipiellen Nachweis, dass mit Hilfe von WFS-generierten fokussierten Quellen an den Ohren des Hörers ein virtueller Kopfhörer generiert werden kann, der hochwertige BRS-Wiedergabe erlaubt. Vermutlich können kommerzielle Anwendungen schon bald erwartet werden.