Das Ambisonic Surround-Verfahren

Technische Hintergründe des 3D-Sounds

Anzeige

Bereits in den 70er-Jahren entwickelt, führt diese flexible Surround-Technik bisher ein Schattendasein.

Die ersten Versuche, bei der Klangreproduktion Richtungsinformationen einzubeziehen, reichen bis ins späte 19. Jahrhundert zurück, als man bei einer „Konzert-Live-Übertragung” mehrere Telefone entlang der Bühnenfront anordnete, die über Telefonleitungen mit derselben Anzahl von Empfängern verbunden waren. Die Klangqualität war natürlich entsprechend gering, aber ein Richtungseindruck verschiedener Klangquellen war eindeutig gegeben.

Anzeige

Anfang der 30er Jahre des letzten Jahrhunderts entwickelte das britische Forschergenie Allan Blumlein, der als Vater der Stereofonie gilt, eine als Blumlein-Stereo bekannte Mikrofonanordnung. Diese besteht aus zwei möglichst nah beieinander positionierten Mikrofonen mit Achter-Charakteristik, die im rechten Winkel zueinander angeordnet sind. Bei Wiedergabe über zwei Lautsprecher entsteht ein recht natürliches Klangbild mit etwas zu schmaler Basisbreite, jedoch ergeben sich zwei weitere Nachteile: Die Reproduktion tiefer Frequenzen nimmt mit der Entfernung zur Klangquelle ab. Zudem werden die rückwärtigen Schallereignisse nach vorne gespiegelt, was zu Phasenauslöschungen und einem zu hohen Raumanteil im Klangbild führt.

Die Erfindung von Mikrofonen mit Nierencharakteristik, die bald darauf verfügbar waren, verdrängte dieses Verfahren beinahe schlagartig. Bei einer anpassbaren Basisbreite durch Anordnung zweier solcher Mikrofone in einem Winkel zwischen 90° bis 120° werden die rückwärtig einfallenden Schallanteile genügend unterdrückt, um eine gute Wiedergabe über zwei Lautsprecher zu ermöglichen. Die rechtwinkligen Anordnungen von Achter- Charakteristiken, erweitert um eine Acht in vertikaler Richtung, spielen jedoch eine wichtige Rolle bei der Aufzeichnung von dreidimensionalen Ambisonic-Signalen.

Grundlagen

„Als Ambisonic bezeichnet man eine Methode zur Aufzeichnung einer dreidimensionalen Klangsphäre und die Reproduktion über bestimmte Lautsprecheranordnungen, sodass der Eindruck eines echten dreidimensionalen Klangraumes entsteht. Der Begriff ‚Eindruck’ wird hier verwendet, um die Tatsache zu verdeutlichen, dass zur exakten Reproduktion einer Klangsphäre von nur 2 Metern Durchmesser und einem Frequenzgang bis 20 kHz der Informationstheorie zufolge extrem viele Kanäle und Lautsprecher notwendig wären. Schätzungen variieren hier von 400.000 (!) an aufwärts. In der Praxis geht es darum zu entscheiden, wie viele Informationen man mittels einer sorgfältigen Mikrofonanordnung aufzeichnen kann, um dann einen Weg zu finden, dem Ohr eine kohärente Klangsphäre vorzugaukeln.”

Dieses Szenario, das Dave Malham in seinem 1998 erschienen Artikel „Spatial Hearing Mechanisms and Sound Reproduction” entwirft, wirkt zunächst desillusionierend. Das von dem 1996 verstorbenen Audio-Pionier Michael Gerzon in den 70er-Jahren entwickelte Ambisonic-Verfahren funktioniert jedoch in der Praxis recht gut und ist wiedergabeseitig zu praktisch allen Ausgabeformaten bis hinunter zu Mono kompatibel.

Vereinfachend wird bei Ambisonic angenommen, dass nur ebene Wellen auftreten und der Hörer sich genau im Mittelpunkt einer Sphäre befindet. Schallwellen werden als Summe von Kugelflächenfunktionen (Spherical Harmonics) dargestellt. Die so genannte Ordnung bestimmt die Genauigkeit der Kodierung und bedingt die Anzahl der benötigten B-Format-Kanäle, die im Quadrat mit der Ordnung ansteigt: N = (Ordnung + 1)2. Das B-Format bildet das Zentrum des Ambisonic- Encode/Decode-Verfahrens. Diese Gruppe von Audiosignalen kann mit entsprechenden Hard- oder Software-Decodern auf eine frei wählbare Lautsprecheranordnung abgebildet werden.

Ambisonic aufnehmen

Mit vergleichsweise geringem Aufwand lässt sich eine dreidimensionale Mikrofonanordnung realisieren, die eine gute Raumortung von Klangquellen in allen drei Dimensionen ermöglicht, ohne eine bestimmte Richtung zu bevorzugen. Dazu werden vier Mikrofone mit Nieren-Charakteristik in Form eines Tetraeders angeordnet. Wichtig hierbei ist, dass die Kapseln sich idealer Weise in einem Punkt befinden müssten, was sich näherungsweise nur durch eine spezielle Mikrofonkonstruktion erreichen lässt. Die von einem Ambisonic-Mikrofon erzeugten Signale werden als A-Format bezeichnet. Mittels einer geeigneten Matrizierung wird daraus das B-Format dekodiert. Das B-Format 1. Ordnung besteht aus einem omnidirektionalen Monosignal und drei Spherical-Harmonics:

  • W, Mono, omnidirektional
  • X, vorne – hinten, Achter-Charakteristik
  • Y, links – rechts, Achter-Charakteristik
  • Z, oben – unten, Achter-Charakteristik

Aufnahmen 1. Ordnung stellen zurzeit das technisch machbare dar. Mikrofone höherer Ordnung mit entsprechend präziserer räumlicher Auflösung befinden sich zurzeit noch in der Entwicklungsphase. Bei höheren Ordnungen weisen die Spherical Harmonics eine weitaus komplexere Charakteristik auf. Für ein B-Format 2. Ordnung müssten mittels einer geeigneten Kapselanordnung und Matrizierung bereits neun B-Format-Kanäle erzeugt werden.

Mischung und Wiedergabe

Bei der Positionierung der Lautsprecher einer Ambisonic-Anlage ist man nicht zwingend an die gleichmäßige Verteilung auf einer Sphäre gebunden. Entfernung, Winkel und Elevation der Lautsprecher sind bei der B-Format-Dekodierung Bestandteil der Berechnungen. Diese Tatsache ist besonders bei mobilen Wiedergabesystemen eine erhebliche Erleichterung. So lassen sich auch unter architektonischen Bedingungen, die eine symmetrische Anordnung der Lautsprecher nicht zulassen, gute Ergebnisse erzielen.

Gerade auf dem Markt: das portable Soundfield-Mikrofon ST-350 mit zugehörigem B-Format-Konverter

Ein weiterer Vorteil von B-Format gegenüber anderen Surround-Formaten ist die Unabhängigkeit von der Anzahl der zur Reproduktion verwendeten Wiedergabekanäle. Wird eine Surround-Produktion im B-Format gemastert, ist nur eine entsprechende Dekodierung notwendig, um zukünftige Formate wie etwa 10.2 zu bedienen. Höhere Ordnungen lassen sich synthetisch berechnen, indem die Signale mit den Funktionswerten von Kugelflächenfunktionen höherer Ordnung multipliziert werden. Dabei ist auch bei höheren Ordnungen die Anzahl der benötigten B-Format-Kanäle meist geringer als die der verwendeten Ausgabekanäle, was Speicherplatz spart.

Tatsächlich sind die heute verbreiteten Surround- Anlagen zumeist nur in horizontaler Ebene ausgerichtet, sozusagen im Flächenland. Verzichtet man also auf die Informationen der vertikalen Achse, reduziert sich die benötigte B-Format-Kanalanzahl bei 2. Ordnung beispielsweise von neun auf fünf. Die Abwärtskompatibilität zu verschiedenen Wiedergabemedien wird durch die UHJ-Hierarchie geregelt. Diese Matrizierung ins C-Format ist durch die Anzahl der vorhandenen Übertragungskanäle (2, 2.5, 3 und 4) strukturiert und macht – einen entsprechenden Decoder vorausgesetzt – auch mit nur zwei physikalischen Übertragungskanälen horizontal-räumliche Abbildung möglich. Dabei ist die Kompatibilität zu Stereo oder Mono durch die systemeigene Phasenkohärenz wesentlich besser als bei Surround-Aufnahmen mit räumlich verteilten Mikrofonen.

B-Format-Signal 1. Ordnung

Ambisonic-Mikrofone

Die Firma Soundfield bietet mit den Modellen ST250 und ST350 zwei Mikrofonsysteme samt Konvertern an, die eine entsprechende Kapselanordnung auf kleinstmöglichem Raum haben. Diese zurzeit einzigen kommerziell erhältlichen Ambisonic-Mikrofonsysteme können mit Hardware- Konvertern wie dem SP-451 Surround- Sound-Processor direkt ein B-Format, Stereo- und 5.1-Signale mit variabler Basisbreite, Front-Location und Focus erzeugen. Die Preisregion, in der sich die Anschaffung eines solchen Soundfield-Systems bewegt, dürfte einer der Gründe sein, warum sich experimentierfreudige Zeitgenossen an den Selbstbau wagen. Für etwa 1000 Euro entwickelte Etienne Deleflie ein Ambisonic-Mikrofon auf der Basis von zwei paarweise abgeglichenen Mikrofon- Sätzen Røde NT5. Deren Kapseln sind mittels eines präzisionsgefertigten Aluminiumadapters im Tetraeder angeordnet. Es geht auch noch wesentlich günstiger, wie der ebenfalls in Australien beheimatete Musiker Nick Mariette beweist. Sein portables Ambisonic-Mikro lässt sich schon für ca. 180 Euro realisieren.

Die UHJ-Hierachie zeigt die Kompatibilität zu verschiedenen Übertragungssystemen

Kodierungs-Werkzeuge

Für die Aufbereitung von B-Format gibt es eine Reihe von VST-Plug-ins für Mac und PC, von denen viele auch unter Public-License oder als Freeware erhältlich sind. Eine umfangreiche Sammlung von Ambisonic- Tools findet man bei www.gerzonic.net. Neben den frei verfügbaren Plug-ins bPlayer, bPlayer_basic, bRec16, bRec32, Emigrator und Panorama ist der B-Format-Decoder DecoPro das zurzeit leistungsfähigste Plugin zur Konvertierung von B-Format auf beliebige Lautsprecheranordnungen. Mit Deco- Pro lässt sich B-Format bis 2. Ordnung auf bis zu 16 frei positionierbare Speaker abbilden. Da kann das beinah zehnmal so teure Decoder-Plug-in Surround-Zone von Soundfield nicht mithalten, es ist vor allem auf die Konvertierung von Aufnahmen mit den hauseigenen Mikrofonen zugeschnitten und bedient gängige Standard-Surroundformate mit bis zu acht Kanälen, wobei sich Elevation, Vorne-Ausrichtung, Mikrofoncharakteristik und Basisbreiten einstellen lassen. Als kompaktes Freeware-Programm sei hier „Visual Virtual Microphone” von David McGriffy empfohlen. Das für PC und Mac OS X erhältliche VST-Plug-in erleichtert durch eine überschaubare Anzahl an Parametern und anschauliche grafische Darstellung der resultierenden Richtcharakteristiken den Einstieg in die Welt ambisonischer Klangsphären.

Max/MSP-Anwender wird es freuen, dass die von Philippe Kocher und Jan Schacher für das ICST (Institute for Computer Music and Sound Technology der Hochschule Musik und Theater Zürich) entwickelte Sammlung von Ambisonic-Externals, mit deren Hilfe man sich das eigene Ambisonic-Setup maßschneidern kann, demnächst über die ICST-Homepage verfügbar sein werden. Neben Encodern mit einer beliebigen Anzahl von Eingängen und Decodern bis zu 3. Ordnung, die auf beliebig viele Lautsprecher in freier Anordnung konvertieren, finden sich Tools zur Positionierung von Klangquellen im Raum, die auch Funktionen zur automatischen Bewegungsanimation beinhalten. Über ein Monitorfenster können Position, Bewegung, Koordinaten und Werte visualisiert und beeinflusst werden.

Mit diesen Mitteln kann man bereits mit bescheidenem Aufwand ambisonieren, d. h. das Encodieren und Decodieren in Echtzeit für etliche Klangquellen läuft auf einem einzelnen Computer (bzw. Laptop) und lässt immer noch genügend Leistung für die Klangbearbeitung übrig. Linux-User können die Open-Source-Software Almus-VCU verwenden, die einen Computer mit Multi-Channel-Soundcard in einen vielseitigen Realtime-Convolver verwandelt, der auch Ambisonic beherrscht.

Die von Philippe Kocher und Jan Schacher entwickelten Max/MSP Externals

Ambisonic in der Praxis

Das Forum Neues Musiktheater der Staatsoper Stuttgart hat sich nicht nur durch wegweisende intermediale Musikaufführungen einen Namen gemacht, sondern veranstaltet bereits seit einigen Jahren viel beachtete Workshops und Symposien zu Themen elektronischer Medienkunst-Gestaltung und Surround- Akustik. Anfang dieses Jahres hatte man das Team des ICST eingeladen, um in einem Workshop Grundlagen und Ansätze ambisonischer Klanggestaltung vorzustellen. Das erst vor einem Jahr gegründete Institut widmet sich, neben anderen Themen der systematischen Musikwissenschaft und Klangtechnologie, intensiv der Forschung auf dem Gebiet ambisonischer Anwendungen. Im Rahmen der Veranstaltung wurden in Vorträgen, Workshops und einem Konzert alle Aspekte dieses flexiblen Surround-Konzepts erfahrbar gemacht.

Im ersten Vortrag erörterte Jürgen Strauss die geschichtliche Entwicklung in der Wahrnehmung und Nutzung des Zusammenspiels von Klang und Raum. Zur Zeit des Barock bereits bekannt und angewendet, trat dieses Wissen später wieder in den Hintergrund und wurde erst Ende des 19. Jahrhunderts beim Bau von Konzerthäusern wieder aufgegriffen. Martin Neukom führte in die theoretischen Grundlagen des Themas ein und erörterte die damit verbundenen Vorteile, Probleme und ihre Lösungen. So etwa geben systembedingt manche Lautsprecher phasengedrehte Signale mit niedrigem Pegel ab, wenn sich eine Klangquelle zwischen zwei Lautsprechern befindet. Da an der Erzeugung eines ambisonischen Klangraumes immer alle Lautsprecher beteiligt sind, addieren sich alle Signale im Zentrum zwar zu einer kohärenten Klangsphäre, sitzt man jedoch näher an einem der Lautsprecher, kann es zu Störungen im Klangbild kommen.

HyperSphere mischt direkt B-Format-Material

Um dem entgegen zu wirken, werden vor der Dekodierung die Ordnungen im Pegel durch einen Faktor gewichtet. Das beseitigt dieses Phänomen, verringert jedoch die Ortungsschärfe. In den Workshop-Phasen diskutierte Johannes Schütt ästhetische und kompositorische Ansätze im Umgang mit Ambisonic, führte in die Anwendung von Encoder- und Decoder- Plug-ins ein und stellte das zurzeit noch in der Entwicklung befindliches Programm Hyper-Sphere vor, das die direkte Mischung von B-Format-Material ermöglichen wird. Philippe Kocher, Software-Entwickler und Max/MSP-Experte, erläuterte Funktion und Anwendung einer Reihe von leistungsfähigen Max/MSP Externals, die am ICST entwickelt wurden und auch für den Betrieb der mobilen Ambisonic-Anlage eingesetzt werden.

State-of-the-Art Ambisonic

Man war jedoch nicht nur mit trockener Theorie im Gepäck angereist, sondern hatte eine Ambisonic-Aufführungsinstallation aufgebaut, die wohl auch hart gesottenen Gear- Freaks Tränen in die Augen treibt. Da sich der Aufwand für den Auf- und Abbau einer leistungsfähigen Anlage für Ambisonic 3. Ordnung aus Standardkomponenten ebenfalls in höheren Ordnungen bewegt, entschloss man sich nach einigen Aufführungen, Nägel mit Köpfen zu machen. Mit der bekannten Schweizer Präzision wurde eine portable Anlage entworfen und gebaut, die extrem flexibel und leistungsfähig ist und gleichzeitig mit minimalem Aufwand installiert werden kann.

15 Genelec 8050A, in drei Ringen zu je fünf Lautsprechern angeordnet und gestützt von zwei Subwoofern, sorgen für die akustische Umsetzung der auf einen Nebenraum ausgelagerten Berechnungen. Hier steht, in drei großen Racks untergebracht, das Herz der Anlage.

Gleich vier fernsteuerbare G5 DP Power- Macs stellen ihre geballte Rechenkraft zur Verfügung, um auch aufwändigsten Anforderungen gerecht zu werden. Nur einer dieser Rechner ist für festgelegte Aufgaben vorgesehen, die allesamt in Max/MSP realisiert sind. Er steuert ein 16-Spur-Abspielsystem für Audiomaterial im B-Format und übernimmt die Ambisonic-Dekodierung. Um auch traditionelle mehrkanalige Formate wiedergeben zu können, ist es möglich den Decoder zu überbrücken und die Lautsprecher direkt anzusteuern. Die anderen Rechner stehen für Enkodierung und künstlerische Aufgaben bzw. als Backup-Systeme bereit. Ein weiterer Mac-Mini ist nur für das MIDI-Routing des mit vier MOTU TimepieceAV üppig bemessenen Systems zuständig. Der einzige PC an Bord muss sich lediglich um die Steuerung eines Yamaha DME64N Digitalmischers kümmern.

Die digitale Signalverteilung der 720 (!) 24-Bit-Audiokanäle übernimmt eine Friend-Chip DMX64 Kreuzschienen-Matrix, für eine stabile System-Clock sorgt ein Rosendahl Word-Clock Server. Die Verbindungen zum Aufführungsraum sind über speziell angefertigte Glasfaser-Sende- und Empfangseinheiten ausgeführt, die 64 Audiokanäle sowie MIDI-Steuerdaten übertragen. Zwei identische I/O-Hubs dienen als Schnittstellen im Aufführungsraum. Im Allgemeinen wird einer der in kompakten Racks untergebrachten Hubs in Bühnennähe eingesetzt, der andere bei der zentralen Klangregie. Die Hubs enthalten Audio-Ein- und Ausgänge, fernsteuerbare Mikrofonvorverstärker, A/D-Wandler sowie MIDI-I/Os und Anschlüsse zur Fernsteuerung der Backstage-Rechner über KVM-Extender (Keyboard-, Video-, Maus-Verlängerungen).

Die Lautsprecher sind ebenfalls über Hubs mit der Backstage-Zentrale verbunden. Zwei Glasfaserleitungen, zwischen denen im Falle einer Störung automatisch umgeschaltet wird, gewähren eine redundante Versorgung. Über 24-Bit-D/A-Wandler und VCA können pro Einheit acht aktive Lautsprecher betrieben werden, die von den Hubs auch mit Strom versorgt sind. Die insgesamt acht Hubs können in Serie oder sternförmig verbunden werden und bis zu 64 Lautsprecher ließen sich so maximal betreiben. Peter Färber zur Lautsprecherkonfiguration: „Die Anordnung von Stuttgart mit 15 Lautsprechern konnten wir nur so machen, weil wir Hängepunkte an der Decke hatten. Wenn es keine Möglichkeit zum Hängen von Lautsprechern gibt, nehmen wir 2 × 8 Lautsprecher in zwei übereinanderliegenden Kreisen. Bei einem sehr großen Saal wie dem Kunst- und Kongresszentrum Luzern hatten wir auch schon 40 Lautsprecher im Einsatz.” Die zentrale Steuerung aller Komponenten vom Regieplatz aus geschieht über fünf in speziellen Racks untergebrachten Touchscreen- Displays, samt Tastatur, Maus und Faderboxen.

Da die Position der Lautsprecher für die Dekodierung bekannt sein muss, wurde auch hier für eine praktische Lösung gesorgt. Ein kleines Programm errechnet nach Eingabe von Länge und Breite des Raumes und der Anzahl der Lautsprecher deren optimale Position. Da bauliche Gegebenheiten die vorgeschlagene Positionierung zuweilen nicht zulassen, wird zusätzlich ein Gerät eingesetzt, das sonst eher in der Geodäsie zum Einsatz kommt. Hierzu Peter Färber, der als technischer Leiter die Ambisonic-Anlage gestaltet hat und betreut: „Da haben wir schon manch ungläubigen Blick geerntet, wenn wir schließlich unseren Theodoliten aufgebaut haben, um die genaue Position der Lautsprecher auszumessen”. Das Gerät übermittelt seine Daten über USB an den Rechner, der die Decoder-Software entsprechend kalibriert.

Raumklang

Bereits die hauseigenen Aktiv-Boxen in den Seminarräumen des Forums Neues Musiktheater, die als horizontale Ambisonic-Wiedergabesysteme mit acht bzw. vier Lautsprechern konfiguriert waren, vermitteln eindrucksvoll die Qualität der ambisonischen Abbildung. Schon mit nur vier Lautsprechern sind homogene Klangbilder und Panoramafahrten ohne „Löcher” zwischen den Lautsprechern möglich.

Die im Forum-Saal aufgebaute 15-kanalige Anlage öffnet dann eine dritte Dimension, in die man sich erst ein wenig einhören muss. Anders als bei horizontaler Musikwiedergabe, die ja auch eine gewisse durch den Raum bedingte vertikale Komponente haben kann, entsteht hier eine Klangkuppel, die eine ungewohnte räumliche Ortbarkeit von Klangquellen ermöglicht. Eindrucksvoll, die Wiedergabe der Soundfield-Aufnahme einer Bahnhofshalle mit Treppenaufgängen zu den Zügen. Der Raumeindruck ist auch außerhalb des recht großen Sweet-Spots sehr deutlich, selbst jenseits der Lautsprecherkreise kann man quasi von außen in die Sphäre hineinhören.

Peter Färber am Regietisch der ICST-Anlage im Forum Neues Musiktheater

Bei musikalischen Anwendungen wird deutlich, dass die hinzugewonnene räumliche Ausdehnung kompositorisch genutzt sein will, damit Positionen und Bewegungen von Klangquellen sinnvoll zusammenwirken. Bei einer Live-Aufführung im ambisonischen Raum macht es wenig Sinn, direkt erzeugte Instrumentalklänge zusätzlich zu verorten. Wesentlich spannender ist hier das Zusammenwirken zwischen den live gespielten, räumlich klar dem Musiker zuzuordnenden Klängen und anderen Sound-Elementen wie z. B. bei Gary Bergers Komposition „Dauerwelle” für Gitarre und ambisonisches Tonband (2006), bei der Instrument und aufgezeichnete Klänge eine spannende dynamische Wechselbeziehung eingingen. Wer selbst einmal in den Genuss dieser einzigartigen Ambisonic-Anlagen kommen möchte, hat hier die Gelegenheit dazu:

  • 7.Weimarer Frühjahrstage für zeitgenössische Musik, 19. – 23. April 2006, Konzerte am 21. und 22. April abends, Workshop am 22. April 2006 vormittags. http://www.via-nova-ev.de
  • Festival „Sythèse” in Bourges (FR), 2. – 11. Juni 2006, Konzert am 7. Juni. http://www.imeb.net

Fazit

Bei den vielen Vorteilen, die das Ambisonic-Verfahren bietet, fragt man sich, warum diese seit immerhin 30 Jahren bekannte Surround- Technik so wenig verbreitet ist und nur von wenigen Eingeweihten angewendet wird. Ein Grund ist sicher die mangelnde Qualität und geringe Marktakzeptanz der ebenfalls in den siebziger Jahren aufgekommenen Quadrofonie. Die meisten Hersteller waren daraufhin nicht bereit in ein weiteres Raumklangformat zu investieren. Das schließlich doch Surround-Systeme Einzug in die Wohnzimmer gehalten haben, verdanken wir dann eher der Verbreitung von Heimkino-Anlagen, die Dolby AC-3-Kodierung zum Standard werden ließ. Durch die heute zugänglichen technischen Möglichkeiten hat zum Glück jeder die Möglichkeit, die diversen Vorteile des B-Formats zu nutzen und dabei die Kompatibilität zu bestehenden oder künftigen Ausgabeformaten zu bewahren.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.