Das InfoTip Kompendium

Ein kostenloser Service der InfoTip Service GmbH

Zum Anfang der
Seite scrollen

Surround Sound und 3D-Audio

Inhaltsverzeichnis

1. Die Anfänge

Schon in der Zeit des guten, alten Dampfradios versuchte man den Grammophonen und Radioempfängern eine hohe Klangfülle abzuringen. Als in den 1950er 3D-Filme unzählige Zuschauer in die Kinos lockten, schwappte die 3D-Welle auch auf den Audiobereich über. Da der Stereo-Rundfunk noch nicht erfunden war und selbst die Schallplatte nur einen Tonkanal hatte, versuchte man bei Radios (an die man auch Schallplattenspieler anschließen konnte) mit mehreren Lautsprechern, die seitlich in den Geräten angebracht waren, das Volumen zu erhöhen. Getrennte Hoch- und Tieftonlautsprecher optimierten den Klang. Manche Geräte waren sogar mit einer "3D"- oder "Orchester"-Taste ausgestattet. Mit dem Drücken dieser Taste wurden die Lautsprecher gegenphasig betrieben um eine Art Basisbreite zu erzielen.

Abb. 1.01: Nordmende Tannhäuser 3D mit Klangregister
Abb. 1.01: Nordmende Tannhäuser 3D mit Klangregister von 1956 [1]

Diese Art von Raumklang kann natürlich nicht mit den modernen, objektbasierten Audioverfahren wie Dolby Atmos oder IOSONO® verglichen werden. Aber auf dem Weg dahin war dies einer der ersten Schritte.

Praktisch alle Neu- und Weiterentwicklungen von Audiosystemen fanden zuerst in Kinos Anwendung. Erst mit Verzögerung gelangten sie, in abgespeckten Varianten, in die Wohnzimmer von Konsumenten. Daher sollen die Systeme im Folgenden zuerst immer an der Kinovariante beschrieben werden.

Abb. 1.02: Lokalisationsschärfe bei Mono.
Es gibt keinen "Sweet Spot". Es kann nur eine Richtung "Vorne" lokalisiert werden
Stereophonie

Etwa 1958 erschienen die ersten Zweikanalstereo-Verstärker und Stereoschallplatten in den Regalen der Geschäfte. Ab 1963 wurden die UKW-Rundfunksender auf Multiplex-Stereofonie umgestellt. Etwa zur gleichen Zeit wurde die berühmte DIN 45500 geschaffen, die Ordnung in die gerade in Aufbruch begriffene Welt des High Fidelity (oder kurz HiFi) bringen sollte. Bis zu ihrer Ablösung durch die EU-Norm EN 61305 entzweite die DIN 45500 sowohl das Lager der HiFi-Enthusiasten als auch das der Hersteller von HiFi-Equipment.

Abb. 1.03: Lokalisationsschärfe bei Stereo.
Abb. 1.03: Lokalisationsschärfe bei Stereo.

Es gibt einen "Sweet Spot", der im Bereich des Stereodreiecks befindet (gelbe Sitze). Es können die Richtungen "Vorne" und "Rechts/Links" lokalisiert werden. Bei großen Basisbreiten kann in der Mitte ein "Loch" wahrgenommen werden.

Quadrophonie

Kurz und heiß brannte in den 1970er-Jahren das Phänomen der Quadrophonie. Ausgegangen wurde davon, dass über die Bildung von Phantomschallquellen mittels Panpots über vier separate Kanäle hinweg, ein wirklichkeitsnaher Raumklang erzeugt werden kann. Dieser Effekt tritt in der Realität aber nur in engen Grenzen statt. Aufgrund der Physiologie des menschlichen Hörens können nur vor dem Hörer liegende Phantomschallquellen erkannt und präzise lokalisiert werden. Schon ein leichtes Drehen des Kopfes lässt die Richtungsempfindung verwischen.
Weitere Hindernisse bei der Einführung der Quadrophonie war die Systemvielfalt. Die Schallplattenhersteller konnten (oder wollten) sich nicht auf ein Kodiersystem einigen, so gab es mindestens vier miteinander konkurrierende Quadrophonieverfahren. Alle benötigten, zu den zusätzlichen Verstärkern und Lautsprechern hinzu, noch weitere teure Hardware. Manche benötigten sogar speziell geschliffene Tonabnehmernadeln um die systembedingten zusätzlichen hohen Frequenzen von den Schallplatten (natürlich spezielle Quadrophonie-Editionen) aufnehmen zu können.

Abb. 1.04: Lokalisationsschärfe bei Quadrophonie.
Abb. 1.04: Lokalisationsschärfe bei Quadrophonie.

Es gibt einen "Sweet Spot", der im Bereich der sich in der Mitte der Lautsprecher befindet. Es können die Richtungen "Vorne" und "Rechts / Links" präzise lokalisiert werden. Seitliche und hintere Phantomschallquellen können nur unscharf wahrgenommen werden. Zwischen den Lautsprechern können "Löcher" entstehen.

Die Gründe, weshalb die Quadrophonie zum Flopp wurde, sind vielschichtig. Einer der wichtigsten dürfte sein, dass die Schallplatte einfach nicht das richtige Medium für die Quadrophonie war und die Technik an ihre Grenzen kam. Hinzu kam, dass die Programmauswahl der Schallplattenverlage alles andere als optimal war. Auch sind viele Quadrophonieaufnahmen aus technischer Sicht "verunglückt", da einfache Zweikanalstereo- oder sogar Mono(!)-Aufnahmen als Basis dienten. Die Quadrophonie konnte einfach den Verbraucher nicht so sehr begeistern, als dass er seine bestehende Stereoanlage erweitern oder gar ersetzen wollte. (Lesenswert: Gedanken zur Einführung der Quadrophonie in den 1970er Jahren

2. Die analogen Surround Sound-Verfahren

Alle zuvor beschriebenen Audiosysteme wurden auf die Wiedergabe von Musik hin optimiert. Um einen Raumklang zu erzeugen müssen hierfür alle Kanäle des Systems gleichwertig behandelt und mit identischen Lautsprechern wiedergeben werden. Surround Sound-Systeme, wie sie in Kinos (oder auch  "Home Cinemas") verwendet werden, weichen von dieser Regel ab, denn sie sind nach vorne, in Richtung Leinwand bzw. Bildschirm, orientiert.

2.1 Dolby Stereo

Dolby Stereo ist ein analoges Surround-System bei dem vier Audiokanäle, Rechts (R), Center (C), Links (L) und Surround (S), mittels einer Matrix zu zwei "Total"-Kanälen (Links total Lt und Rechts total Rt) kodiert wird.

Abb. 2.01: Dolby Stereo Encoder und Decoder
Abb. 2.01: Dolby Stereo Encoder und Decoder

Die Center-Information für einen Mittenlautsprecher ist gleichphasig in Rt und Lt enthalten. Der Surround-Kanal ist mit +/- 90° Phasenverschiebung ebenfalls in Rt und Lt enthalten.
Diese Aufteilung garantiert eine hohe Kompatibilität bei Mono-Wiedergabe. Die Summe von R, L und C bewirkt lediglich einen Pegelanstieg von 3dB, während sich die Anteile des Surround-Kanales gegenseitig auslöschen.
Auch die Kompatibilität bei der Stereowiedergabe ist sehr hoch. R und L sind separate Kanäle, das Centersignal wird von beiden Lautsprechern wiedergegeben und erscheint als Phantomschallquelle zwischen den Lautsprechern. Der Surround-Kanal erscheint leise und diffus.

Durch diese intelligente Verschachtelung der Signale konnte die Firma Dolby Mitte der 1970 Jahre die wichtigsten Probleme der Kinobetreiber lösen.

Abb. 2.02: Dolby Stereo Lichttonspuren (rechts) auf einem 35 mm-Film
Abb. 2.02: Tonspuren auf einem 35 mm-Film (von links: Sony SDDS, Dolby Digital, Dolby Stereo, DTS Timecode). Tonsysteme in Kinos sind redundant ausgelegt. [2]

In großen Kinos konnte es das teure 4-Kanal CinemaScope-Verfahren mit seinen sehr empfindlichen Magnetspuren ersetzen, da Dolby Stereo als zwei Lichttonspuren auf dem Film aufgebracht ist. Da die bereits vorhandenen Verstärker und Lautsprecher weiter verwendet werden konnten, war eine Umrüstung auf Dolby Stereo mit relativ wenig Kosten verbunden.
Kleine Kinos, die nur mit einer 2-Kanal Audioanlage ausgestattet waren, konnten die gleiche Kopie des Films vorführen, da Dolby Stereo rückwärtskompatibel zum alten Lichttonverfahren war.

Die Standardkonfiguration im Vierkanalbetrieb unterscheidet sich grundsätzlich von der Quadrophonie. Bei Dolby Stereo befinden sich drei Lautsprecher in der Front des Zuschauers. Zwischen den beiden normalen Stereo-Lautsprechern R und L befindet sich der Center- oder Mittenlautsprecher. Dieser füllt das akustische Loch, das durch weit auseinander stehenden Lautsprecher entstehen kann und verbessert die Lokalisation, z.B. bei Dialogen.

Der rückwärtige Surround-Kanal überträgt zumeist nur Effekte oder ambiente Geräusche, die keiner genauen Lokalisierung bedürfen. Die Anzahl der rückwärtigen Surround-Lautsprecher ist an die Größe des Saales angepasst. Alle Surround-Lautsprecher liefern das gleiche Signal.
Da der Signalpegel des Surround-Kanals in manchen Szenen mitunter sehr niedrig ist, kann leicht ein störendes Rauschen oder ein hörbares Übersprechen von den vorderen Kanälen auftreten. Daher wird das Surroundsignal mit einer Bandpassfilterung auf eine Bandbreite von 100 Hz bis 7 kHz begrenzt und mit einem aufwändigen, mehrbandigen und adaptiven Rauschreduktionssystem (NR = Noise Reduktion) Dolby A oder, ab 1987, Dolby SR wirkungsvoll im Rausch/Signalabstand verbessert und somit in der Dynamik verstärkt.
Bei späteren Varianten von Dolby Stereo wurden aktive Matrizes eingesetzt, die adaptiv die Kanaltrennung verbesserten.

Abb. 2.03: Dolby Stereo füllt mit einem Mittenlautsprecher das akustische Loch zwischen dem rechten und linken Lautsprecher. Die Surround-Lautsprecher vermitteln einen räumlichen Klang.
Abb. 2.03: Dolby Stereo füllt mit einem Mittenlautsprecher das akustische Loch zwischen dem rechten und linken Lautsprecher. Die Surround-Lautsprecher vermitteln einen räumlichen Klang.

In der Decodermatrix (Abb. 2.01) integriert ist eine Stufe, die das Signal des Surround-Kanals um 20 - 100 ms verzögert. Dies ist notwendig um zu verhindern, dass Zuschauer, die weit hinten sitzen, zuerst den Schall aus dem Surround-Kanal und dann erst mit einer Verzögerung den von den Frontlautsprechern wahrnehmen. Der dabei entstehende Präzedenzeffekt führt zu einer falschen Lokalisierung des Hörereignisses.

Dolby Stereo wurde zuerst in größeren Kinos eingesetzt. Diese waren zumeist schon zuvor mit dem veralteten CinemaScope 4-Kanal System ausgestattet. Durch den Riesenerfolg der Star Wars-Reihe (ab 1977), zu dem die Audioeffekte in 4-Kanal-Ton nicht unerheblich beitrugen, wurden auch schon bald kleinere Kinos motiviert Dolby Stereo-Systeme zu installieren.

 

2.2 Dolby Surround

Dolby Surround ist die abgespeckte Consumer-Variante des professionellen Dolby Stereo. Für die Kodierung der vier Kanäle wird die gleiche passive Matrix wie für Dolby Stereo verwendet. Als Rauschunterdrückung wird das sehr einfache Dolby B-Verfahren verwendet. Dolby Surround Decoder wurden in viele Audiowiedergabegeräte, wie Verstärker, Videorekorder und CD-Player eingebaut.

Dolby Prologic und Dolby Prologic II

Eine Weiterentwicklung von Dolby Surround ist Dolby Prologic, bei dem eine auf spannungsgesteuerten Verstärkern (VCOs) beruhende adaptive Matrix verwendet wird und Dolby Prologic II, das über zwei Surround-Kanäle (Surround Links/Surround Rechts) verfügt. Zusätzlich sind die Surroundkanäle bei Dolby Prologic II  im Frequenzgang weniger beschnitten (100 Hz - 20 kHz). Durch eine verbesserte Phasenstabilität und Kanaltrennung eignet sich Dolby Prologic II auch für Musikproduktionen. Mit Dolby Prologic II ließ sich erstmalig auch 5.1 Surround realisieren.

 

3. Die digitalen Surround Sound-Verfahren

3.1 Grundlegende Verfahren

Der erste digitale Ton für den Konsumentenbereich stand ab 1983 mit der Compact Disk (CD-DA) zur Verfügung. Das ursprüngliche Verfahren verwendete einen unkomprimierten, pulscodemodulierten Stream mit einer Datenrate von 174 kByte/s. Diese Datenrate reicht in diesem Aufzeichnungsformat gerade einmal für ca. 70 Minuten Spielzeit mit zwei Audiokanälen. Für echtes Mehrkanalaudio mit getrennten Kanälen war folglich nicht genug Platz auf einer CD. Um Surround Sound dennoch auf einer CD zu speichern musste dieser kompatibel zur Zweikanal-Stereophonie sein. Hierzu griff man auf die bewährten Kodiertechniken der analogen Surround Sound-Verfahren mit Matrizes zurück.

Die ersten echten digitalen Surround Sound-Verfahren mit vollständig diskreten Kanälen wurden natürlich wiederum für den Einsatz in Kinos entwickelt.

Digital DTS

Einer der Vorreiter war die Firma DTS (ursprünglich: Digital Theater Systems), die den Film "Jurassic Park" 1993 mit einem digitalen 6-Kanal-Ton versah.

Abb. 3.01: Eine (von zwei) DTS-CD mit dem deutschen Ton für “Herr der Ringe”
Abb. 3.01: Eine (von zwei) DTS-CD mit dem deutschen Ton für “Herr der Ringe” [3]

Da die riesigen Datenmengen für den unkomprimierten digitalen Ton derzeit nicht auf den Filmrand passten, wurde er auf einer oder mehreren separaten CDs gespeichert. Auf dem Filmrand befand sich lediglich ein optischer Timecode für jedes einzelne Bild (siehe auch Abb. 2.02 ganz rechts). Dieser Timecode synchronisierte die Wiedergabe des Tons von der CD. Die Trennung des Tons von dem Film hatte zusätzlich den Vorteil, dass derselbe Film, mit anderen CDs kombiniert, auch in anderen Sprachen aufgeführt werden konnte.

Dolby Digital

Nahezu gleichzeitig führte die Firma Dolby ihr erstes Digitalaudioformat "Dolby Digital" ein. Der erste offizielle Kinofilm war "Batman's Rückkehr". Wie auch Digital DTS umfasst Dolby Digital bis zu sechs Kanäle. Allerdings ist Dolby einen anderen Weg gegangen als DTS. Um die riesigen Datenmengen zu reduzieren, wird das Audiosignal mit AC-3, einem verlustbehafteten Verfahren, komprimiert. Mit ca. 320 kBit/s passte Dolby Digital auch wieder als Lichttonspur (zwischen der Perforation!) auf den Film (siehe auch Abb.2.02 Spur von links). Im Projektor wird diese Spur von einer LED oder einem Laser beleuchtet und von einer CCD ausgelesen.

Mit der Einführung des Digitalen Kinos sind Digital DTS und Dolby Digital natürlich obsolet geworden. Moderne Kinofilme kommen auf einem Datenträger oder per Stream verschlüsselt in den Projektionsraum. Der Standard der DCI (Digital Cinema Initiatives) sieht heute für Kinoton nur noch unkomprimiertes PCM vor.

Aber beide Verfahren haben aber Ableger in der Consumer-Elektronik gefunden. Auf praktisch allen standardisierten digitalen Medien (DVD, Blu-ray, DAB, DVB) werden Varianten dieser Verfahren eingesetzt.
Die Dekodierung von Dolby Digital erzeugt eine Latenz von ca. 40 ms. Bei der Wiedergabe von Filmen kann daher ein Versatz von Bild und Ton in der Größenordnung von einem Vollbild auftreten, was als Asynchronität wahrgenommen wird. Daher muss das Videosignal mittels eines Videospeichers um die Latenzzeit verzögert werden.

3.2 Die 5.1-Surround Sound Konfigurationen

Das 5.1-Surround-Verfahren ist das heute am weitesten verbreitete Surroundverfahren. Das "5.1" in der Bezeichnung bedeutet, dass ein solches System aus fünf gleichen Hauptkanälen und einem Tieftonkanal (Subwoofer, LFE (Low Frequency Enhancement)) besteht. Alle sechs Kanäle sind diskret und nicht, wie bei Dolby Surround, matriziert gespeichert. Alle fünf Hauptkanäle weisen den vollen Frequenzumfang von ca. 20 Hz bis 20 kHz auf. Der Tieftonkanal gibt nur Frequenzen unter 120 Hz wieder.

Die Grundkonfiguration von 5.1-Surround-Systemen besteht aus den Stereolautsprechern Front-Links und Front-Rechts, dem Center-Lautsprecher vorne in der Mitte, zwei Surround-Lautsprechern hinten und dem Subwoofer, dessen Position sich variabel im vorderen Bereich befinden sollte (Begründung).

Aufgrund der unterschiedlichen Zielsetzungen ist der 5.1-Systemaufbau für die Anwendung im Kino und in der Heimanwendung unterschiedlich.

5.1-Surround Sound im Kino

Wie schon in der Einleitung zum Kapitel 2 beschrieben, ist die Hauptausrichtung eines Kinos nach vorne zur Leinwand. Die wichtigste Eigenschaft der Übertragungsanlage ist eine gute Sprachverständlichkeit mit einer stimmigen Lokalisation von Hörereignissen. Besonders bei Dialogen ist es wichtig, dass die Stimmen dort herkommen, wo die Protagonisten auf der Leinwand zu sehen sind. Um das akustische Loch in der Mitte zwischen den Stereolautsprechern zu füllen, wird ein Centerlautsprecher eingesetzt. Anders als bei Dolby Stereo führt der Centerkanal ein eigenständiges Signal, was die akustische Auflösung erhöht.

Abb. 3.02: 5.1 Surround Sound im Kino. Der Bereich der guten Lokalisierung (Sweet Spot = gelbe Sitze) ist relativ begrenzt.
Abb. 3.02: 5.1 Surround Sound im Kino. Der Bereich der guten Lokalisierung (Sweet Spot = gelbe Sitze) ist relativ begrenzt.

Die Surround-Kanäle liefern, wie schon bei Dolby Stereo, zumeist nur Effekte und ambiente Geräusche. Durch die Verwendung von zwei voneinander unabhängigen Surroundkanälen erhöht sich zwar die Lokalisierbarkeit von Hörereignissen, das hintere Klangbild ist aber, abhängig vom Sitzplatz, trotzdem recht diffus.
Das Signal für den Subwoofer, im Kinobereich LFE- (Low Frequency Enhancement) oder Boom-Channel genannt, ist so abgemischt, dass nur Effekte wie Donnern oder Schüsse mit hohem Schalldruck wiedergegeben werden.
Den besten Klangeindruck erhalten Hörer im und nahe dem klassischen Stereodreieck. Der "Sweet Spot" ist relativ begrenzt.

5.1 Surround Sound im Wohnzimmer

Auch im Heimgebrauch sind 5.1-Surround-Systeme am weitesten verbreitet. Nach der Empfehlung ITU-R BS 775 sollten bei 5.1-Systemen alle Lautsprecher idealerweise kreisförmig im gleichen Abstand zum Hörer angeordnet werden. Wie bei der klassischen Stereophonie sind die Frontlautsprecher für den rechten und linken Kanal um jeweils 30° von der 0° Hörachse versetzt. Auf dieser Position befindet sich der Center-Lautsprecher. Die Surround-Lautsprecher sind auf etwa +/- 110° positioniert. Eine präzise Positionierung ist nicht notwendig. Die ITU-R BS 775-3 erlaubt +/- 10° Abweichung. Allerding sollten die Surround-Lautsprecher sich nicht näher als die Frontlautsprecher am Hörenden befinden.
Wie bei professionellen Mehrkanalsystemen müssen diese fünf Lautsprecher für die Hauptkanäle in der Lage sein, den vollständigen Frequenzbereich von 20 Hz bis 20 kHz nahezu linear wiedergeben zu können. Die Lautsprecher der Hauptkanäle sollten sich alle in etwa Ohrhöhe befinden. Der Subwoofer hat wie bei großen Systemen eine obere Grenzfrequenz von 120 Hz und sollte neben dem Center-Lautsprecher angeordnet sein.

Abb. 3.03: Varianten von 5.1-Surround: Links nach ITU-R BS 775, rechts "direkt" mit Dipol-Lautsprechern.

Die ITU-R BS 775 beschreibt die Idealkonfiguration für "Mehrkanalaudiosysteme mit und ohne begleitendem Bild", was sich in einem großen Kinosaal auch realisieren lässt. In den meisten heimischen Wohnzimmern herrschen allerdings total andere Bedingungen.
Ein normales Wohnzimmer ist zumeist nicht nach akustischen Gesichtspunkten ein- bzw. ausgerichtet. Der Hörplatz liegt meistens nicht in der Mitte des Raumes, sondern auf einem Sofa an einer Wand. Der "Hausfrauen-Effekt" bewirkt (zumindest bei der älteren Generation), dass Technik im Wohnzimmer nahezu unsichtbar sein muss. Somit werden im schlimmsten Fall die Front-Lautsprecher auf dem Boden hinter Gardinen und die Surround-Lautsprecher hinter dem Sofa versteckt. Ein "Sweet Spot" ist unter solchen Bedingungen nur schwer auszumachen. In einer solchen Wohnsituation ist die Verwendung von Dipol-Lautsprechern als Surround-Lautsprecher in Betracht zu ziehen. Da diese nach mehreren Seiten abstrahlen, erzeugen ein diffuseres Klangbild und können  auch neben der Hörposition aufgestellt werden (siehe auch Abb. 3.03).

Die Funktion des Subwoofers ist im Heimgebrauch zwiespältig zu betrachten. Die Verwendung des LFE- (Effekt-) Kanals der Surround-Anlage in Verbindung mit einem TV-Display oder Beamer ist unproblematisch, da der Ton für die Wiedergabe mit Bildern passend gemischt wurde und dem Subwoofer die Tieftoneffekte zugeordnet sind. Die Verwendung des LFE-Kanals ist bei vielen Musikproduktionen hingegen problematisch.
Bei der Film- und Musikproduktion wird der Pegel des LFE-Kanals normalerweise um 10 dB angehoben. Bei der Wiedergabe im Kino wird der Pegel passend zur Raumakustik wieder abgesenkt, bei Heimanlagen allerdings hebt der Mehrkanal-Dekoder den LFE-Kanal nochmals um weitere 10dB an, was zu einer übertriebenen Wiedergabe der tiefen Bässe führt.

Um phasenbedingte Auslöschungen im Tieftonanteil des Stereosignals zu vermeiden, wird bei einem automatischen Downmix von 5.1 auf Zweikanalstereo der LFE-Kanal zumeist nicht verwendet. Wenn bestimmte Instrumente ihre tiefen Frequenzen über den LFE-Kanal erhalten, werden diese bei einem Downmix nicht mit übertragen.

3.3 Die 7.1-Surround Sound Konfigurationen

7.1-Surround Sound-Systeme können auf zwei Weisen zusammengestellt werden. Die weniger gebräuchliche ist die einer 5.1-Anlage mit zwei zusätzlichen, hochgesetzten Lautsprechern in der Front. Die für die Ansteuerung benötigten zusätzlichen beiden Audiosignale werden aus dem 5.1-Signal matriziert bzw. herausgemischt. Diese 7.1-Konfiguration soll an dieser Stelle nicht weiter beleuchtet werden.

7.1-Surround Sound im Kino

Wie im Kapitel 3.2 bereits festgestellt wurde, können 5.1-Surround-Systeme seitliche oder hinten liegende Schallquellen nur recht diffus darstellen. Um die Lokalisierbarkeit dieser Hörereignisse zu verbessern, wurden bei 7.2-Surround zwei weitere diskrete Wiedergabekanäle hinzugefügt: Rear Surround Links und Rear Surround Rechts. In der Aufstellung der Lautsprecher rücken die Surround-Lautsprecher-Rechts und -Links ein Stück in Richtung Front. Abb. 3.04 zeigt die von der ITU-R BS 775 empfohlenen Positionen. Die Abstände zwischen den Lausprechern sollten möglichst gleich sein.

Abb. 3.04: Konfiguration eines 7.1-Audiosystems nach ITU-R BS 775-3
Abb. 3.04: Konfiguration eines 7.1-Audiosystems nach ITU-R BS 775-3
Abb. 3.05: 7.1 Surround Sound im Kino
Abb. 3.05: 7.1 Surround Sound im Kino

  

7.1 Surround Sound im Wohnzimmer

Da im Heimbereich eine 7.1-Surround Sound-Anlage genauso schwierig zu installieren ist wie eine 5.1-Anlage, muss zumeist mit Kompromissen gelebt werden. Anstelle der Positionierung nach der ITU-Empfehlung sollte eine Systemaufstellung wie bei 5.1-Heimsystemen die Verwendung von Dipol-Lautsprechern als seitliche und hintere Surround-Lautsprecher in Betracht erwogen werden (siehe Abb. 3.06).

Abb. 3.06: 7.1 Home-System mit Dipolen und Direktstrahlern im Rearbereich
Abb. 3.06: 7.1 Home-System mit Dipolen und Direktstrahlern im Rearbereich

3.4 Weitere Surround Sound-Konfigurationen

Surround Sound-Systeme mit mehr als fünf Hauptkanäle, z.B. 6.1, werden entsprechend der ITU-Empfehlung entlang dem Abhörkreis aufgestellt oder als Höhenlautsprecher zusätzlich in die Frontlautsprechergruppe (9.1, 13.1) integriert.

 

4. 3D-Audio (Objektbasiertes Audio)

4.1 Objektbasiertes Audio

Surround Sound ist kein 3D! Bei den oben beschriebenen 5.1- und 7.1-Surround Sound-Verfahren sind alle Lautsprecher mehr oder weniger in einer horizontalen Ebene angeordnet und Phantomschallquellen können nur auf dieser Ebene, vorzugsweise nach vorn, erkannt werden. Zu einem echten 3D-Audio gehört es aber, dass sich Hörereignisse auch in der Höhe und nach hinten eindeutig lokalisiert lassen. Nur so ist ein Eintauchen ("Immersion") in das Hörerlebnis, so wie es in den Kinos und bald in den Wohnzimmern mit UHD propagiert wird, möglich. Das Problem dabei ist, wie die Lokalisierung des Hörereignisses durch den Hörer realisiert werden kann. Wenn der 3D-Ton für einen Kinofilm abgemischt wird, müssen die Positionen der Hörereignisse punktgenau vorgegeben werden. Wird mit konventioneller Technik die gleiche  Tonaufnahme dann in einem Home Cinema abgespielt, wo ganz andere räumliche und klangliche Verhältnisse herrschen, kann sich der 3D-Effekt folglich nicht einstellen, weil die Anzahl der Audiokanäle, die Laufzeiten und die Pegel der Audiosignale an einen Kinosaal angepasst sind. Das Hemmnis zur Kompatibilität liegt darin, dass die Lokalisierung eines Hörereignisses bei diesen kanalorientierten Verfahren in dem Audiosignal selber festgelegt ist.

Der Ansatz des objektbasierten Audios ist daher, die reine Audioinformation und die Information über die Position, Hall usw. voneinander zu trennen. Das heißt, ein Hörereignis besteht pro Spur/Kanal aus zwei Streams: den Audiodaten und den Metadaten über die momentanen Eigenschaften des Audiosignals. Diese Eigenschaften beschreiben den Pegel und Frequenzgang des Hörereignisses, seine Koordinaten im Raum, den Phasenbezug zu anderen Kanälen usw., also das, wie das Hörereignis durch den Hörer wahrgenommen soll. Da sich die Eigenschaften für jedes Hörereignis in allen Parametern separat festgelegt werden können, kann man es als ein einzelnes Objekt betrachten und behandeln.

Abb. 4.01: Audioobjekte in einer Beschallungsanlage nach dem Prinzip der Wellenfrontsynthese (WFS)
Abb. 4.01: Audioobjekte in einer Beschallungsanlage nach dem Prinzip der Wellenfrontsynthese (WFS)

Die Animation Abb. 4.01 soll eine Strandszene virtuell darstellen. Direkt aus den Frontlautsprechern kommt das Rauschen der Wellen am Strand. Dieses ist ein fixes Audioobjekt. Ebenso die Schiffssirene vom Kreuzfahrtschiff und das Nebelhorn vom Leuchtturm. Beide Audioobjekte werden so projiziert, dass sie von außerhalb des Kinos zu kommen scheinen. Der Schwarm Möwen und der Rettungshubschrauber sind mobile Audioobjekte. Sie scheinen sich im Saal in allen drei Dimensionen zu bewegen. Die Höheninformation zur Lokalisierung durch den Zuschauer kommt aus mehreren Deckenlautsprechern, die im Jargon scherzhaft als "die Stimme Gottes" (Voice of God) bezeichnet wird.

Das Bezeichnende an objektbasiertem Audio ist, dass es in einem weiten Rahmen skalierbar bzw. anpassungsfähig ist.
Man hat durch die Metadaten eines Kanals die Informationen über das  "Soll"-Hörereignisses. Wenn man auch Informationen über die Eigenschaften des Wiedergabeortes hat, kann ein Signalprozessor (Renderer) unter Einbeziehung der anderen Kanäle ein entsprechendes individuelles Audiosignal für jeden einzelnen Lautsprecher separat berechnen. Die Summe aller Einzelsignale bildet dann das "Ist"-Hörereignis. Da es durch die angepassten Berechnungen des Signalprozessors praktisch skalierbar ist, ist es dabei unerheblich, ob der Wiedergabeort ein Kinosaal, ein Wohnzimmer oder eine Freilichtbühne ist. Wichtig ist nur, dass der Signalprozessor die akustischen Eigenschaften des Wiedergabeortes kennt. Dieses kann durch ein sorgfältiges Einmessen des Wiedergabeortes vorgenommen werden.

4.2 Verfahren (Auswahl)

4.2.1 Wellenfeldsynthese

Das Konzept des objektbasierten Audios lässt sich mit konventionellen Audiosystemen nicht realisieren, da die Lokalisierung von Hörereignissen nicht auf physioakustischen Effekten wie Phantomschallquellen beruht. Eine Technik über die ein objektbasiertes Audio realisiert werden kann, ist die Wellenfeldsynthese.

Das Phänomen der Wellenfeldsynthese beruht auf dem Prinzip, dass eine Wellenfront als eine Überlagerung von Elementarwellen angesehen werden kann. Jeder Punkt auf einer Wellenfront ist dabei Ausgangspunkt einer Elementarwelle.
In der realen Welt entstehen Elementarwellen beispielsweise wenn sich zwischen einer Schallquelle und dem Hörenden eine perforierte Wand befindet. An der Wand wird so die Wellenfront in Elementarwellen gebrochen. Hinter der Wand vereinigen sie sich wieder zu einer Wellenfront.

Abb. 4.02: An einer perforierten Wand wird eine Wellenfront in Elementarwellen zerlegt
Abb. 4.02: An einer perforierten Wand wird eine Wellenfront in Elementarwellen zerlegt

Über komplexe mathematische Verfahren (Kirchhoff-Helmholtz Integral) lassen sich die (theoretisch unendlich vielen) Elementarwellen, die zu einer Wellenfront einer beliebigen virtuellen Schallquelle gehören, berechnen. Ein Spezialrechner, der Renderer, "zerlegt" die zu synthetisierende Wellenfront in eine den Wiedergabebedingungen entsprechende Anzahl von Elementarwellen. Über eine Vielzahl von Kanälen (theoretisch unendlich viele) und unterschiedlich angesteuerten Lautsprechern können Elementarwellen erzeugt werden, die beliebige Wellenfronten synthetisieren.

Abb. 4.03: Von einem Lautsprecherarray generierte synthetische Wellenfront
Abb. 4.03: Von einem Lautsprecherarray generierte synthetische Wellenfront

In der praktischen Anwendung sind die Lautsprecher in Reihen um den Hörer angeordnet (siehe auch Abb. 4.01). Alle Lautsprecher sind identisch und bestreichen den vollständigen hörbaren Frequenzbereich. Die Anzahl der Lautsprecher hängt von der Größe des Raumes bzw. des Saales ab. Bei großen Sälen können es mehrere Hundert oder Tausend sein. Alle Lautsprecher sind aktiv, d.h. jeder Lautsprecher hat seinen eigenen Verstärker und ggf. auch noch einen eigenen digitalen Signalprozessor. Das Audiosignal und die Kontrollinformationen werden digital über ein Netzwerk (Ethernet) zu den Lautsprechern übertragen.

Abb. 4.04: Hörsaal H 104 der TU Berlin mit einem 86 Meter langen Band an den Raumseiten, in dem 2700 Lautsprecher integriert sind.
Abb. 4.04: Hörsaal H 104 der TU Berlin mit einem 86 Meter langen Band an den Raumseiten, in dem 2700 Lautsprecher integriert sind. [4]

Obwohl die Wellenfeldsynthese ein recht junges Entwicklungsfeld ist (ab ca. 1988), hat es kommerziell Fuß gefasst. Ein Spin-off des Fraunhofer-Institut für Digitale Medientechnologie  IOSONO (mittlerweile von BARCO übernommen) hat weltweit schon zahlreiche WFS-Installationen vorgenommen.

Abb. 4.05: Wellenfeldsynthese-Installation von IOSONO in einem Kino in China
Abb. 4.05: Wellenfeldsynthese-Installation von IOSONO in einem Kino in Shenyang/China [5]

4.2.2 Dolby Atmos

Dolby Atmos ist ein Hybrid aus einem kanalbasiertem Audiomix und Audioobjekten. Aus bis zu 128 Tonspuren wird ein Stream aus einer 5.1-, 7.1- oder 9.1 Surround-Information (das sogenannte "bed" (= Bett oder Fundament)) plus bis zu 118 Audioobjekten paketiert. Ein Renderer verarbeitet die Inhalte entsprechend des Signaltyps. Die Kanäle des "beds" werden auf individuelle Lautsprecher bzw. Lautsprecher-Arrays gemappt. Die Objekte werden innerhalb des Raumes platziert. Bei der Wiedergabe werden sie abhängig von der physischen Position der Lautsprecher in Echtzeit gerendert. Ebenfalls in Echtzeit werden Laufzeiten und Vorverzerrung für bis zu 64 Lautsprecher berechnet.

Abb. 4.06: Prinzipbild Dolby Atmos
Abb. 4.06: Prinzipbild Dolby Atmos

Der Rendering-Algorithmus berücksichtigt die Anzahl und den Frequenzumfang der Lautsprecher. So kann Dolby Atmos-Installation leicht an die unterschiedlichen Bedingungen in den Kinos angepasst werden. Als Bezugspunkt für jegliche Systemkonfiguration ist ein Punkt auf der Mittellinie des Kinos, zwei Drittel der Saallänge von der Front entfernt (in Abb. 4.06 als grüner Sitz markiert).

Beim Downmix im Heimbereich werden  die Audioobjekte in Echtzeit in die 5.1- bzw. 7.1-Kanäle hineingerechnet.

Abb. 4.07: Aufsicht auf ein Dolby Atmos Kinosystem. Die roten Lautsprecher bilden das 5.7 bzw. 7.1 kanalorientierte Basissystem. Die blauen Lautsprecher liefern objektbasierte Audiosignale. Der grüne Sitz ist die Referenzposition.
Abb. 4.07: Aufsicht auf ein Dolby Atmos Kinosystem. Die roten Lautsprecher bilden das 5.7 bzw. 7.1 kanalorientierte Basissystem. Die blauen Lautsprecher liefern objektbasierte Audiosignale. Der grüne Sitz ist die Referenzposition.
Abb. 4.08: Seitenansicht eines Dolby Atmos Kino-Systems
Abb. 4.08: Seitenansicht eines Dolby Atmos Kino-Systems
Abb. 4.09: Frontseite eines Dolby Atmos Kino-Systems
Abb. 4.09: Frontseite eines Dolby Atmos Kino-Systems. Die grün markierten Lautsprecher sind optional.

  

4.2.3 NHK 22.2

Im Rahmen der Einführung von UHD-2 ("8K", "Super Hi-Vision"), dem immersiven Fernsehen, im Jahr 2020 möchte die NHK auch den immersiven Ton dazu liefern können. Schon 2005 demonstrierte sie auf der EXPO ein Mehrkanal-Tonsystem mit 22 Hauptlautsprechern und zwei Tiefstton-Effektlautsprechern. Die Lautsprecher sind in drei Ebenen angeordnet:

  • 9 Lautsprecher von oben
  • 10 Lautsprecher auf Ohrhöhe
  • 3 Lautsprecher von unten
  • 2 Lautsprecher für Effekte im Tiefstton-Bereich
Abb.4.10: Anordnung der Lautsprecher beim NHK 22.2-Multikanal-Tonsystem
Abb.4.10: Anordnung der Lautsprecher beim NHK 22.2-Multikanal-Tonsystem

Die Kanäle der mittleren Ebene (= Ohrhöhe) übertragen die primären Audiokanäle. Da die meisten Surround-Verfahren wie 5.1 oder 7.1, ebenfalls die primären Kanäle auf Ohrhöhe übertragen, bedeutet, dass das 22.2 System auch kompatibel für diese weit verbreiteten Verfahren ist.

Abb. 4.11: Positionen der Lautsprecher in den Ebenen
Abb. 4.11: Positionen der Lautsprecher in den Ebenen
Abb. 4.12: Positionen der Ebenen bei NHK 22.2
Abb. 4.12: Positionen der Ebenen bei NHK 22.2

Der große Vorteil von NHK 22.2-Surround ist, dass es, da keine teure Spezial-Hardware benötigt wird, technisch relativ einfach zu realisieren ist. Auch ist es nicht, wie z.B. Dolby Atmos, proprietär sondern offen standardisiert.

  

REFERENZEN

Abbildungen

[1] Abb. 1.01: Nordmende Tannhäuser 3D mit Klangregister von 1956;
Quelle: http://www.radiomuseum.org/; Autor und ©: Martin Steyer

[2] Abb. 2.01: "Dolby Stereo Lichtspuren auf einem 35 mm-Film"; By Rotareneg (en:Image:35mm_film_audio_macro.jpg) Lizenz: GFDL  or  CC-BY-SA-3.0, via Wikimedia Commons;
Quelle: https://commons.wikimedia.org/wiki/File:35mm_film_audio_macro.jpg

[3] Abb. 3.01: Eine (von zwei) DTS-CD mit dem deutschen Ton für “Herr der Ringe”; By Gmhofmann (Own work)  Lizenz: CC BY-SA 3.0  via Wikimedia Commons; 
Quelle: https://commons.wikimedia.org/wiki/File%3ADts-hdr.jpg

[4] Abb. 4.04: Hörsaal H 104 der TU Berlin ... © TU-Pressestelle/ Böck; Quelle: https://www.pressestelle.tu-berlin.de/medieninformationen/2007/juni_nr_127-155/medieninformation_nr_1292007/

[5] Abb. 4.05: "Wellenfeldsynthese-Installation von IOSONO in einem Kino in China"; Quelle: http://www.iosono-sound.com
Nutzungsrechte: Copyright © by Barco Audio Technologies Alle Rechte vorbehalten.

 

 

Zuletzt bearbeitet am 2.Oktober 2015

 

Rechtshinweis

Sofern auf dieser Seite markenrechtlich geschützte Begriffe, geschützte (Wort- und/oder Bild-) Marken oder geschützte Produktnamen genannt werden, weisen wir ausdrücklich darauf hin, dass die Nennung dieser Marken, Namen und Begriffe hier ausschließlich der redaktionellen Beschreibung bzw. der Identifikation der genannten Produkte und/oder Hersteller bzw. der beschriebenen Technologien dienen.

Alle Rechte an den in diesem Kompendium erwähnten geschützten Marken- und/oder Produktnamen sind Eigentum der jeweiligen Rechteinhaber und werden hiermit ausdrücklich anerkannt. Alle in unseren Artikeln genannten und ggfs. durch Dritte geschützte Marken- und Warenzeichen unterliegen uneingeschränkt den Bestimmungen des jeweils gültigen Kennzeichenrechts sowie den Besitzrechten der jeweiligen eingetragenen Eigentümer.

Die Nennung von Produktnamen, Produkten und/oder der jeweiligen Produkthersteller dient ausschließlich Informationszwecken und stellt keine Werbung dar. InfoTip übernimmt hinsichtlich der Auswahl, Leistung oder Verwendbarkeit dieser Produkte keine Gewähr.

Sollten dennoch wider unserer Absicht Rechte Dritter verletzt werden, so bitten wir um eine Benachrichtigung ohne Kostennote.