Le son surround englobe une certaine quantité de formats qui se définissent par le nombre de pistes et le nombre de canaux ou voies de reproduction (HP ou famille de HP)[1],[2].
Le son surround englobe un éventail de techniques d'enregistrement, de mixage et de reproduction dit « surround » (« cerner », « encercler », « entourer », « environner »), c’est-à-dire, tout système de reproduction qui n'est ni monophonique ni stéréophonique.
Historique
Le son multicanal a commencé avec trois haut-parleurs, puis 4, 5, 6, 7, 8… jusqu'aux éphémères 425 haut-parleurs de Iannis Xenakis. Le son multicanal implique au moins la tentative d'un champ sonore (ou espace sonore ou encore champ acoustique) horizontal, quant à sa diffusion, de 360°. Certains autres systèmes tentent de gérer la verticalité, le Dolby Atmos ayant fait son apparition dans les salles en 2013 et arrivant sur les amplificateurs domestiques en 2014.
Vers les années 1950, le compositeur allemand Karlheinz Stockhausen expérimente des compositions électroniques (Gesang der Jünglinge et Kontakte (en)), celui-ci utilise des systèmes tournants et quadraphoniques avec l'aide de Herbert Eimert du studio Westdeutscher Rundfunk (WDR)[3].
En 1958 le Poème électronique pour bande magnétique d'Edgard Varèse, expérimente l'espace surround.
Iannis Xenakis explore également l'espace sonore avec 425 haut-parleurs utilisés pour déplacer le son dans l'espace. Il y a aussi de nombreux autres compositeurs d'avant-garde à la même époque qui ont créé des œuvres utilisant le son surround.
Fantasound
Fantasound a été en 1940 le premier procédé stéréophonique à trois canaux, développé par l'ingénieur du son William E. Garity et le mixeur John N. A. Hawkins pour Walt Disney en 1938-1940 pour le film Fantasia, qui sera le premier film commercial utilisant le son multicanal. Il a conduit à l'élaboration de ce qui est aujourd'hui connu comme le 5.1.
Production et post-production de son multicanal
Prise de son
Il y a un distinguo sémantique à ne pas perdre de vue :
- Quand la prise de son est destinée à la reproduction d'un évènement (par exemple musical), elle est appelée « captation » ; c’est-à-dire que l'« espace sonore » reste relativement le même à l'enregistrement et à la diffusion.
- Lorsque cette même prise de son a pour mission d'accompagner l'image d'un film ou d'un évènement sportif (par exemple), elle est appelée « prise de son », destinée à manipulations d'espaces variant découlant du montage image et des changements d'axes apportés par les changements d'axes et de cadre. Ce qui induit de nouvelles problématiques psychoacoustiques complexes.
L'enregistrement multicanal remet en question les techniques de prise de son classiques. Principalement, il doit prendre en compte l’espace sonore déployé autour du spectateur ou de l’auditeur; c’est pourquoi un système de prise de son 5.1 doit en capter les subtilités.
Comme à l'époque de la prise de son de musique classique, différentes écoles et systèmes s'affrontent; ceux-ci ne tiennent pas toujours compte des problématiques de mixage et de reproduction, lesquels possèdent chacun leurs propres contraintes.
Dans les années 2010, une multitude de systèmes se développent parallèlement à l’évolution des formats multicanal : MMAD, decca tree, OCT Surround, INA5, Soundfield, sphère Schoeps KFM360, carré Hamasaki, croix IRT, holophone H2pro, dpa S5, dpa 5100…
Mixage
Ces formats rendent plus complexe le travail du mixage. Ils apportent des concepts à revisiter ou à innover autour des effets (outils de localisation, outils de spatialisation, gestion du LFE, traitement dynamique, downmixing, upmixing), des notions nouvelles autour du format (le bass management, la gestion de bus multiples) et des codages utilisés).
D'autre part, le mixage multicanal a ses subtilités de rapports psychoacoustiques doit trouver une cohérence plausible entre le champ visuel déployé en frontal et le champ sonore qui s’installe tout autour de l’auditeur en gérant les principes de l’attention auditive. La réalisation artistique trouve de nouvelles possibilités d'expression dans cet espace qui peut être aussi apprivoisé par la radio (fictions, documentaires), la télévision, la musique…
Formats de mixage pour la diffusion et la restitution multicanal
Musique
- La quadriphonie (ou quadraphonie) est inventée au début des années 1970, c'est le premier format multicanal[4] proposé au grand public. Plusieurs systèmes concurrents s'affrontent. Ces systèmes ont été un échec commercial en raison de nombreux problèmes techniques, qui ont été résolus trop tard pour sauver la technologie de la catastrophe. Le format était plus cher que la stéréo standard Hi-Fi. Il nécessitait aussi deux haut-parleurs supplémentaires ainsi que leurs amplificateurs, et a souffert de l'absence d'un format standard pour les vinyles.
- Musique en 5.1, curieusement, ce format n'a pas le succès escompté. Ce format ne peut être lu que sur un DVD-Audio, un SACD, ou un Blu Ray audio.
Cinéma et audiovisuel
LCRS
Le Dolby Stéréo est un format analogique. Quatre sources : gauche, centre, droite et arrière (surround) ou LCRS. En 1975, Dolby présente ce système analogique dérivé de la quadriphonie mais adapté à la reproduction sonore au cinéma en optique[5].
Matricé, dit 4.2.4
- 4 canaux au mixage: Left, Centre, Right, Surround (LCRS)
- 2 matricés en deux pistes dites « left total, right total » (LtRt). Ces pistes recopiées (« report optique ») sur les deux pistes optiques analogiques de la copie dite « d'exploitation ».
- 4 canaux d'écoute au cinéma, les deux pistes matricées (LtRt) sont dématricées en 4 voies de diffusion LCRS au moment de la projection.
En plus du matriçage, le Dolby SR analogique utilise un autre procédé de réduction du bruit (« NR », pour « Noise Reduction ») d'« enregistrement/lecture » qui permet d'améliorer significativement la dynamique (rapport signal/bruit, entre les sons les plus forts et les sons les plus faibles).
Ce format multicanal analogique est toujours, en principe, utilisé au cinéma pour la diffusion des copies 35 mm (« chimiques ») en salle. À la fois pour les cinémas pas encore équipés en numérique ainsi qu'en tant que format de secours en cas de panne du format numérique[6].
Dolby Surround Mixer | Left | Right | Center | Surround |
---|---|---|---|---|
Left Total | ||||
Right Total |
j = +90° phase-shift, k = -90° phase-shift
Mixage 5.1
Le format 5.1 a été le premier format multicanal numérique au cinéma. Plusieurs systèmes de codage sont en concurrence, certains disparaîtront au fur et à mesure des évolutions et des circonstances. Les deux systèmes les plus répandus sont le Dolby Digital et le DTS. Tous les systèmes utilisent la même configuration d'écoute.
Cinq enceintes entourent l'auditeur, accompagnées d’un subwoofer (le .1) qui diffuse les fréquences graves. Les cinq enceintes doivent être sur le même plan horizontal et identiques. Le subwoofer, alimenté par le canal LFE, est disposé le plus couramment devant, proche de l'enceinte centrale, sa bande-passante doit rester inférieure à 120 hertz. La disposition des enceintes est défini par l'UIT-R BS 775-1.
Au-delà du mixage 5.1
- le 5.1 normé aussi pour le home cinéma
- le 6.1 (5.1 plus une enceinte supplémentaire centrale à l'arrière pour le cinéma), ce format n'a pas eu le succès escompté, sans doute du fait de son surcoût de mise en œuvre ;
- le 7.1 de Sony SDDS : cinq enceintes frontales et deux à l'arrière ; en voie d'abandon dans les années 2010 ;
- le 7.1 Dolby Surround : trois enceintes frontales, deux latérales et deux à l'arrière et un caisson de basse (depuis 2010), déployé dans de nombreuses salles de cinéma numérique ;
- le 7.2 Dolby Surround : trois enceintes frontales, deux latérales et deux à l'arrière et deux caissons de basse (materiel disponible au grand public depuis 2006 mais pas d'enregistrement dans le commerce) ;
- le 12.4 : uniquement pour l'Omnimax, mis en place en 1986 au cinéma de la Géode à Paris par les ingénieurs de Cabasse[8].
Mixage 3D, son immersif
Avec l'éclosion de l'image 3D, une plus grande et meilleure gestion de l'« espace sonore » devient nécessaire. Une multitude de formats sonores apparaissent en devenir, notamment des formats gérant la verticalité.
Les formats suivants, destinés au cinéma numérique, prétendent ou tendent à gérer la verticalité de l'espace sonore :
- le Dolby Atmos, pour un son immersif en salle de cinéma
- le format Auro-3D, pour un son immersif en salle de cinéma, mais aussi pour le home-cinema
- le (10.2 (en)), inventé par (Tomlinson Holman (en)),
- le 14.1 (développement en 2010) - face avant, L LC C RC R + en hauteur, Top L C R puis deux Top Surround L et R au plafond, Ls et Rs LR restant à leur place,
- (22.2 (en)), format développé par la NHK pour accompagner le Super Hi-Vision, format supérieur à la HD 1920x1080 pixels, Super Hi-Vision = 7680x4320 pixels
Les techniques de codage qui accompagnent le 5.1 sont, pour le cinéma photochimique, le Dolby Digital et le DTS pour le DVD vidéo, le Dolby E et le Dolby Digital pour la TVHD (le Dolby E pour la production, Dolby Digital ou le He-AAC pour la diffusion vers les particuliers, ces formats permettant l'utilisation de metadonnées utiles pour le bon enchaînement des programmes sur une chaîne HD, une bonne gestion de la dynamique, des possibilités de downmix pour les compatibilités stéréo et mono). Le SACD et le DVD audio sont des supports prévus pour la musique en 5.1, mais on trouve de plus en plus fréquemment le DVD hybride (CD et DVD vidéo DTS ou Dolby Digital) moins coûteux à produire. Les supports HD DVD et Blu ray sont compatibles 5.1, mais sont prévus pour intégrer un son 7.1, accompagné des techniques Dolby Digital évoluées (Digital +, Digital true HD), DTS HD, DTS Master HD, PCM, DSD. On trouve des formats 5.1 compressés pour Internet notamment le mp3surround et le mpegsurround. Ils servent aujourd'hui notamment à la diffusion des radios HD 5.1.
Formats de supports et de transport
Dolby E
Le Dolby E n'est ni un format de mixage, ni un format de diffusion[9], c'est un format d'encodage et transport du signal dit de contribution (exemple : entre la régie TV chargée de capter un opéra en direct installée près du site de l’évènement et la régie de diffusion de la chaîne de télévision qui diffuse le programme).
Métadonnées
Pour l'audiovisuel, les métadonnées spécifiques sont toujours en voie avancée d'évolution et de normalisation[10].
- L'Advanced Media Workflow Association, Inc. (AMWA)[11] continue depuis 2000 de développer les compatiblilités entre AAF (Meta Advened Audio Framework), MXF et le XML pour l'univers de l'audiovisuel et des plateformes internet (y compris le Flash d'Adobe Systems).
Domaines d'application
Télévision, DVD et Blu Ray
Le sport est notamment le facteur décisif qui a porté la télévision en haute définition avec un son 5.1. Nombreuses sont les applications du son multicanal : la télévision haute définition, le cinéma, le film sur DVD vidéo et sur les nouveaux supports HDDVD et Blu ray, le jeu vidéo (DVD, HDDVD, Blu ray), la musique et les concerts (SACD, DVD audio, DVD vidéo), la radio HD, le DAB, Internet…
Jeux vidéo
Historiquement, au début du multimédia, les jeux sont longtemps restés en mono, pour les systèmes d'exploitation (OS), la piste sonore est secondaire, les premiers logiciels multimédias d'animation sont axés sur l'image, la synchronisation entre l'image et le son est encore problématique.
L'apparition du format multicanal a aussi été tardive (comparativement au cinéma), aux alentours de la fin des années 2000 toujours pour les mêmes raisons. La plupart des jeux vidéo sont en 5.1 (parfois en 7.1), à l’exception des consoles portables qui se contentent de la stéréo.
Salles de cinéma IMAX
Le système sonore de l'IMAX possède au moins six canaux discrets dont un disposé au plafond. Il gère donc l'espace sonore vertical.
Un autre système de contrôle permet de piloter ou d'adapter le niveau de diffusion de chaque piste sonore permet d'optimiser et d'adapter la reproduction aux particularités acoustiques de chaque salle du circuit.
Salles de cinéma numérique
La restitution sonore multicanal a accompagné le développement de la projection numérique en salle, avec le son 5.1, 7.1, Digital Imax, et plus récemment avec les débuts du son immersif Dolby Atmos.
Téléphones mobiles
Pour un téléphone portable, l'alternative est l'écoute au casque utilisant des systèmes d'écoute comme l'ambisonie via la technologie HOA Higher Order Ambisonics de 3D Sound Labs ou[12] l'holophonie.
Problématique de la diffusion multicanal
Le système d'écoute 5.1 est assez complexe à régler. Le niveau de travail préconisé est de 85 dBC SPL au cinéma et aux alentours de 79 dBC SPL pour la haute définition. Chaque enceinte doit restituer le même niveau. Il est aussi nécessaire d’accorder les cinq enceintes en fréquence ainsi qu’harmoniser avec le local d'écoute qui crée des premières réflexions. Le bass management qui consiste à redéployer les basses fréquences des enceintes principales dans le subwoofer, nécessite un réglage, on peut le trouver à différents points de la chaîne (processeur de monitoring 5.1, console numérique, logiciel audio…).
Ce qui différencie principalement la reproduction multicanal au cinéma, à la télévision et pour le DVD c'est d'abord le niveau d'écoute :
- La salle de cinéma est un endroit dédié qui s'apparente à un auditorium, le lieu est isolé et traité acoustiquement, le niveau sonore peut être élevé.
- Pour le DVD et la télévision, l'environnement est urbain, les voisins empêchent d'avoir des niveaux d'écoute comparables à la salle de cinéma (le niveau de référence est de 85 dB SPL au cinéma, en appartement il sera aux alentours de 79 dB SPL). À la télévision, le niveau de diffusion est aussi réglementé en France par de nouvelles recommandations et normes d'intensité sonore (loudness) sous l'autorité du CSA en France.
- Les caques audio ou systèmes permettant une spacialisation du son[13].
Image sonore multicanal
Le 5.1 prétend à l'immersion du spectateur ou de l'auditeur, celui-ci ne regarde plus l'évènement à travers une fenêtre comme il en a pris l'habitude avec la stéréo, qui n'est pas un « format » naturel. En multicanal, l'auditeur « vit » l'évènement, entouré par le champ sonore grâce notamment aux enceintes arrières, presque comme s'il était dans la salle de concert ou en situation réelle.
Pour revivre réellement les conditions du concert ou de l'évènement sportif, il faudrait néanmoins apporter davantage de directions sonores que celles proposées par le 5.1. C'est pourquoi apparaissent dans les années 2010 des formats supérieurs comme le 7.1, ou des formats qui apporte la notion de hauteur en ouvrant davantage l'image sonore : 10.2, le 22.2, ou encore la WFS
- (en) Cet article est partiellement ou en totalité issu de l’article de Wikipédia en anglais intitulé « Wave field synthesis » (voir la liste des auteurs) qui reproduit, à l'aide d'une couronne d'enceintes, le champ sonore par le principe physique d'Huygens.
Lexique
Définition de certains termes techniques :
- 2+2+2+2 : format multicanal appelé aussi aurophonic system 8 présentant la notion de hauteur
- 2.1 : système de reproduction à trois canaux comportant les satellites droite et gauche ainsi qu'un canal LFE
- 6.1 : format multicanal utilisé pour la salle de cinéma intégrant un canal central arrière
- 7.1 : format multicanal comportant deux enceintes supplémentaires, il existe plusieurs configurations d’écoute, format utilisé par le codage Sony SDDS et les supports HDDVD (obsolète) et Blu ray
- 10.2 : format multicanal développé par Tomlinson Holman qui apporte l'information de hauteur
- 22.2 : format multicanal développé par la NHK pour accompagner le super high vision (7680x4320 pixels)
- Bass management : Redéploiement des basses fréquences des cinq enceintes principales vers le subwoofer permettant ainsi un meilleur respect du spectre pour les petites écoutes 5.1
- Blu ray : support haute définition pour le film, format multicanal 7.1 compatible 5.1, intègre les formats Dolby Digital, Dolby Digital +, Dolby Digital true HD, DTS, DTS HD, DTS HD Master, PCM
- Carré Hamasaki : système de captation d’ambiance 4.0 développé par la NHK, constitué de quatre capsules bidirectionnelles placées en carré
- Croix IRT : système de captation d’ambiance 4.0 développé par l’IRT, constitué de quatre capsules cardioïdes placées en croix
- DAB : digital audio broadcasting, système de radiodiffusion numérique standardisé développé par le projet européen Eureka 147
- Decca tree : système de prise de son multicanal constitué de cinq microphones omnidirectionnels
- Dolby SR : format de matriçage Dolby 4-2-4 Lt Rt utilisé pour diffuser un son 5.1 sur deux canaux, signal de secours utilisé pour la diffusion dans les salles de cinéma ainsi que pour la diffusion en TVHD
- Dolby Digital : format de codage numérique 5.1 avec compression de données audio (AC3), utilisé pour le DVD vidéo, le cinéma, la TVHD
- Dolby Digital plus : format évolué du Dolby Digital qui permet de restituer un son sur 7.1 canaux et plus, à un débit de 6 Mb/s. Ce format est compatible avec le Dolby Digital
- Dolby Digital true HD: l’encodage du Dolby True HD utilise une technologie cent pour cent sans perte avec un débit d’informations jusqu’à 18 Mb/s. Ce format de sa dernière génération supporte jusqu’à huit canaux pleine bande 96 kHz/24 bits
- Dolby E : système de codage professionnel utilisé en production pour la TVHD. Format de matriçage 8-2-8 qui permet la distribution de son 5.1 accompagné d’un signal Lt Rt ou stéréo en utilisant seulement deux canaux audio des infrastructures de post-production et de broadcast. Ce format intègre des metadata de contrôle du signal
- Downmix : procédé de mixage des canaux multicanal vers un format stéréo ou mono, intègre des coefficients variables (metadonnées) pour la sommation des canaux du centre et de l’arrière.
Par exemple :
- L stéréo= L + C(-3dB) + LS(-3dB)
- R stéréo= R + C(-3dB) + RS(-3dB) - DTS : Digital Theater System, format de codage 5.1 utilisé pour le DVD vidéo, le cinéma, format concurrent de Dolby
- DTS HD : codage DTS 7.1 haute définition compatible 96 kHz / 24 bits, débit de 6 Mb/s
- DTS Master HD : codage DTS 7.1 haute définition compatible 192 kHz / 24 bits identique bit pour bit au master audio, débit variable allant jusqu'à 24,5 Mb/s
- DVD audio : support audio pour la musique en 5.1 intégrant un son PCM haute définition jusqu’à 96 kHz / 24 bits en multicanal et 192 kHz / 24 bits pour la stéréo. Le DVD audio comporte aussi un format Dolby Digital et utilise la technologie de réduction de donnée sans perte MLP Lossless
- HDDVD : support haute définition pour le film, format multicanal 7.1 compatible 5.1, intègre les formats Dolby Digital, Dolby Digital +, Dolby Digital true HD, DTS, DTS HD, DTS HD Master, PCM
- He-AAC : (High Efficiency AAC) codage audio 5.1 pour la diffusion en TVHD, l’alternative de codage en comparaison avec le Dolby Digital +
- HOA : Higher Order Ambisonics
- INA5 : système de prise de son multicanal constitué de cinq microphones cardioïdes, basé sur la théorie des angles de prise de son, développé par U. Herrmann et V. Henkels
- LFE : low frequency effect, bus de mixage portant les effets basses fréquences ou l’extension vers le grave d’un mixage, alimente le subwoofer
- Metadata : ensemble de metadonnées (dialog level, dynamic range control, downmix) intégrées aux flux Dolby E et Dolby Digital permettant le bon contrôle de la diffusion du signal (contrôle du niveau de diffusion en fonction du programme, sa dynamique, la compatibilité descendante stéréo et mono)
- MMA : multichannel microphone array, système de prise de son multicanal développé par M. Williams et G. Le Dû. Il est constitué généralement de cinq capsules cardioïdes et repose sur la théorie des angles de prise de son
- Mp3surround : codage utilisé pour la diffusion 5.1 sur internet
- Mpegsurround : codage utilisé pour la diffusion 5.1 des radio HD ou le DAB
- OCT Surround : système de prise de son multicanal développé par G. Theile. Il est constitué de trois microphones cardioïdes et de deux hypercardioïdes. Ce système repose sur le principe de réduction de la diaphonie acoustique existant entre les images fantômes multiples
- Radio HD : radio numérique haute définition, diffusion 5.1 possible, certaines webradios diffusent un son 5.1 grâce à la technologie MP3surround
- SACD : support haute définition pour la musique, intègre un format audionumérique DSD (Direct Stream Digital) disponible en 5.1 et en stéréo. Compatibilité du support avec les lecteurs CD pour la stéréo
- Soundfield : système de prise de son multicanal à matriçage reposant sur le principe mathématique de décomposition du champ acoustique en quatre composantes, trois composantes bidirectionnelles suivant un repère cartésien et une composante omnidirectionnelle
- Sphère Schoeps : système de prise de son multicanal à matriçage, constitué d’une sphère stéréo et de deux microphones bidirectionnels accolés aux capteurs de pression et dirigé vers l’avant.
- TVHD : télévision haute définition, intègre une image HD 1920x1080 pixels et un son multicanal 5.1 codé principalement en Dolby Digital. On trouve d’autres formats d’image HD
- Upmix : procédé de traitement d’un signal stéréo ou mono vers un format supérieur 5.1
- WFS : Wave Field Synthesis, technique de reconstitution du champ acoustique fondée sur l’utilisation de bancs de haut-parleurs. Ce procédé repose sur le principe d’Huygens qui stipule que le front d’onde rayonné par une source se comporte comme une distribution de sources secondaires
Notes et références
- ↑ le format 5.0 signifie 5 pistes et 5 canaux, 5.1 signifie 5 pistes et 6 canaux de reproduction, le « .1 » (ou le .2) précise que ce canal LFE est en fait mélangé sur un ou plusieurs des 5 pistes pour être extrait à la reproduction. On peut dire que ces systèmes sont encodés mais ce terme est trop vague car il désigne plusieurs procédés, d'ailleurs pouvant être utilisés conjointement.
- ↑ Le « sweet spot » est la zone d'écoute entre les haut-parleurs où l'auditeur entendra le mixage audio de la même façon que le mixeur
- ↑ Stockhausen et le studio de musique électronique de la WDR à Cologne - SoNHoRS
- ↑ appelé ultérieurement 4.0 (stéréo frontale + stéréo arrière - dérivé du format 70 mm)
- ↑ (en) Dolby : The Formula for Film Sound Success - Site officiel de Dolby
- ↑ Sur une copie de projection photochimique, il faut tenir compte de l'usure de la pellicule. Bien que très résistant au corrections d'erreur, le format Dolby Digital bascule automatiquement sur le SR optique analogique au-delà d'un certain taux d'erreurs mesurées de lecture, il retourne automatiquement en numérique quand il détecte que cela est redevenu possible.
- ↑ (en) en:Low-frequency effect
- ↑ la Géode et Cabasse
- ↑ Le Dolby E peut s'apparenter à un format de diffusion, bien qu'il ne soit qu'une partie intermédiaire.
- ↑ Dolby-volume
- ↑ (en) Site de l'Advanced Media Workflow Association (AMWA)
- ↑ (en) « 3D Sound Labs Announces the Availability of Ambisonics Solution for 360° VR Player / Virtual Reality Reporter », sur Virtual Reality Reporter, (consulté le ).
- ↑ « [Test] Casque audio 3D Sound One : du son spatialisé, oui, mais du « bon » son ? », sur KultureGeek.fr (consulté le ).
Articles connexes
- Son stéréophonique
- DVD
- Super Audio CD
- Dolby
- DTS
- 5.1
- 7.1
- Dolby Atmos
- 22.2 surround sound
- LFE
- HD DVD
- Blu ray