Le binaural, ou l’écoute immersive par excellence

GGJ16 - Image a la une
Sound Designer dans une Game Jam
6 février 2016
Messieurs - Image a la une
Messieurs.ch – Production audiovisuelle
8 mars 2016
La binaural - Image a la une

On entend de plus en plus régulièrement parler de son binaural, mais qu’est-ce que cela représente exactement ? En effet, dans la jungle des termes audio il peut parfois devenir difficile de s’y retrouver. Bien que cette technologie existe depuis les années 60, elle n’émerge réellement que depuis peu. Dans cet article, je vais vous expliquer les principes de ce type d’enregistrement, le matériel qu’il demande et le champ d’application, qui nous le verrons, est assez limité.

Le binaural, qu’est-ce c’est?

Le binaural est une technique d’enregistrement réalisée dans l’intention de créer un son tridimensionnel, appelé parfois « stéréo 3D ». Grâce à ce procédé, on donne à l’auditeur l’impression, lors de l’écoute, de se trouver littéralement dans l’endroit où la prise de son a été effectuée, captant ainsi toutes les subtilités de l’acoustique environnante dans toutes les directions.

Avant de commencer à expliquer le phénomène, quoi de mieux que d’offrir un petit exemple à se mettre dans les oreilles? Voici l’un des extraits les plus connus dans le domaine, le Virtual Barber Shop. On y entend un coiffeur faire le tour de la tête d’une personne en lui coupant les cheveux, tout en expliquant en anglais les fonctionnement de cette technologie. L’effet est saisissant! (ATTENTION: Pour bénéficier de cet effet le port d’un casque audio est nécessaire).

En quoi ces enregistrements binauraux diffèrent-ils des prises de son stéréo dites classiques (couple AB, XY, ORTF ou MS) ? Avec cette technique, l’espacement entre les oreilles ainsi que « l’ombre sonore » créée par le filtrage de la tête sont respectés (les sons provenant de la gauche étant filtrés par la tête qui forme un obstacle pour l’oreille droite). On peut donc dire que les conditions d’enregistrement sont réalisées exactement comme notre tête l’entendrait. Lors de l’écoute, il est donc aisé de dire si un son provient de la gauche ou de la droite, mais également s’il provient de l’avant ou de l’arrière et encore d’au-dessus ou au-dessous de soi. C’est là toute la subtilité de ce type d’enregistrement qui permet de reproduire une ambiance tridimensionnelle alors que la stéréo classique se limite elle, à la 2D.

Alors que pour donner cette impression d’immersion le cinéma utilise de nombreux systèmes multicanaux, utilisant généralement 8 à 12 haut-parleurs (jusqu’à même 24 pour le système japonais NHK), comment est-il possible d’entendre en trois dimension (soit dans toutes les directions) comme dans un système de ce type alors que seulement 2 microphones sont utilisés ? Le principe est en fait assez simple. Le corps humain est doté de son propre système surroud intégré…ses oreilles. Grâce à elles, nous sommes capable de percevoir, avec plus ou moins de précision, l’endroit d’où provient un son. Si une source sonore est placée à gauche de la tête, la différence de temps (même infime) que mettra le son à atteindre l’oreille gauche et l’oreille droite donnera naturellement au cerveau une indication sur sa provenance, le son arrivant d’abord dans l’oreille gauche, puis, quelques millisecondes plus tard dans l’oreille droite. Ce laps de temps est suffisant au cerveau pour décoder l’information et localiser la source. Vient alors l’intensité. Avec un son fort, le cerveau réalisera que la source est proche. Avec un son plus faible et plus étouffé, il en déduira que la source est lointaine.

stereophonie-localisation-appareil-auditif_resize

Pour l’instant, rien de bien différent d’une stéréo classique me direz-vous. Qu’est-ce qui donne alors cette impression tridimensionnelle ? C’est tout simplement la forme de « l’objet de captation ». Il est difficile d’utiliser ici le terme micro (ou plutôt couple de microphone puisqu’il y en a 2) car il s’agit de bien plus que cela. En effet, les microphones sont installés de façon à ce que leurs capsules soient espacées de 18 centimètres (la moyenne d’espacement entre les 2 oreilles chez l’être humain) et montées sur un support simulant soit la forme de 2 oreilles, soit carrément la forme complète d’une tête. On retrouve donc ici la notion de filtre exercé par la tête et la forme des oreilles, qui a été évoquée plus haut. Ci-dessous un exemple d’objet de captation utilisé pour des enregistrements binauraux.

Neumann Binaural head resize

Le microphone Neumann KU 81

Le cerveau combine donc 3 paramètres pour se positionner dans l’espace: le retard d’un son entre une oreille et l’autre (permettant de savoir s’il provient de gauche ou de droite), les différences de niveau (permettant d’évaluer la distance de la source sonore) et les différences de filtrage d’une oreille à l’autre (permettant de savoir si la source se place devant, derrière, au-dessus ou au-dessous de soi). En écoutant un son binaural, il devient évident que la forme de l’oreille joue son rôle dans la spatialisation des sources et que le résultat donne une dimension beaucoup plus immersive. Notre système auditif est conçu pour entendre particulièrement bien face à soi, dans le même sens que va notre regard. L’aspect incurvé derrière l’oreille permet donc d’isoler les sons provenant de face par rapport à ceux provenant de l’arrière. On peut facilement se rendre compte de cela en faisant un exercice bien simple. Bandez-vous les yeux et parlez avec une personne, d’abord face à face. Puis demandez-lui de se déplacer autour de vous. A tout moment vous serez en mesure de pointer le doigt dans la direction où elle se trouve malgré le fait que vous ne puissiez pas la voir.

Pour finir, on pourrait également parler de la réverbération qui joue aussi  son rôle dans l’équation. Celle-ci nous donne une information sur l’espace environnant: est-il confiné et résonant (une salle de bain), avec peu ou pas de réflexion (un champ perdu dans la nature sans arbres autour) ou très grand et réverbérant (une cathédrale)? En résumé, suivant comment notre cerveau perçoit la source, il sera capable d’analyser l’ensemble de ces informations pour déterminer l’emplacement « 3D » de la source.

Le matériel

Parlons maintenant de quelques modèles qui existent sur le marché. Parmi eux, voici les Neumann KU 81 et Neumann KU 100 nommé parfois Dummy Head. Leur particularité est d’avoir la forme d’une tête, visage compris (voir image ci-dessus). Chaque micro est placé à l’intérieur de la fausse oreille. L’objet peut être placé sur un pied à l’endroit désiré, à la hauteur exacte d’une tête humaine. Pour acquérir l’un de ces couples de microphone, il faudra débourser jusqu’à 8000$ (argh!!!!). La qualité des produits de la marque Neumann n’étant toutefois plus à présenter, on peut comprendre le prix élevé de l’engin. On réfléchira toutefois à deux fois avant de faire le pas.

3DIO propose plusieurs modèles sous la forme d’oreilles uniquement (sans la forme de la tête), montées sur une structure. Il existe des versions stéréo à 2 oreilles et des versions omni à 8 oreilles ! Il faudra débourser entre 1999$ et 5499$ pour faire l’acquisition d’un de ces modèles. On trouve donc ici des prix déjà plus abordables.

proIIBanner_01_grandeOmni_04_e8fd4dbf-fb50-474c-aaac-685c5de70c5d_grande

                           3DIO Free Space Pro II                                                                                      3DIO Omni Pro

De son côté, avec son modèle CS-10EM, la célèbre marque Roland a développé des microphones binauraux bien différents des autres présentés précédemment. Ici, il s’agit ici de microphones couplés à des écouteurs in-ear, dans le même style que ceux que nous recevons avec notre smartphone. Il est ainsi possible non seulement d’enregistrer ce que l’on entend mais également de l’écouter directement avec le même appareil. L’idée est excellente, d’autant plus que c’est véritablement votre propre tête qui fera office de filtre. Toutefois, la petite taille des capsules et le prix de 110$ laissent présager qu’ils ne peuvent être en mesure de restituer une qualité professionnelle similaire aux autre modèles de cet article. Cela peut toutefois être un bon compromis pour les personnes désirant faire leurs armes dans le domaine sans risquer de se ruiner pour autant.

Roland Ear PLug_resize

Roland CS-10EM

Parmi les modèles les plus récents figure le Zoom H3-VR. Ce nouveau petit bijou de chez le constructeur japonais permet de nombreuses choses. Pour commencer, c’est un micro binaural ET un enregistreur. Nul besoin donc de devoir recourir à deux périphériques séparés pour enregistrer un son binaural dorénavant. Autre grande force de ce produit, c’est la possibilité (et c’est sa fonction première) d’enregistrer en ambisonie. C’est donc l’outil idéal pour capturer des ambiances pour des vidéos 360° sur le net ou pour de la réalité virtuelle à moindre prix (reste encore à le tester, ce qui n’est pas encore mon cas).

H3-VR_rear_resize 3_1920x1080

Zoom H3-VR

Il est important de préciser encore une fois que pour donner cette impression d’immersion, le résultat de l’enregistrement doit impérativement s’écouter au casque, l’effet n’étant pas retranscrit de façon optimale via des haut-parleurs. En résumé, pour un enregistrement stéréo classique une écoute sur haut-parleurs de studio sera indiquée alors que pour un enregistrement binaural c’est une écoute au casque qui sera plus adaptée.

Pour finir, il va sans dire qu’une qualité d’enregistrement haute fidélité sera nécessaire pour restituer le plus fidèlement possible la source sonore et la rendre encore plus réaliste. On optera donc plutôt pour une fréquence d’échantillonnage de 96kHz et une résolution de 24bit au minimum sur un enregistreur avec d’excellents préamplis type Sound Devices 702T.

 


Quelle application pour le binaural?

Malgré cette technique géniale, celle-ci comporte quelques limites. Les enregistrements devant être impérativement écoutés au casque, cela restreint ainsi l’écoute à un auditeur par appareil uniquement. On imagine ainsi mal n’importe quelle salle de cinéma s’équiper d’une bonne centaine de casques pour les spectateurs. Pour cela, les systèmes multicanaux type Dolby True HD ou DTS-HD Master Audio permettent une écoute à plus grande échelle.  Le binaural est toutefois très adapté à l’écoute personnelle récréative de musique (posé bien sagement sur son canapé ou sur une chaise longue). L’offre reste toutefois faible, un peu élitiste et peu communiquée.

Un domaine qui semble idéal pour le binaural, c’est le jeu vidéo. En effet, le gamer joue généralement avec un casque sur les oreilles pour s’isoler et s’immiscer plus intensément dans l’atmosphère du jeu. Contrairement aux enregistrements dont nous parlions avant, l’utilisateur n’est pas simplement un spectateur passif, qui écoute l’ambiance qu’on veut bien lui fournir (en rapport avec des images ou non), mais un véritable acteur interagissant avec son environnement. Ainsi, la grande difficulté dans l’utilisation de cette technique en situation de jeu vidéo, c’est qu’elle doit pouvoir suivre l’action du joueur en tout temps, sans délai. Le rendu binaural est donc particulièrement complexe puisqu’il est destiné à changer à tout moment. Comme pour le son multicanal, le son binaural du jeu vidéo est alors composé de nombreuses sources mono (autre personnage, animal, objet, véhicule) sur lesquels un filtrage complexe sera appliqué pour les placer dans l’espace en fonction des mouvements du joueur. Les sources seront tantôt claires et distinctes si elles se trouvent proches et de face, tantôt plus sourdes si elles se trouvent derrière une paroi, tantôt à gauche, tantôt à droite, etc. Cela dit, encore une fois, créer une bande son en binaural limiterait l’utilisation du jeu à une seule personne. Une solution serait alors peut-être d’avoir la possibilité de choisir à sa guise entre une ambiance stéréo classique lors d’une partie à plusieurs, et une ambiance binaurale lors d’une partie en solo. Quoiqu’il en soit cela nécessiterait de créer un mixage de la bande son à double, ce qui on l’imagine, avec des délais parfois serrés, pourrait s’avérer problématique.

a-blind-legend

D’autre part, la puissance de calcul requise par l’ordinateur pour encoder les sons est énorme, augmentant avec chaque nouvelle source utilisée dans l’action. Il n’y a donc à l’heure actuelle que très peu de jeux qui font appel à cette technologie. On pourra citer en exemple le jeu indé pour smartphone A Blind Legend, dont la particularité est d’être 100% audio. On y incarne un chevalier aveugle qui doit se diriger en fonction d’indications qu’il reçoit via la voix d’un enfant lui disant tantôt « plus à gauche », tantôt « tout droit », etc… Les actions sont entrecoupées de scènes cinématiques audio  du plus bel effet avec des bruitages très réussis. Bien que le concept soit original, utilisable par des aveugles (ce qui n’est pas courant il faut le souligner), le gameplay n’est à mon sens pas plus intéressant que ça. On a ainsi assez vite l’impression de répéter les mêmes actions et de tourner en rond. Mais gageons que cela ouvre une petite porte au développement de jeux plus poussés dans le domaine.

Le binaural s’insère donc de plus en plus dans le domaine audio (professionnel ou grand public) mais très lentement. On peut imaginer que dans un futur proche, les pistes audio binaurales prendront de plus en plus de place dans le domaine du jeu vidéo et de l’écoute musicale récréative (mais personnelle) pour notre plus grand plaisir. On peut également imaginer que les enregistrements binauraux pourraient être parfaitement adaptés à des installations dans des musées historiques via des audioguides. Nous en sommes donc certainement toujours aux prémisses et aurons d’autres belles surprises à venir.

Et maintenant écoutons…

Suffisamment parlé, voici quelques exemples de sons binauraux. Pour commencer, voici une vidéo d’une petite balade dans les bois que j’ai réalisé en été dans ma région. L’enregistrement audio a été réalisé à l’aide du modèle 3DIO Free Space Pro II évoqué ci-dessus.

La vidéo suivante propose une visite immersive de New York, toujours avec le même micro.

Ici, la page Soundcloud Massage ASMR propose de nombreuses ambiances sonores et musiques de tout type.

Les amateurs de sensations fortes n’auront qu’à enfiler leur casque, fermer les yeux et se laisser porter par les sonorités horrifiques de cette vidéo pour sentir les poils de leur échine se hérisser.

Pour finir, le site Écouter Paris est fort intéressant et bien conçu puisqu’il permet via une carte d’écouter l’ambiance de plusieurs rues parisiennes.

1_main

1 Comment

  1. Martin dit :

    Pour moi, qui ne suit pas un spécialiste du son… loin, s’en faut, je trouve ce poste intéressant. De plus, le barber shop, c’est vraiment génial.

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

*