Les prises de son réalisées avec une tête (artificielle ou naturelle) présentent la plupart du temps un défaut de couleur sonore. Des pointes dans le registre médium nuisent au naturel de la captation et l’expérience d’immersion n’est pas optimale.
Les systèmes professionnels corrigent ce défaut : l’électronique embarquée de la KU100 intègre une correction du timbre et les mannequins destinés à la recherche offrent à l’utilisateur des solutions logicielles d’équalisation.

Coloration

Notre perception de l’espace sonore est basée sur l’analyse différentielle des indices de temps et d’intensité, mais aussi sur la variation de timbre des sources sonores qui atteignent nos oreilles. Cette variation dépend de la position de la source dans l’espace et de son angle d’incidence vis-à-vis de l’oreille. Autrement dit, la complexité anatomique de l’oreille interfère avec le champ sonore et colore le son pour fournir au cerveau des indices de direction.

Parce qu’elle interfère avec la complexité de notre système auditif, une même source sonore entendue de différentes positions dans l’espace n’arrive pas au cerveau avec le même timbre.

Mais l’oreille est aussi entachée d’une coloration indépendante de la direction. La résonance du canal auditif, notamment, colore autour de 2 kHz sans coder d’espace.
En écoute naturelle, ce défaut de neutralité est corrigé de façon transparente par le cerveau, calibré par des années de pratique permanente. Par contre, lors de l’écoute d’une prise de son binaurale, la résonance du conduit est mise en jeu une seconde fois par l’auditeur. Cette situation équivaut à travailler avec un microphone non linéaire. Le registre médium est faux et cette sensation nous éloigne de l’écoute naturelle.

EqMatching

Nous pouvons tout à fait travailler la réponse en fréquence du système de prise de son binaural avec nos outils habituels. Nous pouvons l’équaliser, à l’oreille tout simplement. Mais cette étape peut aussi s’envisager avec une plus grande précision, grâce à la technique d’eqMatching notamment.
L’eqMatching consiste à automatiser l’équalisation d’un son ” cible ” à partir de l’analyse d’un son ” référent “. En général, le nombre et le choix des filtres ne sont plus du ressort de l’utilisateur.
Outil un peu marginal, destiné à plaquer une ” couleur sonore ” sur un son ou même un mix, l’eqMatching peut être d’un grand secours pour l’équalisation des systèmes binauraux, car il est particulièrement précis. Et nous avons besoin d’être précis, parce que nous allons toucher à la couleur sonore et que la couleur sonore règle la spatialité.

Nous voulons enlever le défaut de timbre de la prise de son, pas les indices binauraux.

Pour ne pas abimer les caractéristiques de projection sonore, il faut donc une référence pertinente. Quelle est-elle ?

Référence

S’il s’agissait d’un microphone standard non linéaire en fréquence, il ” suffirait ” de mesurer sa réponse en fréquence en condition anéchoïque avec un bruit large bande, face à une enceinte de qualité elle-même linéarisée. Le son de référence serait un bruit large-bande ou un sweep. La réponse du microphone serait comparée par l’outil d’eqMatching au signal initial et le plug-in produirait la courbe d’équalisation inverse qui permettrait de neutraliser les défauts de réponse de microphone. Simple, mais pas tout à fait facile à réaliser dans la vie courante.

Avec un microphone binaural — une tête —, c’est pire : nous devons distinguer le défaut de linéarité imputable au système des variations de couleur imputables à la spatialité. Encore une fois, nous voulons seulement ôter la non-linéarité indépendante de la direction, c’est-à-dire commune à toutes les directions.
Nous avons donc besoin cette fois d’observer les contributions pour toutes les directions. Autrement dit, je dois déplacer l’enceinte tout autour de la tête, dans la sphère 3D, et réaliser un certain nombre de mesures. La moyenne de ces mesures révèle une composante commune : la réponse en fréquence du système. C’est bien cette réponse qui permet de mettre en œuvre un moyen de compensation.

Equalisation champ diffus

En conséquence, c’est à partir de la mesure en chambre sourde de l’HRTF du système de prise de son que se calcule cette composante commune à toutes les directions. L’équalisation qui en résulte est dite ” champ diffus ” puisqu’elle découle des contributions communes à tout l’espace (vu comme le champ diffus).
Le filtre de compensation peut être exporté sous la forme d’une réponse impulsionnelle et mise en œuvre dans un moteur de convolution cette fois : la tête binaurale est corrigée.
La mesure d’HRTF a fait des progrès et, au-delà de l’approche acoustique, des solutions plus abordables pourraient être opérationnelles à court terme (calcul à partir d’un scan 3D ou d’une vidéo circulaire, par exemple).

Clone

En attendant, l’ingénieur du son qui voudrait équaliser sa propre tête ou une tête de sa fabrication avec les moyens du bord n’a pas tellement d’autre choix que d’enregistrer la même scène sonore (spectre le plus large-bande possible), simultanément avec une tête de référence et celle à corriger. Si la scène est parfaitement reproductible, chaque tête sera mesurée à la même place, à tour de rôle. Sinon, il faudra les placer assez proche pour que les points de vue coïncident, pas trop proches pour qu’elles n’interfèrent pas. Les deux flux binauraux obtenus alimenteront l’outil d’EqMatching.

Deux exemples

Avec ces deux exemples, nous allons comparer le timbre de la KU100 et celui d’un autre mannequin, prénommé Vlad, équipé d’excellents capteurs, mais non équalisés en natif. Nous comparons :

  • le son de la KU, équalisée nativement par Neumann
  • le son brut de Vlad
  • l’équalisation de Vlad via une réponse impulsionnelle de compensation calculée à partir de la mesure d’HRTF de Vlad
  • l’équalisation de Vlad par EqMatching avec la KU en référence

Dans le premier exemple, un groupe de femmes réagit dans une salle de théâtre en gradins. Les deux mannequins sont l’un derrière l’autre chacun sur un fauteuil ; un rang les sépare.

Public féminin – Référence KU100
Public féminin – Vlad sans équalisation
Public féminin – Vlad équalisé champ diffus par IR calculée à partir de l’HRTF
Public féminin – Vlad équalisé par EqMatching avec la KU100 en référence

Dans le second exemple, quelqu’un attaque une poutre à la tronçonneuse dans une petite église ; la poutre est au sol. Les deux mannequins sont à proximité l’un de l’autre.

Tronçonneuse – Référence KU100
Tronçonneuse – Vlad sans équalisation
Tronçonneuse – Vlad équalisé champ diffus par IR calculée à partir de l’HRTF
Tronçonneuse – Vlad équalisé par EqMatching avec la KU100 en référence

Ces lecteurs audio ne sont pas forcément pratiques pour une comparaison instantanée. Les fichiers peuvent être téléchargés ici :

Filtres

Comparons, pour finir, les réponses en fréquence des deux mannequins pour nos deux exemples :

Voyons maintenant l’équalisation de compensation produite par l’outil d’EqMatching :

Ces valeurs sont intéressantes à comparer aux préconisations de DPA pour l’adaptation du flux binaural à l’écoute sur enceintes :

480 Hz Low shelf, Gain = +2 dB
4 kHz Bell, Gain = -11 dB, Q = 1
8 kHz Bell, Gain = +8 dB, Q = 2
Master gain = 0 dB

Il s’agit pour DPA de compenser l’effet de l’HRTF quand, jusqu’ici, nous avons parlé de limiter l’effet d’un doublement d’une partie de l’HRTF lors de l’écoute au casque. Les ordres de grandeur sont équivalents.

Catégories : Expertise