Logo-Vidbooster-Vert-2015-513

Quand on doit livrer un programme, que ce soit pour la télévision ou le cinéma, il faut qu’il respecte logiquement certaines normes son. Le but étant évidemment que les niveaux de tous les films soient comparables et que de passer de l’un à l’autre ne génère pas une hausse ou une baisse du volume sonore. C’est surtout en télévision que cette notion de niveau est cruciale, puisqu’on passe d’un programme à l’autre (on notera que les publicités ont des normes légèrement différentes, histoire d’être bien distinctes et mises en valeur par rapport aux autres programmes…).
Au cinéma, on a un peu plus de liberté sur les niveaux, mais il faut quand même produire un son compatible avec les différents systèmes de sonorisation des salles et il faut prévoir un mix spécifique quand le film passera à la télévision.

Mono, stéréo, 5.1, 7.1, etc

5_1Un son peut être produit sur un certain nombre de canaux de diffusion. Il peut être mono, c’est à dire sur un seul canal. Tous les haut-parleurs qui le diffusent joueront alors exactement le même son.

De nos jours, le minimum est de faire un son stéréo, sur deux canaux. Cela permet de créer une spatialisation du son, en déplaçant le son vers un côté ou l’autre.

L’étape suivante a consisté à utiliser 5 canaux (un au centre, un sur chaque côté et deux à l’arrière — comme illustré sur l’image ci-contre). C’est le son 5.1. Le .1 signifie qu’il y a un 6e canal, pour les sons les plus graves, les basses. Pour un son ainsi spatialisé, il faut donc prévoir 6 pistes audios. L’effet peut être saisissant, si c’est mixé finement (ah, le souvenir du premier Jurassic Park en 5.1…).

On est depuis passé au 7.1, qui vous l’aurez compris, rajoute deux canaux (sur les côtés du spectateur). Il existe désormais le 9.1.

binauralmicMais la meilleure spatialisation que je connaisse est pourtant sur deux canaux, en stéréo. Cela s’appelle le son holophonique. La différence se joue sur la prise du son, qui ne peut se faire qu’avec deux micros bien spéciaux… Je n’en dis pas plus, allez écouter quelques morceaux sur cette page, en particulier le coiffeur virtuel. C’est un expérience incroyable…
ATTENTION : pour que cela fonctionne, il faut absolument l’écouter au casque, c’est son gros défaut.

Dolby Surround, Dolby E, THX et autres Atmos

dolbyPour s’assurer que les différentes salles de cinéma diffusent le son des films de façon la plus homogène possible, la société Dolby a eu l’idée géniale de proposer des normes qui englobent toute la chaîne de diffusion sonore : le nombre d’enceintes, leurs caractéristiques techniques, leurs positions, l’acoustique de la salle, etc. Tout y passe. L’avantage, c’est que toutes les salles qui ont un tel label sont assurées de diffuser les films dans des conditions proches de celles utilisées au mixage, et au donc au plus près de la volonté du réalisateur.

Alors les salles font labelliser leurs équipements, les auditoriums sont certifiés, les films doivent aussi obtenir leur licence et tout ce petit monde paie des royalties à Dolby… Jolie combine n’est-ce pas ?

Mais que faire quand toutes les salles et auditoriums sont équipés ? Mettre au point une nouvelle norme, pardi ! C’est pourquoi, Dolby a sorti, par exemple, le Dolby Surround, le Dolby SR, le Dolby Digital Cinema, le Dolby 3D, le Dolby Atmos et maintenant le Dolby Cinema… Différentes normes qui correspondent à différentes situations et que les différents acteurs finissent par cumuler. Sans compter les normes des concurrents de Dolby, comme le DTS ou le THX

Et puis, il y a les normes pour des DVD et les Blu-Ray, comme le Dolby Digital ou le Dolby TrueHD

Certes, avoir des normes est essentiel pour avoir des diffusions des films les plus identiques possibles d’une salle à l’autre et la qualité de la restitution sonore est au rendez-vous, mais il y a une tendance à la surenchère de normes aux royalties non négligeables…

Et Dolby ne s’est pas arrêté au cinéma, et souvent des nombreuses chaînes demandent un son Dolby E. Il permet de gérer simplement les multicanaux (pour la diffusion multilingue), mais son coût n’est pas justifié. En effet, les chaînes paient leur licences, mais les labos aussi, qui répercutent le coût sur les productions. Si vous pouvez négocier de ne pas fournir du Dolby E à vos diffuseurs/distributeurs, l’économie n’est pas négligeable.

En télévision

Voici un exemple typique des normes son demandées par une chaîne de télévision :

Échantillonage : 48 kHz à 24-bits.
Le niveau d’intensité sonore intégré avec seuil mesuré sur le programme complet doit être compris entre -23 LUFS ± 1.
Le loudness range (LRA) mesuré sur le programme complet doit être inférieur ou égal à 20 LU. Une valeur minimum de 5 LU est recommandée.
La mesure du niveau d’intensité sonore court-terme sur les passages du programme comportant des dialogues doit être comprise entre -30 LUFS et -16 LUFS (+/- 7 LU autour du niveau cible de -23 LUFS).
Niveaux maximum permis des crêtes : -3 dBTP (dB True-Peak).

Abscons, non ? Si je ne vais pas tout vous détailler, je vais tenter de vous donner les clés essentielles :

Échantillonage
L’échantillonnage correspond au nombre d’informations sonores enregistrées par seconde. En audiovisuel, on utilise 48 kHz, ce qui veut dire 48 000 informations sonores pour chaque seconde de son (le 96 kHz commence à être utilisé). Attention, en musique, on utilise encore beaucoup le 44,1 kHz, ce qui peut poser certains problèmes quand on utilise un morceau provenant d’un CD audio.
Le 24-bits correspond à la précision de chacune de ces 48 000 informations sonores par seconde. Plus ce chiffre est grand, plus on peut être précis dans la restitution du son. On utilise soit 16, soit 24-bits de nos jours.

Niveau d’intensité intégré
C’est une mesure sur l’ensemble du programme pour s’assurer que son niveau global est stable. C’est une espèce de moyenne du niveau sonore du programme. Cela n’empêche pas d’avoir des moments plus silencieux que d’autres. Sa valeur demandée est souvent de -23 LUFS, ce qui ne vous dit pas grand chose, mais vous en entendrez parler.
Vous noterez que pour les passages dialogués, les niveaux d’intensité doivent rester proches de ce -23 LUFS. Cela a pour but de s’assurer que les dialogues restent audibles. Ce qui sous-entend que les passages non-dialogués peuvent eux s’en éloigner un peu plus.

Loudness Range (LRA)
C’est une autre mesure, qui se concentre sur les variations du son. Il ne doit pas varier trop vite, et doit donc rester sous la barre des 20 LU.

Niveaux des crêtes
C’est tout simplement le volume maximum autorisé (mais que sur des brefs instants).

Toutes ces normes se basent sur les recommandations techniques EBU R 128 (l’EBU étant une organisation européenne qui fait donc des recommandations techniques sur la diffusion télévisuelle).

Notez qu’aux États-Unis, au lieu de faire des mesures sur les niveaux d’intensité intégré en LUFS, ils les font en LKFS (et demandent souvent du -24 au lieu du -23). La mesure est alors faîte uniquement sur les voix, ce qui est plus strict quant à l’audibilité des dialogues, mais plus laxiste sur le reste. La plupart du temps, un programme à -23 LUFS respecte aussi le -24 LKFS, mais l’inverse est plus compliqué.

Tracké du site de Thomas Lavergne