Par Jean-Marc Plantefève

Délai interaurale

La vitesse du son dans l’air est d’environ 343m/s. Si une source se trouve 5m à droite et 5m devant des oreilles espacées de 20cm, le son arrivera 0,41ms plus vite à l’oreille droite.

Il s’agit d’un délai pur puisque cela concerne toutes les fréquences sonores. Toutefois, la localisation par délai interaurale (Interaural Time Difference ou ITD) deviendra délicate au-dessus de 2000Hz, à moins qu’il y ait modulation à plus basse fréquence. A noter qu’au-dessus de 2000Hz, la tête faisant une ombre sonore, une différence de niveau interaural (Interaural Level Difference ou ILD) prend le relais.

Enveloppe temporelle

Voici un « Ah ! » de Nathalie Manfrino interprétant la Marguerite de Faust (2’29 »). La graduation est en secondes et la capture représente 230 millisecondes. L’enveloppe contient un groupe de fréquences modulées en amplitude et fonction de l’instrument ou de la voix en question, ce groupe de fréquences définit hauteur et timbre. Si la différence de temps interaurale vient d’être évoquée, on devine sur cet enregistrement stéréophonique qu’une différence d’enveloppe servira aussi la reconstitution par le cerveau de la scène sonore.

Les transitoires qu’on peut désigner en attaques, corps et extinctions, sont notamment par leurs durées respectives, l’essence de toute production musicale. A l’intérieur de l’enveloppe, le taux instantané maximal de montée du signal est fonction de la fréquence maximale. Considérons un sinus à 20kHz d’une source numérique échantillonnée à 44,1kHz, la dérivée d’un tel signal donne 12,6% de la pleine échelle par microseconde. Sur un amplificateur de 40W, cela correspond à un maximum de 3,14V/µs.

Spectre fréquentiel

Le signal musical est riche en sinusoïdes à fréquences multiples et peut être représenté en spectre à deux dimensions, fréquence et amplitude, ou à trois dimensions où vient s’ajouter les enveloppes temporelles de chaque fréquence.

La décomposition sinusoïdale permet d’utiliser les outils facilitateurs que sont les nombres complexes et leur exploitation vers des diagrammes de réponses en fréquence.

Un sinus mathématique déroule sa phase dans le temps au rythme des rotations sur le cercle trigonométrique. En régime permanent, suivant le point d’observation on peut parler d’avance ou de retard de phase. En régime transitoire sur un composant de la chaîne audio, il y a causalité et les décalages entre entrée et sortie seront tous des retards.

Systèmes en retards

Un amplificateur, un haut-parleur, un filtre, une enceinte, sont donc des systèmes qui ne peuvent réagir qu’à la suite d’un stimulus, sans le devancer. Nous avons vu qu’un signal audio peut se décomposer en une somme de signaux de différentes fréquences et de différentes amplitudes. En plus de ces deux caractéristiques fréquentielles, il faut considérer le décalage de phase qu’induit le système.  Le comportement en déphasage suivant la fréquence entraîne un retard de phase sur une sinusoïde et un retard de groupe sur l’enveloppe modulée de la sinusoïde.

Prenons pour exemple un filtre à 12dB par octave. Croisement des réponses en amplitude des passe-bas « Tl » et passe-haut « Th » à -6dB pour obtenir une somme passe-tout « T », à condition qu’une voie soit inversée en polarité, ici dans une définition négative de la transmittance du passe-haut.

Les trois déphasages respectifs calculés se superposent et évoluent de 0° à -180°. Passe-bas et passe-haut sont dit à phase minimale, le déphasage n’est pas supérieur à ce qu’indique les pentes de la réponse en amplitude. C’est le cas pour un haut-parleur.

Quand le déphasage mesuré est supérieur à la phase minimale, on parle de surcroît de phase, rencontré après un temps de vol acoustique ou comme avec cette somme passe-tout qui n’est pas à phase minimale. C’est doublement le cas pour une enceinte multivoie.

Un déphasage est assimilable à une portion de période sur le signal sinusoïdal, le délai de phase. La pente de la réponse en phase indique la relation temporelle entre un groupe de fréquences, le délai de groupe. Ci-dessous pour la sortie passe-tout.

Une fois en chronogramme, voyons où reconnaitre ces deux délais. Ici, un signal à 1kHz modulé à 125Hz. L’analyse spectrale révèle un groupe de deux fréquences, 875Hz et 1125Hz.

On voit le sinus 1kHz de sortie décalé de 0,25ms : c’est le délai de phase. On voit l’enveloppe de sortie décalée d’environ 0,16ms : c’est le délai de groupe. Valeurs en accord avec le graphe ci-dessus.

Distorsion temporelle

Une variation de phase amène une distorsion du signal, si sa pente n’est pas constante sur un axe fréquence linéaire. C’est le cas à propos de la somme passe-tout du filtre vu ci-dessus. Sur ce train d’ondes à 1kHz, on voit attaque et extinction dénaturées sur le signal sortie.

Si sa pente est constante sur un axe fréquence linéaire, alors les relations temporelles invariables amènent à un retard pur non déformant sur l’ensemble du signal. Ici une source parfaite distante de 1m.

On parle de phase linéaire où délai de groupe et délai de phase sont à toutes fréquences égaux au délai pur. Bien sûr, quand la pente est nulle, il n’y a pas de délai. Ici, le délai de 2,9ms en cohérence avec la célérité dans l’air de 343m/s.

Il y distorsion de phase quand délai de groupe et délai de phase sont différents, on peut alors préférer parler de distorsion temporelle.

Pour une enceinte multivoie, un délai pur ne sera pas une distorsion à condition qu’il soit identique à chaque transducteur. Les centres émissifs aux haut-parleurs doivent donc être à équidistance du point d’écoute, sous peine d’avoir une réponse « passe-tout » malmenée en niveau comme en délai de groupe.

Par ailleurs, sol et murs font intervenir d’autres délais en renvoyant des ondes décalées. Cela peut générer des interférences, en réjection quand il y a opposition de phases entre émission et rebond décalé, en surcroît de 6dB quand les phases sont identiques.

Jean-Marc Plantefève.