IV) SYNTHESES SONORES NUMERIQUES & EFFETS
Merci à C.Bourdoncle et L.Favre pour leur participation à la rédaction de cet article
4.1 La numérisation
Plus récente que la synthèse
analogique, la synthèse numérique utilise un
procédé supplémentaire : un synthétiseur
ou un sampler qui joue des échantillons sonores enregistrés
et mémorisés dans une banque de sons. Il est capable,
en lisant un échantillon plus ou moins vite, de transposer le
son et ainsi de couvrir plusieurs octaves.
Le désavantage de ce type de
procédé est qu’un son est plus court lorsqu’il est
joué plus aigu, plus long lorsqu’il est joué plus
grave, ce qui est incompatible avec un son acoustique dont la durée
est indépendante de la hauteur de la note.
L’avantage certain est que les
sources sonores de base sont infinies, et non plus limitées
par quelques oscillateurs comme dans le cas de la synthèse
analogique.
L'opération de numérisation
(enregistrement depuis une source analogique) se réalise en
deux étapes présentées ci-dessous :
Un ordinateur ne sait gérer que des valeurs numériques
discrètes. Il faut donc échantillonner le signal
analogique pour convertir la tension en une suite de
nombres qui seront traités par l'ordinateur. Le convertisseur
analogique/numérique placé sur les entrées
analogiques de la carte son effectue cette tâche. On passe
ainsi d'un signal à temps continu à une suite discrète
de valeurs mesurées à intervalles réguliers. Le
signal analogique est ainsi découpé en échantillons
(samples). Le nombre d'échantillons par seconde représente
la fréquence d'échantillonnage (Fe) ou sampling rate
exprimée en Hertz (Hz)
C'est
la seconde étape de la numérisation. Après avoir
découpé le signal continu en échantillons, le
convertisseur analogique/numérique (CAN) attribue une valeur
entière et constante (hauteur du palier fig.2) au signal
pendant chaque période Te. La résolution N du
convertisseur (généralement 8-16-20 ou 24) définit
l’ensemble des différentes valeurs possibles attribuables à
l’amplitude du son : plus la résolution est grande (et plus
la fréquence d’échantillonnage est élevée),
plus le son numérisé s’approche du son original.
Codage
sur 8 bits = 2 puissance 8 = 256 valeurs possibles (de
00000000 à 11111111 en binaire-ex : téléphone
fixe)
Codage
sur 16 bits = 2 puissance 16 = 65536 valeurs possibles (CD)
Codage
sur 20 bits = 2 puissance 20 = 1.048.576 valeurs possibles
Codage
sur 24 bits = 2 puissance 24 = 16.777.216 valeurs possibles
Ainsi,
la numérisation
permet de transformer un signal sonore en fichier enregistré
sur support numérique (Cd, disque dur…). Les logiciels
permettent, ensuite, d'effectuer divers traitements comme l'édition,
le nettoyage, le filtrage, l'application d'effets, le mixage…
A
l'issue de ces traitements audionumériques, le fichier obtenu
est traduit en tension afin de pouvoir être écouté
au travers de haut-parleurs.
Exemples :
Téléphone
standard : 11.025 KHz 8bits ; CD : Fe = 44.1 KHz 16
bits ; DVD audio : 192KHz 24 bits
Pratique
de la conversion et phénomène de repli spectral :
La reconstruction d’un signal analogique n'est possible que si les
variations (la fréquence du signal analogique) de celui-ci
sont assez lentes, ou réciproquement si la fréquence
d'échantillonnage est assez élevée, l’amplitude
du signal numérique restant constante pendant chaque période
Te (Fe (Hz) =1/Te(s)).
D'un point de vue théorique, l'échantillonnage
correspond à la "périodisation" du spectre.
En conséquence, l'intégrité du signal est
maintenue tant que les copies (les alias en anglais) du spectre ne se
superposent pas. Le phénomène de recouvrement des
spectres est nuisible et s'appelle le repli spectral (ou
aliasing en anglais).
Pour éviter le repli spectral, il faut que la fréquence
d'échantillonnage soit, au minimum, supérieure à
deux fois la plus grande fréquence du signal échantillonné
(théorème de Shannon). En
pratique, le signal audio utile est limité par notre
perception, c'est-à-dire 16 kHz (20KHz maximum), la fréquence
d'échantillonnage doit donc être de 40 kHz minimum :
On élimine donc toutes les composantes hautes fréquences
à l'aide du filtre anti-repliement (anti-aliasing) du
convertisseur.
Il faut aussi s’assurer d’enregistrer sa source en optimisant la
dynamique sonore (écart entre le son le plus fort et le
son le plus faible en déciBels) pour enregistrer une source
avec la meilleure qualité possible :
-
Si l’amplitude de la source ou
le volume d’enregistrement sont trop importants, le
convertisseur sature : il se produit un écrasement des
pics.
-
Si l’amplitude de la source ou
le volume d’enregistrement est trop faible, le signal enregistré
perd de la dynamique au profit des bruits.
4.2 La MAO et les synthèses numériques
4.2.1 La génération numérique
du son
Les progrès
technologiques au niveau des microprocesseurs et les DSP (Digital
Signal Processor) permettent, aujourd’hui, au grand public de
disposer de moyens virtuels très performants. La plupart des
fonctions des anciens systèmes analogiques sont, maintenant,
intégrées de façon logicielle beaucoup moins
coûteuse et encombrante et surtout sans limitation ou presque
de mémoire (possibilité de faire un grand nombre de
copies-représentations graphiques-Analyses spectrales, etc…).
Les nouvelles
machines « analogiques » (synthétiseurs…)
ont des DSP embarqués et fonctionnent comme des ordinateurs
dédiés au son (ou de pair avec un ordinateur), avec
l’avantage d’une interface clavier/potentiomètres plus
adaptée au jeu de scène.
Certaines synthèses sonores, en
addition, des synthèses FM, additives, soustractives … sont
propres aux systèmes numériques.
4.2.1.1 La lecture d’échantillons
Elle
représente la majeure partie des instruments électroniques
actuels, la lecture d'échantillons est un moyen facile de
fabriquer des synthétiseurs à synthèse
soustractive. En effet, plutôt que de fabriquer des formes
d'ondes originales et évolutives, on crée des timbres
complexes à partir d’une base composée d’une
multitude d'échantillons sonores. Cette technique a rendu très
réalistes les instruments basés sur ce principe. A
cause du caractère reconnaissable d'un certain nombre
d'échantillons, il est parfois difficile de créer des
sons radicalement nouveaux.
Cette
lecture peut être dite « simple » :
les sons sont alors des formes d’ondes stockées en ROM
gardant toujours la même allure au cours du temps (E-Mu Proteus
2, Roland M-VS1..)
Elle
peut aussi être « avancée » :
Dans ce cas, on dispose d’un certain nombre de contrôles sur
le son comme l’enveloppe ADSR ou le LFO (Roland D50, Korg M1…)
Issus
du Mellotron (1962) utilisant le support magnétique, les
échantillonneurs (samplers)
numériques permettent de créer des banques composées
de sons enregistrés par l’utilisateur.
4.2.1.2 La synthèse granulaire
Création
d'une onde sonore complexe à partir de fragments sonores de
l'ordre de la milliseconde.
4.2.1.3 La synthèse par voyageur d’onde
(Wave Traveller)
Elle assure le
contrôle de la durée, de la vitesse et du sens de
lecture d’un son et permet de créer des sons « scratchés »
avec un fichier audio (cf. figure 18). Le son peut être ainsi
très différent de l’original (scratch : Effet
sonore utilisé par les DJ obtenu en contrôlant la
vitesse et le sens de lecture d’une ou deux platines).
4.2.1.4 La synthèse à
modélisation analogique virtuelle
Avec
cette technique, on simule l'architecture de générateurs
sonores propres aux anciennes machines analogiques : les
composants électroniques des synthétiseurs analogiques
n'existent que virtuellement sous forme d'instructions logicielles.
Par ce moyen on échappe aux inconvénients liés à
l'utilisation des circuits analogiques comme l'instabilité de
l'accordage ou la difficulté d'enregistrement précis
des réglages. De plus, la vitesse de calcul des circuits DSP
actuels permet d'aller au delà des performances des premiers
synthétiseurs analogiques.
4.2.1.5 La synthèse à
modélisation physique
La
synthèse par modélisation physique est un procédé
de synthèse acoustique offrant un réel contrôle
expressif du son produit. Elle comprend deux modèles de
synthèses utilisant le même principe mais n'offrant pas
les mêmes contrôles ni les mêmes sonorités :
le procédé dit à oscillations
entretenues est
particulièrement destiné à concevoir des sons
d'instruments à cordes frottées ou à vent. Le
procédé dit à oscillations
libres, est lui
réservé aux sons percussifs et aux cordes frappées.
Cette synthèse utilise comme source des modèles de
phénomènes physiques observés sur des
instruments acoustiques et traduits en algorithmes.
Une
fois l'algorithme choisi (le type de corps d'instrument), le son est
créé à partir de divers paramètres : la
pression produite sur l'instrument, l'embouchure (le bec d'une flûte,
l'archet d'un violon...)… Ces contrôleurs peuvent être
associés de multiples façons. D'autres modules
assistent les contrôleurs tels que l'ajout de souffle, le
filtre (à l'instar de la synthèse soustractive), la
hauteur et le vibrato.
Point
fort :
elle facilite la modélisation des sons d'instruments
acoustiques. Grâce à la modélisation physique,
les fabricants peuvent créer numériquement de nouveaux
types d'instruments, avant de les créer réellement.
Point
faible :
cette forme de synthèse nécessite des ressources
énormes en termes de puissance de calcul et d’espace disque.
La polyphonie (nombre de notes simultanées) se voit donc très
souvent limitée par les ressources du système.
4.2.1.6 La synthèse par morphing
Développée
par le constructeur américain E-Mu, elle est basée sur
l’utilisation des filtres. Elle implique l'utilisation des
technologies numériques, seules capable de générer
les calculs nécessaires. En effet, le morphing ne se limite
pas au classique filtre du 4ème
ordre de la synthèse soustractive, mais offre plusieurs
filtres pouvant atteindre le 14ème
ordre. Le processus de morphing consiste à créer une
variation de l’état de ces filtres au cours du temps. Divers
paramètres permettent de régler la vitesse de
transition, le nombre d'étapes et les profils de filtrage. De
nombreuses possibilités de connexion entre filtres sont
possibles.
4.2.1.7 La synthèse virtuelle
Très
puissante, la synthèse virtuelle se base sur l'utilisation de
l'ordinateur et de logiciels modulaires tels que REAKTOR ou
Synthedit. Elle reproduit sous forme graphique la plupart des
procédés de synthèse et de filtrage et de créer
ainsi de nouveaux instruments.
4.2.2 L’édition numérique du son
Les logiciels d’édition « audio »
permettent l'acquisition (enregistrement sur le disque dur),
l'édition (visualisation du fichier sonore et fonctions de
base : couper, coller…), l'application d'effets sonores, le
traitement des bruits (denoiser, declicker, decrackler, et filtres
divers) (cf. figure 21).
Ils peuvent être complétés par des petits
logiciels additionnels appelés "plug-ins" qui
étendent leurs possibilités. Certains de ces logiciels
reconnaissent les très nombreux plug-ins DirectX ou VST. Cette
caractéristique donne accés à tout un ensemble
de générateurs, de denoisers/decracklers/declickers
(suppression du bruit, des craquements, des cliquetis), d'équalisers,
de filtres et d'effets spéciaux favorisant la réalisation
de "trucages" réalistes pour simuler le son d'un
ampli à lampes, d'un vieux vinyle, …
Figure
7 : Analyse spectrale d’une mélodie avec le logiciel
« Sonic Foundry – Soundforge »
4.2.3 Le séquençage du son
Il existe une multitude de séquenceurs audio. Destinés
au montage, ces logiciels servent à mélanger (mixer)
des échantillons sonores ou à composer des morceaux de
musique. Ils permettent généralement l'import/export
dans les formats audio les plus courants (wav, MP3, aiff...) avec un
nombre de pistes variant de 4 à l'infini. Ils peuvent offrir
des effets intégrés (réverbération,
écho…) ou des outils de création de boucles sonores
(boîtes à rythmes, synthétiseurs).
Ils
fonctionnent :
-
par
échantillons pré-enregistrés (jusqu’à
10 pistes simultanées) : Ce sont, en général,
des logiciels à prix réduits dédiés aux
débutants. On dispose de fichiers « loops »
que l’on peut retraiter grâce à quelques effets
sommaires : faciles d’approche, ils pêchent, à
notre avis, par le manque d’originalité et de diversité
du son.
-
par boucles et par pistes programmables :
Ils offrent la possibilité
d’importer ou convertir des sons aux formats différents, de
créer des mélodies, d’effectuer de nombreux
traitements et effets, de créer des boucles, de synthétiser
des sons, de contrôler des machines ou des éditeurs
externes…
4.3 Les effets sonores
Utilisés
dans la plupart des compositions modernes, ils ont un impact
important sur le caractère du son et peuvent aboutir à
un timbre très éloigné de l’original. Ainsi,
Jimi Hendrix, en les utilisant à outrance, inventa une
nouvelle sonorité de guitare, voire un nouvel instrument
(saturation, wah-wah, Delay…doublé de virtuosité)
qui inspire encore la plupart des guitaristes actuels.
4.3.1 Le contrôle de la dynamique
4.3.1.1 Le compresseur
La compression d'un son consiste à
réduire son amplitude dynamique, c'est-à-dire le
différentiel entre le volume le plus haut et le plus bas d'un
son ou d'un morceau de musique. Ainsi, on baisse le volume sonore
quand il est trop fort et on l'augmente quand le niveau de la source
est trop faible. Cette technique s'applique par exemple dans les
chants ou les percussions (notamment dans la Techno). Globalement, le
son apparaît beaucoup plus fort. Les stations de radiodiffusion
FM ainsi que les chaînes de télévision (spots
publicitaires) l'utilisent couramment.
4.3.1.2 L’expander
Sa fonction est
l'inverse de la compression. L'expansion augmente l'amplitude
dynamique d'un signal audio. Cette fonction met en valeur certains
éléments sonores.
4.3.1.3 Le noise gate (ou porte de bruit)
Programmé
en fonction d’un certain niveau sonore par l’utilisateur, le
noise gate peut soit couper complètement le signal entrant
lorsque le niveau est trop faible, soit le laisser inchangé.
Il atténue la nuisance des bruits (bruit souffle, bruit
d'enregistrement, craquements) qui apparaissent avec des volumes très
faibles ou en présence de blancs. Il permet aussi, suivant les
paramétrages, d'obtenir un effet haché ou d'isoler un
élément sonore (un instrument par exemple).
4.3.1.4 Fade In, Fade Out &
Crossfade
Avec
ces effets on évite l'apparition ou la disparition trop
brusque d'un son.
Le FADE-IN consiste donc à monter
progressivement le volume sonore de 0 jusqu'au niveau nominal dans un
intervalle de temps paramétrable. Ainsi, le son ne brise pas
trop brusquement le silence.
Le FADE-OUT opère à
l'inverse en réduisant progressivement le volume sonore depuis
son niveau nominal jusqu'à 0.
Le CROSSFADE est un
fondu enchaîné mixant 2 sources sonores. On peut passer
de l'une à l'autre en gardant approximativement le même
volume sonore.
4.3.2 Les effets temporels
4.3.2.1 Le chorus
Le
chorus est un effet qui rend possible la multiplication virtuelle
d'une source sonore. Son principe consiste à prélever
une partie du signal d'origine, en lui appliquant un léger
retard (0à100ms), puis à moduler sa tonalité
(ou detune) par l’intermédiaire d’un LFO.
Cet
effet permet, par
exemple, de créer
l'impression d'un choeur à partir d'une seule voix.
Il existe différents
types de Chorus, comme le chorus quadratique, qui module quatre
signaux retardés, chacun avec un décalage de phase de
90°.
4.3.2.2 L’harmoniser
Cet effet démultiplie un
échantillon en modifiant sa tonalité sans en changer la
durée. On obtient alors un accord harmonique à partir
d'une seule source sonore.
4.3.2.3 La réverbération
La réverbération est
composée d'un grand nombre d'échos distincts, appelés
réflexions. Dans un espace acoustique naturel, l’amplitude
de chaque harmonique décroît dans le temps. Cet effet
est dépendant de la taille de la pièce, de la position
de la source sonore, du matériau composant les murs…
Ainsi, en studio, les pièces
d’enregistrement sont insonorisées et calfeutrées
pour qu'il n'y ait pratiquement aucune réflexion sur les murs.
Ensuite, on ajoute la réverbération pour donner l'effet
voulu.
Il existe 4 grands types de
réverbérations plus ou moins naturelles :
-
Room : c'est une réverbération
d'une pièce d'un studio moyen, assez courte.
-
Hall : c'est une réverbération
d'une grande pièce (salle de concert).
-
Non linéaire :
réverbération artificielle sans amortissement du
volume sonore pendant une durée T puis coupée
abruptement.
Il
est possible de calculer le temps de réverbération
d’une salle en appliquant la formule ci-dessous :
T = 0.16 x V / αmoy
x S
T
= temps de réverbération en s
V
= volume de la salle en m3
S
= surface de la salle en m2
α moy
= coefficient d'absorption moyen de la salle (dépend de la
fréquence du son et du milieu matériel)
4.3.2.4 L’écho
Comme son nom
l'indique, il répète le son original. L'amplitude de
chaque écho décroît progressivement pour donner
un effet d'atténuation. L'écho est calqué sur le
phénomène acoustique naturel présent dans les
zones montagneuses.
Cet effet est très
largement employé pour le traitement des voix intégrées
dans les compositions modernes.
4.3.2.5 Le delay
Le delay est
utilisé pour mettre en valeur un instrument ou une voix. Il
est basé sur la répétition d'un signal
(feed-back=nombre de répétitions) et par un temps de
retard réglable (quelques ms). Suivant le type de delay,
on peut générer un effet ping-pong (répétition
gauche-droite) ou un effet multi-tap (le retard entre chaque
répétition est propre à son numéro).
4.3.3 Les effets fréquentiels
4.3.3.1 Le Flanger
L'effet de
flanging est obtenu en séparant et retardant légèrement
une partie du signal d’origine, puis en faisant varier le temps de
retard avec un LFO. Le signal ainsi déphasé (ou retardé
de 0 à 12 ms de façon non linéaire) est alors
mixé avec le son d'origine pour produire un "bruissement"
(son de type « avion »).
On attribue cette technique à
John Lennon et à son ingénieur du son :
La source sonore
était enregistrée sur deux magnétophones et ils
faisaient varier la vitesse de l'un des deux. Il en résultait
un effet très caractéristique de "rotation "
qui fut très prisé par des groupes "Pop-Rock"
dans les années 70, en particulier pour le traitement des
pistes de batterie et de percussions.
4.3.3.2 Le Vocoder
A l’origine, le vocoder était un dispositif prévu
pour coder puis re-synthétiser la voix afin d'en assurer une
transmission efficace. Les premiers systèmes, loin d'être
parfaits, donnaient à la voix une texture plutôt
"robotique".
Aujourd’hui, cet effet est encore très utilisé dans
la musique électronique. Il s'agit de prendre un signal (la
porteuse) et de le moduler avec un autre signal. L'instrument ainsi
traité semble « chanter » ou «parler ».
4.3.3.3 L’Equalisation
Equalisation :
Elle joue un rôle important dans la finalisation d'un son :
elle favorise le contrôle du timbre ou la coloration du signal
en modifiant la réponse en fréquence du son source. Il
va permettre d’augmenter/diminuer le volume de certaines fréquences
ou bandes de fréquences.
Facteur
Q : c'est la
largeur de la bande de fréquences affectées, rendant
l'équaliser plus ou moins résonant (plus Q est petit,
plus le son est résonnant).
De
nombreuses consoles analogiques ou numériques sont dédiées
à l’équalisation. Au niveau logiciel, l’equaliser
se présente sous 3 formes :

Figure
10 : Equaliseur graphique 30 bandes – amplification du
registre Médium

Figure
11 : Exemple de filtre passe-haut 200 Hz avec atténuation
-15 dB
Figure
12 : Filtre Passe-Bas : coupure à –6 dB pour F >
8 KHz
4.3.4 Autres effets et traitements sonores
4.3.4.1 Le time-stretching
A l’aide de
cette fonction on peut faire varier la longueur d'un échantillon
sans changer sa tonalité. On modifie ainsi un rythme en
faisant varier son BPM (nombre de Battements Par Minute), ce qui est
utile pour harmoniser des boucles ayant un tempo différent.
Néanmoins,
elle n'agit que dans un domaine relativement restreint (différence
son original-son après effet = 10BPM max).
4.3.4.2 Les effets de Pitch
Pitch-Shifting : Il
agit à l'inverse du "Time-stretching". On fait
varier la tonalité d'un échantillon en choisissant ou
non de conserver sa durée.
Beaucoup d’autres
effets existent comme les simulateurs d’amplificateurs à
lampes, les distorsions, les limiteurs, l’effet « wah-wah » ,
l’effet « spatial »…
Ils sont, en
général, dérivés des effets cités
plus haut.
4.4 Tableau récapitulatif des principales
synthèses numériquesLe tableau 3 résume les
principales synthèses sonores numériques avec quelques
uns de leurs avantages ou inconvénients.
Tableau
1 : Résumé des synthèses sonores
numériques, avantages et inconvénients
4.5 Conclusion
Aujourd’hui, les
systèmes numériques sont indispensables et jouent un
rôle prépondérant dans la société
moderne (Communications, Audiovisuel, Médical,….)
En effet, la
production en masse et la réduction du prix des
microprocesseurs ont permis d’ouvrir les champs d’application de
la technologie numérique et de la rendre abordable au grand
public.
Critiquée
lors de ses balbutiements, son utilisation dans les arts est ainsi
devenue incontournable dans des domaines aussi variés que le
cinéma, la photographie ou la musique.
Cette technologie
progresse sans arrêt notamment depuis l’apparition de la
norme MIDI dans les années 80 et les DSP intégrés dans les systèmes de
synthèse sonore récents offrent même des
possibilités de calcul suffisantes pour simuler parfaitement
un instrument acoustique ou une voix humaine…
En effet, tout
système à base de DSP est apte à posséder les avantages
suivants :
-
Souplesse de la programmation : un DSP est avant tout un
processeur exécutant un programme de traitement du signal.
Ceci implique que les traitements numériques peuvent évoluer
en fonction des mises à jour des programmes, et ceci, pendant
toute la durée de vie du produit ou du système. A titre
d’exemple, modifier tel ou tel paramètre d’un filtre
numérique ne nécessite pas un changement matériel.
- Implémentation
d’algorithmes adaptatifs : c’est une autre qualité
issue de la souplesse des programmes. Il est possible d’adapter une
fonction de traitement numérique en temps réel, suivant
certains critères d’évolution du signal (exemple :
les filtres adaptatifs).
- Intégration
d’options propres au système de traitement numérique
du signal. Certaines fonctions de traitement du signal, courantes
aux systèmes numériques, sont difficilement
réalisables, voire impossibles pour un système
analogique (exemple: un filtre du nième ordre).
- Stabilité
: les composants analogiques sont toujours plus ou moins soumis à
des variations de leurs caractéristiques en fonction de la
température, de la tension d’alimentation, du
vieillissement, etc… Une étude sérieuse doit tenir
compte de ces phénomènes, ce qui complique et augmente
la durée de développement. Ces inconvénients
n’existent pas en numérique.
- Répétitivité,
reproductibilité : les valeurs des composants analogiques
sont définies avec une marge de précision plus ou moins
grande. Dans ces conditions, aucun montage analogique n’est
strictement reproductible à l’identique, il existe toujours
des différences qu’il convient de maintenir dans des limites
acceptables. Un programme réalisant un traitement numérique
est par contre parfaitement reproductible, « à l’infini
».
Gageons que les compositions futures
ne seront plus limitées par les performances des machines
mais par l’imagination humaine…
|