|
II) LA SYNTHESE SONORE :
HISTOIRE & CARACTERISTIQUES
Merci à C.Bourdoncle et L.Favre pour leur participation à la rédaction de cet article
2.1 Histoire de la synthèse sonore
Au cinquième siècle
avant Jésus Christ, Démocrite a proposé une
théorie atomique de la matière, faite selon lui
d’éléments simples, indivisibles, inséparables :
les atomes. Lucrèce jugeait qu’une telle conception était
nécessaire pour l’esprit. Cette théorie est longtemps
restée spéculative, jusqu’à ce que la chimie
et la physique modernes établissent l’existence d’éléments
chimiques élémentaires, stables, formés d’atomes
identiques, à partir desquels on peut en principe synthétiser
n’importe quelle substance.
Quand ces notions ont-elles revêtu
un sens précis concernant le son ?
Probablement pas chez les Grecs. Pour
Démocrite, la perception était une opération
obscure, fruit de contacts entre atomes externes et internes ménagés
par l’intermédiaire des organes des sens. Les expériences
de Pythagore avec le sonomètre concernaient les relations
entre les sons plutôt que leur structure interne. Mais le son
du cheng, l’orgue à bouche chinois, avec tous ses tuyaux
vibrant ensemble, était déjà complexe.
La polyphonie, apparue au Moyen Age en
Occident, est aussi une forme de synthèse faisant intervenir
les intervalles de quinte, quarte ou tierce, qu’on retrouvera dans
la synthèse de Fourier. Mais la synthèse harmonique a
été réalisée bien avant Fourier (dès
le quinzième siècle, semble-t-il) par les facteurs
d’orgues : dans les jeux de mutation, une seule note est
obtenue par l’ajout de plusieurs tuyaux accordés comme des
harmoniques choisis. La technique est décrite dans le fameux
traité L’Art du facteur d’orgues, rédigé
par dom Bédos de Celles au dix-huitième siècle.
A cette époque, le physicien Sauveur, créateur de
l’acoustique musicale, avait déjà explicité
les composantes harmoniques des sons périodiques et le
mathématicien Euler avait acquis une remarquable capacité
à analyser, à l’oreille, les harmoniques présents
dans tel ou tel son instrumental connu.
A la même période, Van
Kempelen construisait une machine à musique, le Panharmonicon,
pour lequel Beethoven a écrit La Bataille de Victoria,
et une machine parlante où l’opérateur déformait
des cavités flexibles excitées par une anche pour créer
le même genre d’effet que les déformations du conduit
vocal, lors de l’articulation. Il s’agissait déjà
d’une synthèse soustractive.
Le dix-neuvième siècle a
vu l’essor de l’analyse et de la synthèse. L’hypothèse
atomique fut confirmée par les conquêtes de la chimie,
avec Lavoisier, Dalton, Gay-Lussac, Berzelius. Berthelot a réussi
la synthèse de composés organiques, dont on croyait
jusqu’alors la genèse réservée aux êtres
vivants.
Ce même siècle a vu aussi
l’essor de l’analyse sonore. C’est en étudiant la
propagation de la chaleur que Fourier a trouvé son théorème
qui explique mathématiquement la notion de composante
harmonique, et qui donne son fondement et sa justification à
la démarche d’analyse et de synthèse sonore.
Cependant, il a fallu attendre le traitement électrique du son
pour accomplir des synthèses sonores allant au-delà des
mutations de l’orgue.
Vers 1875, deux inventions ont changé
profondément nos rapports avec le son. En 1877, Edison
reproduit le son à partir d’un enregistrement mécanique,
faisant mentir la formule « scripta manent, verba
volent ». Deux ans auparavant, Bell avait réussi
à « téléphoner ». La
conversion électro-acoustique (de l’électricité
au son ou inversement par l’entremise de haut-parleurs ou de
microphones) devait permettre d’exploiter les moyens de
l’électrotechnique, de l’électronique, puis du
numérique pour réaliser des traitements nouveaux du
signal sonore : la « révolution électrique »
était en marche.
Au tournant du vingtième
siècle, Cahill bâtit une imposante centrale électrique
à son, appelée Telharmonium ou Dynamophone : il
espérait diffuser la musique « électronique »
aux abonnés du téléphone. La technologie
électrotechnique était trop lourde pour que sa machine
fût viable. Peu après, Lee de Forest inventa la triode,
pierre angulaire de l’électronique : il l’avait
d’abord appelée Audion, car il visait la production de
vibrations électriques pour obtenir des sons musicaux. Le
premier qui y parvint fut sans doute Léon Termen, avec le Theremin.
Comme avec d’autres instruments électroniques qui apparurent
peu après (le Martenot, 1928, le Dynaphone de Bertrand, le
Trautonium de Trautwein, l’Ondioline de Jenny), l’instrumentiste
façonne la vibration en modifiant les éléments
électriques d’un circuit oscillant.
Divers expérimentateurs ont
« perverti » les techniques d’enregistrement
pour fabriquer des sons (par exemple en faisant tourner des
phonographes à l’envers comme Varèse, Milhaud,
Honegger, Toch, ou en dessinant les pistes optiques de films, comme
l’ont fait Cholpo, Arma, Grainger, McLaren).
Après la Seconde Guerre
mondiale, les techniques électroacoustiques sont exploitées
de façon plus systématique pour la création des
sons. A partir de 1948, Pierre Schaeffer accomplit à Paris des
expériences en vue d’une musique concrète, partant de
sons d’origine acoustique enregistrés, puis modifiés
et montés empiriquement sous le contrôle auditif du
compositeur.
La musique électronique n’a
pas réussi à imiter de façon satisfaisante les
sons instrumentaux, même en effectuant des synthèses de
Fourier fondées sur des analyses préalables. Mais on ne
pratiquait alors que des analyses et synthèses « en
séries de Fourier », c’est-à-dire que l’on
assimilait abusivement les sons musicaux à des sons
strictement périodiques (alors qu’un son n’est musical que
s’il n’est pas strictement périodique). La technologie
électronique ne permettait pas de pratiquer commodément
des analyses et synthèses « évolutives ».
C’est la précision inhérente au traitement numérique
qui a permis de prendre en compte les variations dans le cours même
du son.
En 1957, Max Mathews réalise
aux Etats-Unis le premier enregistrement numérique et la
première synthèse de sons par ordinateur. Des
programmes modulaires, comme Music IV ou Music V, conçus par
Mathews, permettent à chacun de construire le processus de
synthèse voulu. La facture du son doit être explicitée
dans tous ses détails : autrement dit, l’utilisateur
doit spécifier complètement la structure physique du
son désiré. Une telle spécification constitue
une véritable partition intégrale, décrivant
l’élaboration des sons aussi bien que leur disposition dans
l’œuvre. Les programmes modulaires peuvent être complétés
pour y incorporer des possibilités supplémentaires (par
exemple le traitement par ordinateur de sons échantillonnés).
Avec l’avènement du
numérique, les possibilités virtuelles du « son
électrique » paraissent à notre portée :
mais elles ne sont pas données d’emblée. On peut dire
qu’aujourd’hui les limitations de la production sonore ne sont
pas de nature technologique : elles dépendent moins du
matériel, du hardware, que du logiciel, du software,
au sens large (de la capacité à connaître et à
mettre en œuvre les processus conduisant aux synthèses ou aux
transformations appropriées). Il faudrait nuancer
l’affirmation qui précède, car la recherche de temps
réel conduit souvent à restreindre et à
particulariser les possibilités a priori universelles
de l’ordinateur. Mais les conquêtes sonores ne sont pas les
conséquences automatiques de l’évolution technique :
elles résultent de recherches spécifiques. Ainsi, les
ressources de synthétiseurs commerciaux apparus vers 1983
découlent des investigations sur la synthèse des sons
et nullement des seuls progrès de la microélectronique.
La suite de cet exposé repose,
d’une part, sur la définition du théorème de
Fourier et, d’autre part, sur la présentation des différents
modules de génération et de traitement sonores présents
dans un synthétiseur afin de mieux comprendre leur utilité
au sein de la synthèse sonore analogique.
2.2 Un théorème fondamental de la
synthèse sonore : Le théorème de Fourier
Grâce à ce théorème,
une fonction périodique de fréquence f « non
discontinue » peut être reconstituée comme la
somme de composantes périodiques « simples »
(variant sinusoïdalement en fonction du temps) de fréquence
f, 2f, 3f…, avec des amplitudes et des phases appropriées.
(Les sons sifflés sont voisins des sons sinusoïdaux.)
avec
an
= (1/π)
. ∫
-π à π
V(t) . cos (n.t) dt
et
bn
= (1/π)
. ∫
-π
à π
V(t) . sin(n.t) dt
Dans le cas d’une onde
sonore, V représente son amplitude et t l’unité de
temps.
Nous allons maintenant nous intéresser
à une application directe du théorème de
Fourier : les modules de génération et de
traitement sonores. Ils offrent la possibilité :
- de reconstituer un son, au sens de
Fourier (grâce à des réglages minutieux il est
possible de générer les harmoniques souhaités)
- de créer de sons nouveaux plus
ou moins riches en harmoniques
- de décomposer
un son dans le but de supprimer sa fondamentale.
Les possibilités sont immenses
et libre à l’utilisateur de pousser les expérimentations
jusqu’aux limites de son imaginaire.
2.3 Modules de génération et de
traitement sonores
Le synthétiseur analogique est
composé de différents circuits électroniques qui
sont capables de traiter chacun des paramètres qui permettent
de décrire le son (hauteur, harmoniques, amplitudes et
enveloppe du son) :
- un générateur de
fréquence (VCO ou DCO)
- un filtre pour les harmoniques
- un réglage d’amplification
(VCA)
- un réglage du temps d’attaque
(A : attack)
- un réglage du temps de
décroissance (D : decay)
- un réglage du niveau de
maintien (S : sustain)
- un réglage du temps
d’extinction (R : release)
Tous les paramètres d'un
synthétiseur sont contrôlés par une tension : il
suffit donc d'agir sur un potentiomètre pour les faire varier.
Les réglages des quatre derniers paramètres,
c'est-à-dire l'enveloppe (ADSR), peuvent être appliqués
à l'amplification (VCA), au filtre (VCF) ou même au VCO
pour modifier la fréquence du générateur afin
d'obtenir des effets intéressants. Sur les appareils les plus
simples, on ne peut régler l'enveloppe que sur l'amplification
et quelquefois, on ne peut intervenir que sur l'attaque, la
décroissance et l'extinction (ADR), le sustain restant fixe.
Il existe également des générateurs d'enveloppe
ne comportant que l'attaque et l'extinction (AR).
2.3.1 Le générateur de fréquences
(VCO ou DCO)
Le Voltage Controlled Oscillator
est, comme son nom l'indique, un oscillateur électrique
contrôlé en tension. Son but est de générer
une forme d'onde riche en harmoniques (sinus, carré,
triangle ou en dents de scie) afin de permettre un
traitement efficace par la section de filtrage.
|
|
|
|
|
|
Sinusoïde
|
Carré
|
Triangle
|
Dents
de scie
|
Figure 1 : Représentation des 4 formes d’ondes
utilisées dans le VCO
Chaque forme d'ondes (cf. figure 6) de
départ possède une personnalité sonore,
déterminée par son contenu harmonique :
-
Une
sinusoïde
produit un son simple très pur dépourvu d'harmonique
-
Le signal
carré ne contient que des
harmoniques impairs d'amplitude décroissante. Le son brut, un
peu creux, se rapproche d'une clarinette.
-
Le signal
triangulaire ressemble à une
sinusoïde plus riche en harmoniques et le son se rapproche d'un
hautbois
-
Le signal
en dents de scie contient pour sa
part tous les harmoniques d'amplitude décroissante et le son
correspondant est assez riche et cuivré.
Le
type de forme
d'onde
sélectionné dans l'oscillateur
et les réglages du filtre
déterminent le timbre
du son. Le VCO
est utilisé en particulier en synthèse
soustractive.
Vers le milieu des années quatre-vingts, il fut remplacé
par un microprocesseur
dont l'activité est de simuler le fonctionnement de
l'oscillateur
électrique avec infiniment plus de précision. Le
microprocesseur
peut en outre simuler plusieurs VCO
et permettre ainsi l'augmentation de la polyphonie
des instruments ainsi que la réalisation de procédés
de synthèse jusqu'alors impossibles à maîtriser
(synthèse
FM,
synthèse
additive,
etc.). D'autres types de synthèse utilisent néanmoins
d'autres sources que le VCO,
même
si ce terme générique est
souvent
conservé
pour désigner le système de génération
sonore, et la synthèse soustractive peut aussi utiliser comme
source l'échantillon numérique.
2.3.2 Les différents types de filtres pour
les harmoniques
Il existe deux grandes familles de
filtres de coupure (ou VCF) ayant chacune un champ d'action
différent sur le contenu harmonique d'un son et
pouvant être assemblées afin de créer des filtres
hybrides. Le filtre le plus répandu sur les synthétiseurs
soustractifs est le passe-bas qui, comme son nom l'indique,
agit sur les hautes fréquences du signal. L'autre type
de filtre est le passe-haut, ayant une action inverse. Si l'on
connecte en série un filtre passe-bas avec un filtre
passe-haut, on obtient un filtre passe-bande. Enfin, la
mise en parallèle de ces mêmes filtres donne naissance
au filtre à réjection de bande, ou Notch.
L'efficacité d'un filtre est
fonction de sa pente exprimée en décibels par octave
(db/octave) ou en pôle. Le terme " pôle " fait
référence au schéma typique d'un filtre ayant
une pente de 6 db/octave. Ainsi, on trouve des filtres 1 pôle,
2 pôles (12 db/octave), 3 pôles (18 db/octave) et 4 pôles
(24 db/octave) présentés dans la figure 7.
Additionner les pôles revient à
placer des filtres identiques en série.
|
|
|
|
Ouverture
et fermeture d'un filtre 12 db/oct
|
Ouverture
et fermeture d'un filtre 24 db/oct
|
|
|
|
|
Ouverture
et fermeture d'un filtre Passe-bas
|
Ouverture
et fermeture d'un filtre Passe-haut
|
Figure 2 : Représentation des différents types
de filtres
2.3.3 L’interface Homme/Instrument
Cette interface, le clavier (par exemple), est formée
de touches portant chacune deux contacts qui se ferment quand on
presse sur l'une d'elles. Le premier contact permet le passage du
courant à travers une série de résistances de
haute précision. On se trouve donc en présence d'une
sorte de potentiomètre conçu pour envoyer vers le VCO
une tension de commande appelée potentiomètre CV
(Control Voltage), correspondant à la note jouée. Le
deuxième interrupteur ferme un autre circuit laissant passer
une tension identique, quelle que soit la note jouée. Cette
tension, baptisée "Trigger" (en français :
déclenchement) est utilisée comme son nom l'indique
pour le déclenchement de l'enveloppe.
2.3.4 Le control voltage
Il existe deux standards concernant la
tension de commande de l'oscillateur : le standard Volt/Octave et le
standard Volt/ Hertz.
2.3.4.1 Standard Volt/Octave
C'est le plus répandu. Dans ce
standard, la tension de commande du VCO varie de la façon
suivante : le do3 correspondant par exemple à une tension de 3
Volts, on doit envoyer pour obtenir un do4 une tension de 4 Volts
puisqu'il s'agit d'une progression de 1Volt par octave. Entre le do3
et le do4 on notera qu'il y a 12 intervalles égaux (demi-tons)
dans la gamme tempérée qui a été adoptée
par Jean-Sébastien Bach et Rameau vers 1721 à la suite
des théories publiées par l'allemand Verskmeister en
1691 (en fréquence, la progression est géométrique
de raison
soit : 1,05946).
Rappelons que les "tempéraments"
utilisés précédemment par les musiciens ne
permettaient pas de composer dans tous les tons (en particulier en si
bémol majeur et en si majeur). Il s'agissait en effet d'un
tempérament inégal avec lequel les accords sonnaient
faux dans certaines tonalités. C'est pourquoi Jean-Sébastien
Bach a composé une suite de pièces de clavecin
intitulée "le clavier bien tempéré"
pour montrer qu'avec la nouvelle gamme de douze demi-tons égaux,
on pouvait écrire dans tous les tons majeurs et mineurs. Les
différents "préludes et fugues" sont donc
classés suivant la progression des notes : do majeur, do
mineur, do dièse majeur, do dièse mineur, ré
majeur, ré mineur...
Il suffit de diviser 1 Volt par 12 pour
trouver la valeur que l'on doit ajouter à chaque note afin
d'obtenir la tension suivante : soit 0,0833 Volt (progression
linéaire). Ce qui donne les résultats :
do3 3 Volts f =
261,63 Hertz.
do3 dièse 3 +
0,0833 = 3,083 Volts f = 261,63 x 1,05946 = 277,18Hz
ré3
3,0833 + 0,0833 = 3,167 Volts f = 277,18 x 1,05946 = 293,65Hz
Et ce, jusqu'au do6 qui correspond à
une tension de 6 Volts (progression : do1 = 1Volt, do2 = 2Volts, do3
= 3 Volts, do4 = 4 Volts, do5 = 5 Volts, do6 = 6 Volts).
Standard Volt/Hertz
Dans ce standard, la tension de
commande du VCO suit comme la fréquence une progression
géométrique de raison .
Il suffit de multiplier ou de diviser
chaque tension par 1.05946 pour obtenir la note suivante.
On a donc ainsi :
do3 1 Volt f =
261,63 Hertz.
do3 dièse 1 x
1,05946 = 1,059 Volt f = 277,18 Hertz.
ré3
1,05946 x 1,05946 = 1, 122 Volt f = 293,66 Hertz.
Et ce, jusqu'au do6 qui correspond à
une tension de 8 Volts. La progression est la suivante : do3 = 1
Volt, do4 = 2 Volts, do5 = 4 Volts, do6 = 8 Volts.
Bien entendu, un clavier au standard
Volt/Octave ne peut pas commander un synthétiseur au standard
Volt/Hertz à moins de prévoir entre les deux un
amplificateur de tension spécial permettant la conversion d'un
standard à l'autre. Pour faire fonctionner un synthétiseur
à partir du clavier d'un autre appareil, il faut donc disposer
des deux tensions CV et Trigger au même standard.
2.3.5 L’enveloppe sonore
Le générateur d'enveloppe
est un circuit électronique qui se déclenche quand il
reçoit une impulsion provenant soit du module "Trigger",
soit directement du clavier si celui-ci fournit des informations
logiques (gate). Ce générateur délivre alors une
tension de commande continuellement variable qui peut être
dirigée vers le VCA, cas le plus fréquent, mais aussi
vers le VCF ou le VCO. La tension évolue dans le temps en
fonction des réglages de l'attaque (A), de la décroissance
(D), du sustain (S) et de l'extinction (R).
2.3.5.1 Enveloppe appliquée au VCA
Le signal issu du VCF, c'est-à-dire
après filtrage de l'onde d'origine, est envoyé au VCA
avec un niveau constant (cf. figure 8). C'est le VCA (Voltage
controlled amplifier) qui va donner au son l'enveloppe nécessaire
suivant la position des curseurs des potentiomètres de l'ADSR.
Figure
3 : Représentation de la chaîne de création
de l’enveloppe
- A (Attack) :
C'est le temps mis par le son pour
atteindre son maximum d'amplitude (niveau le plus élevé)
à partir du moment où l'on presse sur une touche du
clavier (c'est-à-dire le moment où le contact se
ferme). La durée d'attaque peut passer de quelques
millisecondes à 2 ou 3 secondes (quelquefois plus)... la
tension du générateur varie alors de 0 à 5 Volts
et commande le gain du VCA (sur certains synthétiseurs, la
tension monte jusqu'à 10 Volts).
- D (Delay) :
C'est le temps nécessaire pour
que le son passe du niveau maximum atteint à la fin de la
première phase (Attaque) au niveau déterminé par
la commande du sustain. La durée de cette décroissance
(ou retombée) du son peut s'étendre de quelques
millisecondes à une vingtaine de secondes et parfois plus sur
certains appareils.
- S (Sustain) :
La touche du clavier étant
toujours pressée depuis l'attaque (et, par conséquent,
le contact toujours fermé), cette troisième phase de
l'enveloppe maintient le son, après la période de
décroissance, au niveau déterminé par le
potentiomètre de commande (de 0 à 100%) jusqu'à
ce que la touche soit relâchée et le contact ouvert. La
durée du sustain dépend donc entièrement du
musicien. On notera que si la commande du sustain est placée
au maximum (100 %), la phase précédente est annulée
puisque le son reste toujours au niveau le plus élevé
sans décroître.
- R (Release) :
C'est le temps qui s'écoule
entre le moment où la touche est relâchée et la
disparition complète du son. La courbe de diminution
progressive du signal est en général exponentielle et
la durée est réglable de quelques millisecondes à
une trentaine de secondes ou plus. Cette quatrième phase
permet d'obtenir un effet de résonance ou de réverbération
après le relâchement de la note jouée. Quand il
s'agit d'un bruitage, on dispose ainsi d'un "fading" (fondu
sonore) automatique en augmentant la durée de ce paramètre.
Dans tout ce qui précède,
on a supposé que la touche restait enfoncée assez
longtemps (le contact étant fermé (cf. figure 9) pour
permettre le déroulement complet du cycle de l'enveloppe. Mais
dans la réalité, si le musicien joue une partition avec
des notes tenues (blanches, rondes), il relâche aussi
rapidement certaines notes (croches, doubles-croches).
Figure
4 : Représentation d’une touche enfoncée
Quand une autre touche est enfoncée
avant la fin de l'extinction, celle-ci s'arrête et le cycle
recommence avec la nouvelle note jouée.
Figure
5 : Représentation d’une touche enfoncée avant
la fin de l’extinction de la précédente
Enfin, si une nouvelle touche est
pressée avant que les deux premières phases soient
terminées, le cycle recommence à partir du niveau
atteint par le son dû à la première touche.
Figure
6 : Représentation d’une touche pressée avant la
fin du cycle
Par contre avec les synthétiseurs
polyphoniques, l'extinction continue même si une nouvelle
touche est enfoncée avant que la première soit relâchée
(dans la limite du nombre des voix : 6, 8 ou plus).
2.3.5.2 Enveloppe appliquée au VCF
Sur certains synthétiseurs, il
existe un générateur d'enveloppe complet pour le VCF.
La tension de commande permet donc de modifier la fréquence de
coupure pendant l'émission même du son : quand la
tension croît au moment de l'attaque, la fréquence de
coupure remonte vers l'aigu et laisse par conséquent passer
les harmoniques de rang élevé. Inversement, quand la
tension décroît (Decay), la fréquence de coupure
s'abaisse et le son devient plus doux. On peut ainsi reproduire les
sonorités de certains instruments comme la trompette, dont le
timbre est perçant et agressif au moment de l'émission
d'une note pour devenir plus mat par la suite. Sur les appareils
moins évolués, on se sert du même générateur
d'enveloppe pour le VCA et le VCF, ce qui réduit
considérablement les possibilités. Dans ce cas, le
contrôle du VCF s'effectue par l'intermédiaire d'un
potentiomètre agissant sur la tension de commande et par
conséquent modifiant le niveau de l'effet.
2.3.5.3 Enveloppe appliquée au VCO
(DCO)
On trouve quelquefois un générateur
d'enveloppe destiné au VCO (ou au DCO). La fréquence
peut donc être modifiée au cours de l'émission de
la note, permettant ainsi de créer des effets curieux dans
l'esprit des anticipations musicales du 21ème siècle.
|