EN
SE
A
200
6-2
007
Audio
Num
éri
que
1
Laurent Saïd (98)
ST Microelectronics
12, avenue Jules Horowitz
38000 GRENOBLE
06.71.58.40.49
email : [email protected]
1
EN
SE
A
200
6-2
007
Audio
Num
éri
que
2
2
EN
SE
A
200
6-2
007
Audio
Num
éri
que
3Plan de la présentation
Perception-Audition
Signaux Numériques
Précision - Dynamique
Fréquence d’échantillonnage
Conclusion
3
EN
SE
A
200
6-2
007
Audio
Num
éri
que
4Mécanisme de l’audition
• Système auditif périphérique
• Oreille externe:
•transmission aérienne
• Oreille Moyenne:
•transmission mécanique
• Oreille interne:
•transmission hydromécanique
•Transmission électro-chimique
• Système auditif central
• Nerf auditif
• Cortex
EN
SE
A
200
6-2
007
Audio
Num
éri
que
5Anatomie de l’oreille
EN
SE
A
200
6-2
007
Audio
Num
éri
que
6Oreille Externe
Fonction de transfert
EN
SE
A
200
6-2
007
Audio
Num
éri
que
7Oreille Moyenne
1. Marteau2. Enclume3. Étrier4. Tympan5. Fenêtre ronde6. Trompe d’eustache
- (1) Marteau- (2) Ligament du marteau- (3) Enclume- (4) Ligament de l'enclume- (5) Muscle de l'étrier- (6) Platine de l'étrier- (7) Tympan- (8) Trompe d'Eustache- (9) Muscle du marteau- (10) Corde du tympan sectionnée
EN
SE
A
200
6-2
007
Audio
Num
éri
que
8Fonction de Transfert OM
H(f)=Pv/PtPv Pression acoustique au vestibulePt Pression acoustique au tympan
EN
SE
A
200
6-2
007
Audio
Num
éri
que
9Oreille Interne
1. Canal antérieur2. Ampoule (du même canal)3. Ampoule (canal horizontal)4. Saccule5. Canal cochléaire6. Hélicotrème7. Canal latéral (horizontal) 8. Canal postérieur9. Ampoule (canal postérieur)10. Fenêtre ovale11. Fenêtre ronde12. Rampe vestibulaire13. Rampe tympanique14. Utricule
EN
SE
A
200
6-2
007
Audio
Num
éri
que
10Oreille Interne: Coupe de la cochlée
Transmission électro-chimique
Transmission hydromécanique
EN
SE
A
200
6-2
007
Audio
Num
éri
que
11Système Auditif Central
EN
SE
A
200
6-2
007
Audio
Num
éri
que
12Perception de la force sonore
Courbe d’isosonie
EN
SE
A
200
6-2
007
Audio
Num
éri
que
13Effet de masque simultané
EN
SE
A
200
6-2
007
Audio
Num
éri
que
14Bandes critiques
EN
SE
A
200
6-2
007
Audio
Num
éri
que
15Effet de masque temporel
Masquant
Niveau du son « juste masqué »
ProactifRéactif
EN
SE
A
200
6-2
007
Audio
Num
éri
que
16Perception de la hauteur
Stevens & Volkman 1940
Non linéaire
Echelle perceptuelle
)1(log.)( 2 x
xMel
EN
SE
A
200
6-2
007
Audio
Num
éri
que
17Plan de la présentation
Perception-Audition
Signaux Numériques
Précision - Dynamique
Fréquence d’échantillonnage
Conclusion
17
EN
SE
A
200
6-2
007
Audio
Num
éri
que
18PCM : Pulse Code Modulation
Temps
Temps
TempsOpérations lors de la numérisation:
• Echantillonnage
• Quantification
EN
SE
A
200
6-2
007
Audio
Num
éri
que
19Echantillonnage
Théorème
• Shannon (1948)
• Kotel’nikof (1933)
• Nyquist (1928)
• Whittaker (1915)
Théorème de
reconstruction
EN
SE
A
200
6-2
007
Audio
Num
éri
que
20Quantification
Introduit du bruit:
• Corrélé au signal
• Probabilité uniforme
• Puissance f(nombre de pas)
EN
SE
A
200
6-2
007
Audio
Num
éri
que
21Dither soustractif et non-soustractif
Ajout d’un bruit avant la quantification:
Quantification
Channel
-
++
+X(n)
b(n)
Y(n)
Quantification
Channel
++
X(n)
b(n)
Y(n)
EN
SE
A
200
6-2
007
Audio
Num
éri
que
22Dualité fréquence d’échantillonnage - quantification
Amélioration du RSB par sur échantillonnage:• En conversion A/N:
•Filtre analogique à SFe/2•Echantillonnage à SFe•Filtrage / sous-échantillonnage jusqu’à Fe
•En conversion N/A:•Sur-échantillonnage•Filtrage a Fe•Conversion N/A à SFe•Filtrage à SFe
Trois effets
EN
SE
A
200
6-2
007
Audio
Num
éri
que
23Vocabulaire
Transparence:• Quelque soit les modification du signal audio, le résultat
n’est pas perceptible par l’oreille humaine.
Sans pertes:•Les signal transformé est bit exacte.
•Non-réversible:•Des pertes sont volontairement introduites (afin de
compresser par exemple) impliquant:•Plancher de bruit non constant (modulation / masquage
fréquentiel)•Le plancher de bruit est mis en forme selon des critères psycho
acoustiques•L’erreur est corrélée au signal
EN
SE
A
200
6-2
007
Audio
Num
éri
que
24Plan de la présentation
Perception-Audition
Signaux Numériques
Précision - Dynamique
Fréquence d’échantillonnage
Conclusion
24
EN
SE
A
200
6-2
007
Audio
Num
éri
que
25Effet du dithering sur la précision
Spectre d’un signal quantifié sur 16 bits à -90dB de la pleine échelle
EN
SE
A
200
6-2
007
Audio
Num
éri
que
26Perception du bruit de quantification
Bruit de quantification avec dithering sur 16 bits pleine échelle à 114dBspl
Dynamique
EN
SE
A
200
6-2
007
Audio
Num
éri
que
27Cas du CD: Fe=44.1 kHz 120dBspl 16 bits
EN
SE
A
200
6-2
007
Audio
Num
éri
que
28Après le CD: Quantification sans dithering
EN
SE
A
200
6-2
007
Audio
Num
éri
que
29Autres bruits: bruit de fond des salles
Un son à -15dB en dessous du niveau du bruit de fond peut être perçu
EN
SE
A
200
6-2
007
Audio
Num
éri
que
30Autres bruits: bruit d’enregistrement
EN
SE
A
200
6-2
007
Audio
Num
éri
que
31Plan de la présentation
Perception-Audition
Signaux Numériques
Précision - Dynamique
Fréquence d’échantillonnage
Conclusion
31
EN
SE
A
200
6-2
007
Audio
Num
éri
que
32Spectre audible / Fréquence d’échantillonnage
Test d’écoute subjectif:
• x1, x2, x4, x64 FeCD ou FeDAT:
•Hautes Fe préférées
•Pourquoi ?
•Sensibilité acoustique différente si spectre
complexe ?
•Traitement plus simple à ces fréquences ?
EN
SE
A
200
6-2
007
Audio
Num
éri
que
33Perception des fréquences >20kHz
Oreille Moyenne:
• Commence à filtrer passe-bas à partir de ~10kHz
•Plus grand-chose après 20kHz
Cochlée
•Fonctionne Top-Down
•Filtre HF est plus proche du tympan
•Filtre centré sur 15kHz
•Ultra sons par conduction osseuse.
•Des son peuvent être perçus jusqu’à 25kHz (fort niveaux)
•Intermodulation dans la bande (pitch perçu ~20kMEL)
EN
SE
A
200
6-2
007
Audio
Num
éri
que
34Alors, quelle Fréquence d’échantillonnage ?
EN
SE
A
200
6-2
007
Audio
Num
éri
que
35Etendue du spectre audio
Exemple: La cymbale “Crash”
EN
SE
A
200
6-2
007
Audio
Num
éri
que
36Considérations temporelles(1/2)
Lors des test d’écoute a Fe élevée, « c’est mieux »:
• Les graves semblent plus nets
• Le son est:
• plus clair
• plus chaud
•Plus naturel
• Meilleure définition :
• on distingue mieux le premier plan et le deuxième plan
•Mais :
•Haut-parleur sans rendu ultrasonique
•Acuité auditive standard
EN
SE
A
200
6-2
007
Audio
Num
éri
que
37Considérations temporelles(2/2)
Le filtrage anti repliement et de reconstruction:
• Pentes plus raisonnables
• Phase linéaire que dans la bande utile
=> Il est possible de concevoir des filtres causaux
(ou presque) dont la phase est linéaire dans la
bande (apodized filters). Le résultat est très positif
EN
SE
A
200
6-2
007
Audio
Num
éri
que
38Réponses impulsionelles des filtres
EN
SE
A
200
6-2
007
Audio
Num
éri
que
39Plan de la présentation
Perception-Audition
Signaux Numériques
Précision - Dynamique
Fréquence d’échantillonnage
Conclusion
39
EN
SE
A
200
6-2
007
Audio
Num
éri
que
40Conclusion
Transparence:
• PCM 19bits, 52kHz (sans post-traitements)
Qualité:
• Il faut considérer les aspect temporels
• Il faut considérer la chaine de production complète
• Il faut accroitre la dynamique a chaque traitement
L’appareil auditif est un très bon organe de perception.