v.2 - pedagogie.ac-aix-marseille.fr€¦ · web viewtraitement de l’information. ... puisque le...
TRANSCRIPT
Lycée Pierre Mendès FranceAvenue Yitzhak RabinBP 1713741 VITROLLES CEDEX
DATE : 11/05/2023 EDITION : 1
REDACTEURDDU
RELECTEURROD
CHARGE DE COURSDDU
BAC PRO SENSystèmes Electroniques Numériques
Savoir 2Titre: Traitement de l’informationSous savoir: S2.2Titre: Traitement de l’information
Sous titre: Compression / décompression numérique.
Niveau : 3
S2-2 TRAITEMENT DE L’INFORMATION
Traitement de l’information
Codec, MP3
A. Un son, une vibration !
Par exemple, voici l'aspect de la vibration de la note LA (celle que vous avez en
frappant un diapason ou en décrochant votre téléphone) :
Pour numériser (ou "digitaliser") ce signal, l'ordinateur en mesure la valeur
régulièrement :
Chaque point bleu correspond à une mesure effectuée par l'ordinateur
COMPRESSION/DÉCOMPRESSION NUMÉRIQUE (MP3) PAGE 2 SUR 13
S2-2 TRAITEMENT DE L’INFORMATION
En qualité CD Audio, l'ordinateur va prendre 44100 mesures par seconde. On dit alors
qu'on échantillonne à 44100 Hertz (ou 44100 Hz, ou encore 44,1 kHz).
C'est exactement ce qui se passe quand l'ordinateur enregistre un fichier WAV : les
valeurs mesurées sont enregistrées dans le fichier :
0.33/ 0.67/ 0.8/ 0.98/ 0.82/ 0.71/ 0.4/ 0.1/ -0.45/ -0.63/ -0.87/ -0.99/ -0.79/ - 0.47 etc...
Pour rejouer le fichier WAV, l'ordinateur recréé le signal à partir de chaque valeur
enregistrée :
Tous les sons qui nous entourent (musique, bruits...) sont des vibrations que l'on peut
échantillonner de cette manière.
Par exemple,
Le problème, c'est qu'il faut enregistrer un très grand
nombre de valeurs pour chaque seconde de son. Il faut
beaucoup de mémoire et beaucoup de place sur le disque
dur.
Il a donc fallu trouver des moyens pour gagner de la place .
On essaie de compresser le signal, c'est à dire d'utiliser
moins de données pour mémoriser la même information.
COMPRESSION/DÉCOMPRESSION NUMÉRIQUE (MP3) PAGE 3 SUR 13
S2-2 TRAITEMENT DE L’INFORMATION
Dans notre premier exemple - le LA du diapason - on voit bien qu'il y a une répétition.
En fait, le signal vibre 440 fois par seconde. On dit qu'il est à 440 Hz
Vibration à 440 Hz
A 800 Hz, la vibration est deux foix plus rapide et le son plus aigu :
Vibration à 800 Hz
On peut mélanger ces deux signaux (440 Hz et 880 Hz) :
Plutôt que d'enregistrer tous les échantillons (toutes les valeurs) de ce signal, on
pourrait n'enregistrer que les valeurs 440 et 880 :
440 880
Ainsi, avec seulement 2 valeurs, on peut reconstituer le signal !
440 880
Devient
COMPRESSION/DÉCOMPRESSION NUMÉRIQUE (MP3) PAGE 4 SUR 13
S2-2 TRAITEMENT DE L’INFORMATION
La transformation mathématique qui permet de trouver toutes les fréquences constituant
un signal est appelé transformée de Fourrier .
Par exemple :
C'est sur ce principe qu'est basé le format MP3 :
on enregistre les différentes fréquences qui composent un signal et on les note dans le
fichier MP3.
Pour rejouer le son (ou la musique), on prend la liste des fréquences, on recréé des
signaux de différentes fréquences et on les mélange. Le son est reconstitué.
COMPRESSION/DÉCOMPRESSION NUMÉRIQUE (MP3) PAGE 5 SUR 13
S2-2 TRAITEMENT DE L’INFORMATION
De plus, les logiciels qui crééent des fichiers MP3 se basent sur un modèle psycho-
acoustique pour supprimer certaines fréquences.
En effet, l'oreille humaine (et le cerveau) ne perçoivent pas certains sons (fréquences
très proches, sons faibles couverts par d'autres sons, etc.). Ils sont supprimés.
Ce modèle psycho-acoustique faite toute la différence entre les différents encodeurs
MP3.
L'encodeur MP3 qui possède le meilleur modèle psycho-acoustique est celui de
l'université Fraunhofer IIS , commercialisé dans certains logiciels (.mp3 Producer par
exemple).
Cela lui permet d'avoir une meilleure qualité sonore que les autres encodeurs, en
particulier dans les forts taux de compression.
B. Le MPEG ½ Audio Layer 3 !
Le MPEG-1/2 Audio Layer 3, plus connu sous son
abréviation de MP3, est la spécification sonore du standard
MPEG-1, du Moving Picture Experts Group (MPEG).
C'est un algorithme de compression audio capable de réduire drastiquement la quantité
de données nécessaire pour restituer de l'audio, mais qui, pour l'auditeur, ressemble à
une reproduction du son original non compressé, c'est-à-dire avec perte de qualité
sonore significative mais acceptable pour l'oreille humaine. L'extension de nom de
fichier est .mp3 et le type MIME est audio/mpeg1. Ce type de fichier est appelé
« fichier MP3 ».
Un fichier MP3 n'est soumis à aucune mesure technique de protection (cf. gestion
numérique des droits).
En 1991, deux formats étaient disponibles :
MUSICAM (Masking pattern adapted Universal Subband Coding And
Multiplexing), basé sur un pur codage psycho-acoustique et un banc de filtres
adaptés aux sons de type percussifs ;
ASPEC (Adaptive Spectral Perceptual Entropy Coding), qui introduisait la
technologie de codage entropique.
COMPRESSION/DÉCOMPRESSION NUMÉRIQUE (MP3) PAGE 6 SUR 13
S2-2 TRAITEMENT DE L’INFORMATION
Le format Musicam conçu par le CCETT, Philips et l'IRT fut choisi par l'ISO MPEG
Audio dirigé par Hans-Georg Mussman en raison de sa structuration modulaire en
plusieurs couches de codage [Layers], sa simplicité de mise en œuvre côté décodeur et
sa grande tolérance aux erreurs de transmission.
Hans-Georg Mussman, reprit des idées de Musicam et d'ASPEC, ajouta de nouveaux
outils technologiques et créa le format MP3 (Layer III ou couche III), conçu pour être
de même qualité à 128 kbit/s que le MP2 à 192 kbit/s.
Les équipes de normalisation procédèrent à de nombreux tests subjectifs en double
aveugle sur de nombreux matériaux sonores pour déterminer le niveau de compression
approprié pour les diverses couches de l'algorithme. On a notamment utilisé Tom's
Diner, la chanson de Suzanne Vega comme séquence de test pour l'algorithme de
compression du MP3. Cette chanson a été choisie à cause de sa finesse et de sa
simplicité, qui facilite la détection des imperfections du codec.
C. L’utilisation des MP3!
Ce format populaire de compression audio permet une compression approximative de
1:4 à 1:12. Un fichier audio occupe ainsi quatre à douze fois moins d'espace une fois
compressé au format MP3. La réduction de taille facilite le téléchargement et le
stockage de données musicales sur un support numérique, tel qu'un disque dur ou une
mémoire flash.
Il a également été largement mis en œuvre en diffusion numérique dans les récepteurs
T-DMB Radio dont la spécification a été adoptée par l'ETSI en 2005. En effet le MP3
appartient à la même famille de norme MPEG Audio que le MP2 utilisé en
radiodiffusion numérique (TNT et T-DMB Radio). Un simple transcodage binaire du
format MP2 audio diffusé au format MP3 enregistré est réalisé dans les terminaux T-
DMB, autorisant ainsi la mise sur le marché de terminaux baladeurs/récepteurs
audionumériques.
COMPRESSION/DÉCOMPRESSION NUMÉRIQUE (MP3) PAGE 7 SUR 13
S2-2 TRAITEMENT DE L’INFORMATION
D. Technique de codage :
Le taux de compression peut être augmenté en choisissant un débit binaire (en anglais
bitrate) plus faible. On considère en général qu'il faut au moins 128 ou 192 kilobits par
seconde (kbit/s) pour bénéficier d'une qualité audio acceptable pour un morceau de
musique. À 8 kbit/s, le son devient fortement altéré (bruits parasites non attendus,
spectre "sourd", …).
Ce format de données utilise un système de compression partiellement
destructif. Il ne retransmet pas intégralement le spectre des fréquences audio. En
revanche il tente d'annuler d'abord les sons les moins perçus de façon à ce que
les dégradations se fassent le moins remarquer possible. Ce n'est pas une
compression à proprement parler, mais plutôt une suppression d'informations.
Compresser un fichier musical provenant d'un CD audio au format MP3 réduit
la qualité. Il suffit de faire plusieurs essais à différents taux de compression pour
constater une baisse progressive de la qualité. (Plus la compression est forte,
plus le son est dégradé.) Une compression correspondant à 64 kb/s donne un son
"enroué" et à 32 kb/s, un son médiocre de qualité "grandes ondes".
Les termes commerciaux de « qualité CD » ou « qualité numérique » ne veulent
rien dire. Déjà parce que le MP3 réduit la qualité (de façon plus ou moins
perceptible) par principe même. Ensuite, parce que « numérique » n'est pas un
critère de qualité (en numérique comme en analogique il existe différentes
techniques de qualités très différentes).
La compression au format MP3 exploite un modèle psycho-acoustique de l'effet
dit de « masque » : si deux fréquences d'intensités différentes sont présentes en
même temps, l'une peut être moins perçue que l'autre selon que ces deux
fréquences sont proches ou non. La modélisation de notre audition selon ce
principe est au départ empirique, mais assez efficace.
Toutefois, si le taux de compression est trop important, on peut être amené à
faire ressortir certaines harmoniques de façon non attendue. Cela donne alors
l'impression de bruits parasites et désagréables au milieu du son.
COMPRESSION/DÉCOMPRESSION NUMÉRIQUE (MP3) PAGE 8 SUR 13
S2-2 TRAITEMENT DE L’INFORMATION
On peut améliorer la qualité à débit moyen égal en utilisant un débit binaire
variable (VBR ou Variable Bit Rate par opposition à un débit constant Constant
bit rate, CBR). Dans ce cas, les instants peu complexes (contenant peu de
fréquences), comme les silences par exemple, seront codés avec un débit
d'information plus faible. Par exemple 64 kbit/s au lieu de 128, réduisant ainsi la
taille totale du fichier tout en gardant une très bonne qualité lors des passages
riches en harmoniques. L'amélioration apportée est variable selon le morceau
codé.
E. Taux de compression :
L'efficacité de la compression des codeurs avec perte est habituellement définie par le
débit binaire, puisque le taux de compression dépend de la taille de l'échantillon et de la
fréquence d'échantillonnage du signal d'origine. Toutefois, les paramètres du disque
compact sont souvent utilisés comme référence (44,1 kHz, 2×16 bits). Et aussi parfois,
ceux du DAT SP (48 kHz, 2×16 bits). Le taux de compression pour cette référence est
plus élevé, ce qui montre la complexité de la définition du terme « taux de
compression » pour les codeurs avec perte.
Layer I : 384 kbit/s, compression 4:1
Layer II : 160..256 kbit/s, compression 6:1..10:1
Layer III : 112..128 kbit/s, compression 12:1..14:1
Ces valeurs ne disent pas grand-chose sur la qualité du résultat obtenu, puisque la
qualité ne dépend pas seulement du format de codage du fichier, mais également de la
qualité de l'algorithme psycho-acoustique utilisé par le codeur. Typiquement, les
codeurs layer I utilisent un algorithme très simple, d'où un résultat nécessitant un débit
supérieur pour un codage transparent.
En considérant de bons codeurs, on obtient :
Layer I codé à 384 kbit/s, même avec ses algorithmes psycho-acoustiques
simples, est meilleur que Layer 2 à 192..256 kbit/s
Layer II codé à 160 ..192 kbit/s est équivalent au Compact Disc
Layer III codé à 112..128 kbit/s est équivalent au Layer II à 192..256 kbit/s.
COMPRESSION/DÉCOMPRESSION NUMÉRIQUE (MP3) PAGE 9 SUR 13
S2-2 TRAITEMENT DE L’INFORMATION
Les débits présentés ne sont donc pas équivalents en terme de qualité, et les qualités ne
sont pas forcément optimales. De plus, la qualité du codeur est un facteur très important.
Ainsi, avec les premiers codeurs, il était généralement admis que 128 kbit/s avec le
Layer III n'avait pas un son excellent, mais tout juste raisonnable. La génération de
codeurs actuels permet d'obtenir un son tout à fait correct à 128 kbit/s avec le Layer III.
Si l'on est soucieux de la qualité et pas seulement du débit, on utilisera plutôt les valeurs
suivantes :
Layer I : excellent à 384 kbit/s
Layer II : excellent à 256...384 kbit/s, très bon à 224...256 kbit/s, bon à
160...224 kbit/s
Layer III : excellent à 224...320 kbit/s, très bon à 192...224 kbit/s, bon à
128...192 kbit/s
La stéréophonie a un débit exactement deux fois supérieure à la monophonie si la
qualité est identique pour ces deux modes d'écoute. Le mode stéréo joint diffère de la
stéréo simple car il n'encode pas séparément les deux canaux gauche et droit si les
informations sonores sont identiques, permettant un gain de qualité par rapport à la
stéréo classique avec une même valeur de compression. Le procédé de la stéréophonie
est un encodage dit différentiel de même type que celui utilisé pour la radiodiffusion en
FM stéréo.
E. Qualité du codage :
Étiquettes :
Outre le fait de stocker la musique de façon très compacte tout en conservant une
qualité acceptable, le MP3 apporte une fonctionnalité rarement présente sur les formats
audio qui l'ont précédé : les métadonnées, "metadata" en anglais (données sur les
données). En clair, le fichier MP3 ne contient pas seulement la musique mais peut
également apporter des informations sur celles-ci (telles que l'interprète, le titre, le nom
de l'album, la pochette, les paroles ou du karaoké).
COMPRESSION/DÉCOMPRESSION NUMÉRIQUE (MP3) PAGE 10 SUR 13
S2-2 TRAITEMENT DE L’INFORMATION
Ces informations sont stockées sous forme d’étiquettes (tag en anglais) dont il existe
plusieurs versions.
Le format MP3 initial ne permettait pas de stocker des étiquettes, tout au plus, il
permettait de préciser certains paramètres binaires comme le fait que le morceau soit
protégé ou non par copyright ou le fait qu'il s'agisse d'un original ou d'une copie.
Les étiquettes MP3 sont enregistrées au format ID3 (version 1 ou 2). Les caractères
alphanumériques sont codés en code A.S.C.I.I. soit American Standard Code for
Information Interchange 255 (8 bits, ou un octet). Il autorise donc les majuscules, mais
aussi minuscules et lettres accentuées.
Licence :
Bien que le MP3 soit souvent perçu par l'utilisateur final comme une technologie
gratuite (car il peut en effet coder ou décoder sa musique de manière tout à fait légale
pour peu que l'enregistrement original lui appartienne ou qu'il soit une copie à usage
privé), cette technologie fait l'objet d'une licence.
L'algorithme « MPEG-1 Layer 3 » décrit dans les standards ISO/CEI IS 11172-3 et
ISO/CEI IS 13818-3 est soumis à des redevances (droits commerciaux) à Philips
(entreprise néerlandaise), TDF (entreprise française), France Télécom (entreprise
française), IRT (entreprise allemande), Fraunhofer IIS (entreprise allemande) et
Thomson pour toute utilisation ou implantation physique (notamment sur les baladeurs
MP3).
Logiciels adaptés à la lecture du MP3 :
Sous Windows : Winamp, VLC, Audacity, Foobar2000, Windows Media
Player, iTunes, RealPlayer, Zinf, musikCube, BSplayer, etc.
Sous Mac OS : iTunes, VLC, Audacity, Audion 3, QuickTime, RealPlayer,
Amadeus II, SoundEdit, Sound Studio, Peak, etc.
Sous Linux : Xmms, Audacity, Amarok, JuK, Listen, Rhythmbox, VLC, Exaile,
Rythmbox zinf, Mplayer, etc.
Sous Palm OS : Pocket Tunes
Matériels adaptés à sa lecture :
COMPRESSION/DÉCOMPRESSION NUMÉRIQUE (MP3) PAGE 11 SUR 13
S2-2 TRAITEMENT DE L’INFORMATION
Les baladeur MP3 : ils permettent d'écouter des fichiers MP3 stockés en mémoire.
Les lecteurs de CD MP3 : ils permettent d'écouter des fichiers MP3 stockés sur des CD.
Des lecteurs DVD ou platines DivX : ils peuvent parfois (et même de plus en plus
souvent) lire des fichiers MP3 sur des CD.
Des récepteurs de radio numérique DAB : ils peuvent parfois lire (et même de plus en
plus souvent enregistrer) des fichiers MP3 sur des cartes mémoires flash.
Des consoles de jeux comme la PSP ou la PS3
Des téléphones portables commes le viewty
Baladeur numérique = Jukebox mp3 :
Le MP3 est le format le plus répandu, lu par tous les baladeurs, mais il est loin d'être le
plus efficace pour compresser les fichiers tout en gardant une bonne qualité d'écoute.
Certains baladeurs permettent de lire les fichiers à des formats plus optimisés : le
format AAC est recommandé pour l'iPod, d'autres baladeurs proposant la lecture du
WMA et/ou des fichiers .ogg. (Libre de droit)
Certains baladeurs numériques disposent de fonctions annexes comme l'enregistrement
audio (dictaphone) ou le tuner FM (pour écouter la radio).
Les baladeurs munis de mémoire flash ou d'un disque dur peuvent se comporter comme
des clés USB et servir de mémoire de masse. Il est alors possible d'utiliser un baladeur
numérique comme unité de sauvegarde et pour transporter des fichiers d'un ordinateur à
un autre.
Les principaux composants d'un baladeur sont :
Une unité de stockage destinée à sauvegarder les fichiers. Elle est
constituée de composants de mémoire flash, d'un disque dur ou parfois d'un CD-ROM.
Les baladeurs à mémoire flash sont plus compacts que les baladeurs à disque dur et ont
généralement une plus faible capacité de stockage (habituellement entre 256 Mo et 32
Go, soit environ 40 à 8000 chansons). Les lecteurs à disque dur comptent entre 4 et 160
Go de mémoire. Ils sont généralement moins cher que ceux à mémoire flash à capacité
égale mais ils consomment plus d'énergie, ce qui réduit l'autonomie de l'appareil, et leur
temps d'accès aux données est plus long.
COMPRESSION/DÉCOMPRESSION NUMÉRIQUE (MP3) PAGE 12 SUR 13
S2-2 TRAITEMENT DE L’INFORMATION
Un processeur spécialisé dans la conversion numérique-analogique associé à un
amplificateur audio.
Un compartiment pour les piles électriques ou une batterie pour permettre un
fonctionnement autonome.
Une interface de communication avec un ordinateur (connecteur USB ou FireWire,
liaison Bluetooth ou WiFi, etc.).
Des boutons de commande et généralement un écran de contrôle. Sur les baladeurs
multimédia, l'écran est plus grand pour permettre la visualisation des vidéos et des
images.
Une prise audio pour des écouteurs.
Pour certains, un petit microphone pour enregistrer des sons.
COMPRESSION/DÉCOMPRESSION NUMÉRIQUE (MP3) PAGE 13 SUR 13
S2-2 TRAITEMENT DE L’INFORMATION
TRAITEMENT DE L’INFORMATION PAGE 14 SUR 14