institut supérieur des etudes technologiques de mahdia préparé par : hechkel amina assistant...
TRANSCRIPT
SUPPORT DE COURS:
FONDEMENT DU
MULTIMÉDIA
SUPPORT DE COURS:
FONDEMENT DU
MULTIMÉDIA
Institut supérieur des Etudes Technologiques de Mahdia
Préparé par : Hechkel AminaAssistant Technologue à ISET
Mahdia Année Universitaire : 2010/2011
Mlle Hechkel Amina 2
ELÉMENTS DE CONTENU
Chaîne multimédia : acquisition, traitement, analyse,
synthèse, stockage, intégration, communication, etc.
Transformée de Fourier : TFC, TFD, FFT.
Numérisation : Echantillonnage (Th. De Shannon, CAN,
CNA), Résolution, Quantification.
Perception visuelle et SVH (RGB et systèmes virtuels).
Objets multimédias : textes, sons, images animées,
vidéo (normes, codage, formats).
Outils logiciels.
Mlle Hechkel Amina 3
PLAN
IntroductionIntroduction
Le sonLe son
L’imageL’image
La vidéoLa vidéo
BibliographieBibliographie
Multimédia
Mlle Hechkel Amina 4
PLAN
Introduction
Le sonLe son
L’imageL’image
La vidéoLa vidéo
BibliographieBibliographie
Multimédia
Mlle Hechkel Amina 5
INTRODUCTION : DÉFINITION
Multimédia = multi + média
– Multi : plusieurs
– Média : (medium) milieu de diffusion de l’information
– Coexistence sur un même support de plusieurs médias
(texte, son, image, vidéo)
« Intégration sur un même support de données de
différents types en vue de leur manipulation
(éventuellement interactive) à l’aide de l’outil
informatique ».
Mlle Hechkel Amina 6
INTRODUCTION : DÉFINITION
Outil informatique :
– Choix du matériel et du logiciel (Norme MPC)– Traitement numérique– L’ordinateur est à la fois l’outil de :
• Acquisition• Traitement• Stockage• Restitution (communication)
Interactivité :
– L’utilisateur choisit :• Les éléments auxquels il veut accéder• Le moment auquel il accède à ces éléments
Mlle Hechkel Amina 7
INTRODUCTION : DÉFINITION
Les moyens de l’interaction– Les périphériques (clavier, souris, écran,
microphone, …)– Une interface (graphique)– Hypermédia (structure arborescente)
Mlle Hechkel Amina 8
INTRODUCTION : HISTORIQUE
Né dans les années 80 – Microinformatique
– Interfaces graphiques
– Hypercard (Apple)
Rencontre de plusieurs domaines– Audiovisuel
– Informatique
– Télécommunications
– Arts graphiques
Mlle Hechkel Amina 9
INTRODUCTION : HISTORIQUE
Bénéficie des avancées technologiques– Technologies de stockage– Méthodes de compression/Décompression– Puissance de calcul– Transmission de l’information
NTIC : Nouvelles Technologies de l’Information et de la Communication (IT)– Fusion du Multimédia, Internet, Téléphonie mobile
et Télévision numérique
Mlle Hechkel Amina 10
INTRODUCTION : OBJECTIFS
Acquérir, Stocker, Manipuler, Gérer, Diffuser– Des chiffres, du texte, des images, de la vidéo
Besoins – Grandes quantités d’information– Numériser– Compromis
• Stockage• Qualité• Coût• Transmission
Mlle Hechkel Amina 11
INTRODUCTION : OBJECTIFS
Caractéristiques du multimédia (d’après des études psychologiques)– La mémoire humaine est capable de mémoriser
• 10% de ce qu’on lit• 20% de ce qu’on entend• 30% de ce qu’on voit• 50% de ce qu’on entend et voit• 60% de ce qu’on dit• 70% de ce qu’on pratique• 80% de ce qu’on pratique et on expose
– Proverbe chinois : “j’entend et j’oublie, je vois et je me rappelle, j’expérimente et j’apprends
– Volumineuse, complexes (dimension spatiotemporelles)
Mlle Hechkel Amina 12
INTRODUCTION : APPLICATIONS
Potentiel énorme d’utilisation– Se divertir– S’informer– Se former– Communiquer– Vendre...
Applications grand public– Journaux en ligne– Visites virtuelles (de musées)–Encyclopédies– VOD (Vidéo On Demand)– Jeux
Mlle Hechkel Amina 13
INTRODUCTION : APPLICATIONS
Applications professionnelles– Présentation d’entreprise– Commerce électronique– Médecine (aide au diagnostic)– Architecture et bâtiments (simulation)
Mlle Hechkel Amina 14
INTRODUCTION : PROJET MULTIMÉDIA
Recherche et analyse
– Public cible : niveau d’expertise et besoins
– Recherche de contenu
– Contexte d’utilisation (contraintes)
Conception
– Synopsis du projet
Scénarisation (storyboarding)
– Description détaillée des différents éléments multimédia
Prototypage
Développement
Test et validation
Mlle Hechkel Amina 15
INTRODUCTION : LES MÉTIERS
De la production– Éditeurs, producteurs, juristes, prospecteurs
De la création– Auteurs, directeurs artistiques, scénaristes, ergonomes, illustrateurs
De la réalisation– Réalisateurs, directeurs techniques, développeurs (programmeurs,
infographistes, etc.) ingénieurs du son, dialoguistes, testeurs, traducteurs
De l’exploitation– Fournisseurs d’accès, spécialistes réseau, packaging
De la distribution– Commerciaux pour la vente sur support, pour la vente en ligne
De l’utilisation– Bibliothécaires, formateurs
Mlle Hechkel Amina 16
INTRODUCTION : LES MÉTIERS
De la production– Éditeurs, producteurs, juristes, prospecteurs
De la création– Auteurs, directeurs artistiques, scénaristes, ergonomes, illustrateurs
De la réalisation– Réalisateurs, directeurs techniques, développeurs (programmeurs,
infographistes, etc.) ingénieurs du son, dialoguistes, testeurs, traducteurs
De l’exploitation– Fournisseurs d’accès, spécialistes réseau, packaging
De la distribution– Commerciaux pour la vente sur support, pour la vente en ligne
De l’utilisation– Bibliothécaires, formateurs
Mlle Hechkel Amina 17
PLAN
IntroductionIntroduction
Le son
L’imageL’image
La vidéoLa vidéo
BibliographieBibliographie
Multimédia
Mlle Hechkel Amina 18
DÉFINITION : LE SON
Définition 1: C’est un phénomène ondulatoire dû à un
phénomène physique, c'est donc un phénomène continu
(analogique) qui peut-être produit par vibration.
Définition 2: Le son est une onde sinusoïdale produite par
la vibration mécanique d'un support fluide ou solide et
propagée grâce à l'élasticité du milieu environnant sous
forme d'ondes longitudinales.
Par extension, le son désigne la sensation auditive liée à cette
vibration
L'onde sonore est représentée le plus souvent par une courbe
sinusoïdale.
Mlle Hechkel Amina 19
DÉFINITION : SON ET PROJET MULTIMÉDIA
Deux types d’utilisation:
Contenu Sonore
Narration
Description de contenu (voice-overs)
Musique (chanson)
Ambiance sonore
Fond sonore (musique d’accompagnement)
Effets sonores (clic sonore)
Mlle Hechkel Amina 20
PROPRIÉTÉS DU SONLe son sous forme d’onde (spectre de modulation d'amplitude) Fréquence :
• L’inverse de la période (1/p)• C’est la hauteur (grave, aigu)• Nombre de pics (crête) par seconde• Unité : Hz (1 Hz= 1pics par seconde)• Plage audible : 20 Hz - 20KHz
Mlle Hechkel Amina 21
PROPRIÉTÉS DU SON
Les sons dont les fréquences sont plus faibles que la plus petite
fréquence audible (donc, du côté des graves) sont appelés les
infrasons (20 Hz chez l'homme).
Les sons dont les fréquences sont plus élevées que la plus haute
fréquence audible (donc, du côté des aigus) sont appelés les
ultrasons (20 000 Hz chez l'homme).
Les fréquences les plus utilisées par l'Homme sont comprises entre 1
et 3 KHz. Mais, la plage audible est de 20Hz à environ 20 KHz (non
audibles : infrasons et ultrasons)
Largeur de bande : différence entre plus haute et plus basse
fréquence Intensité (volume)
Mlle Hechkel Amina 22
PROPRIÉTÉS DU SON
Intensité (différence de pressions)
L'intensité correspond à l’amplitude (différence de pression).
Exprimée en décibels (dB) qui sont des unités logarithmiques.
Exemples:
Voix humaine : 35 à 70 dB,
Aspirateur : 70 dB,
Trafic automobile intense : 85 dB,
Détonation d'une cartouche 9 mm : 120 dB,
Avion à réaction au décollage : 135 dB,
Amplificateur de grande puissance : 140 dB.
Mlle Hechkel Amina 23
PROPRIÉTÉS DU SON
Timbre: C’est la différence entre deux sons ayant la même
hauteur et le même volume (même fréquence, même intensité) :
c’est la qualité de sensation.
Le timbre dépend de l'intensité des harmoniques qui
accompagne le son fondamental.
Exemple :
Des instruments de musique jouant un do ont des intensités
d'harmoniques différentes. Cela n'empêche pas de reconnaître
ce do qu'il soit émis par une soprane, un piano ou un cor de
chasse.
Mlle Hechkel Amina 24
PROPRIÉTÉS DU SON
Fondamentale et harmoniques
Une onde périodique complexe peut-être décomposée en un
ensemble d’ondes périodiques simples. Ainsi, un son est, en
général, un mélange de fréquences dites " harmoniques " qui sont
des multiples entiers de la fréquence de base.
• Calcul des harmoniques : Transformée de Fourier – Signal
analogique
Signal analogique:
Signal discret :
Mlle Hechkel Amina 25
PROPRIÉTÉS DU SON Vitesse de son
La vélocité du son varie suivant le milieu dans lequel il se
propage. Le principal facteur de la variation est la densité de ce
milieu : dans un gaz, sa vitesse est plus faible que dans un liquide.
Par exemple, le son se propage approximativement à 343 m.s-1
dans l'air et à 1500 m.s-1 dans l'eau.
Mlle Hechkel Amina 26
NUMÉRISATION
Pour pouvoir représenter un son sur un ordinateur, il faut
arriver à le convertir en valeurs numériques : la
numérisation.
C’est la conversion de l’analogique au numérique. On dit
aussi discrétisation d’un signal continu vers un signal discret.
Deux étapes dans la numérisation sont l’échantillonnage
et la quantification.
Les contraintes sont:
Ne pas détériorer le signal analogique.
Limiter l’espace de stockage.
Mlle Hechkel Amina 27
NUMÉRISATION La conversion est obtenue grâce à un circuit électronique intégré appelé
Convertisseur Analogique-Numérique(CAN).
Etapes résumées dans la figure 1 et 2 suivantes.
Exemple de numérisation d’un signal analogique
Mlle Hechkel Amina 28
NUMÉRISATION: ÉCHANTILLONNAGE
Modèle de l’échantillonnage
L’opération mathématique associée à cette discrétisation revient à
multiplier le signal e(t) par un peigne de Dirac Te (t):
Xs (t) = X(t).p (t) = Xs(t). Σk (t – kTe)
Mlle Hechkel Amina 29
NUMÉRISATION: ÉCHANTILLONNAGE
Principe
On prend ainsi des valeurs de e(t) à des intervalles de temps régulier
(tous les Te, période d’échantillonnage) à une fréquence Fe dite
fréquence d’échantillonnage. Plus la fréquence est élevée, plus la
numérisation est de qualité.
Si le spectre du signal d’origine à une fréquence supérieur à Fe/2 :
effet de repliement.
Dans ce cas, il n’est plus possible de retrouver le signal d’origine.
Puisque l’opération d’échantillonnage modifie les caractéristiques
d’entrée. On devra donc respecter la condition de Shannon :
Mlle Hechkel Amina 30
NUMÉRISATION: ÉCHANTILLONNAGE
Principe
Avant d’échantillonner le signal, on applique un filtre pour limiter cet effet de
repliement : Filtre passe bas (filtre anti-repliement) pour enlever les fréquences
supérieures à ½ Fe.
Utilisation du filtre en amont de l’échantillonneur
Mlle Hechkel Amina 31
NUMÉRISATION: ÉCHANTILLONNAGE
Exemple
Pour la musique, la fréquence maximale audible est de 20 kHz, en
comptant très large. La fréquence d'échantillonnage des CD-audio,
de 44,1 kHz, respecte bien ce théorème.
Application à la voix en téléphonie : fréquence maximale : 3700 Hz.
Quelle fréquence d'échantillonnage minimale choisir ? Choix d’une fréquence d’échantillonnage
Les fréquences usuelles sont de 44,1 kHz et 48 kHz !!!
Le choix est également fonction des performances de l’oreille
Comme il faut au moins 2 échantillons pour recréer un signal, le
choix sera :
fe ≥ 2 fréquence max (théorème de Shannon ou de Nyquist)
Mlle Hechkel Amina 32
NUMÉRISATION: ÉCHANTILLONNAGE
L’échantillonnage blocage
Une fois le signal filtré et échantillonné, il reste à le quantifier.
On doit maintenir constant la valeur à quantifier afin de
permettre au CAN de traiter l'échantillon et de le numériser. On
appelle cette opération, le blocage. Ce blocage doit être d’une
durée supérieure au temps de conversion.
Chaine de Conversion Analogique numérique
Mlle Hechkel Amina 33
NUMÉRISATION: QUANTIFICATION
Théorie de la quantification
Le signal échantillonné - bloqué peut à ce stade être converti
sous forme binaire (numérique) pour être stocké. Ce codage
s'appelle la quantification. De là vient le nom de la technique :
PCM ("Pulse Code Modulation") ou MIC ("Modulation Impulsion
Codée").
Le rôle de la quantification est de donner une image binaire
d’un signal analogique :
Passage : Analogique – Numérique
Signal Continu – Signal discret
Tension – chiffre
Mlle Hechkel Amina 34
NUMÉRISATION: QUANTIFICATION
Effectué par un circuit intégré (CAN, ADC).
A Chaque valeur mesurée est associée une valeur binaire codée
sur n bits (nombre de bits de quantification).
N bits permettent de distinguer 2n niveaux de tension entre –Vm et
+Vm.
On a ainsi le pas de quantification :
Application :
Un signal de +/- 5 V codé su8 bits, donner le pas de quantification
q.
Réponse : 39 mV.
Mlle Hechkel Amina 35
NUMÉRISATION: QUANTIFICATION
Fonction escalier d’un CAN La caractéristique d’entrée sortie d’un CAN est une
caractéristique en marche d’escalier. Chaque palier a une largeur d’un pas de quantification q. Le passage d’un palier à un autre correspond à une variation de ‘1’ du code.
Le pas de quantification est appelée quantum, il correspond à la résolution du convertisseur. Le quantum est la plus petite variation de tension que le convertisseur peut coder.
Fonction escalier d’un CAN
Mlle Hechkel Amina 36
NUMÉRISATION: QUANTIFICATION
Bruit de quantification
Lors de la quantification, une erreur de codage entre le signal échantillonné et
la valeur du code correspond à un niveau de tension (ce niveau de tension étant la
moyenne des tensions correspondant à ce code) :
Gamme de tension Code unique
Lors du codage, tous les niveaux compris dans la gamme reçoivent le même
code.
La quantification fournie une valeur approximative du signal donc introduit un
bruit :
Rapport Signal Bruit (Signal Noise Ration) :
Mlle Hechkel Amina 37
NUMÉRISATION: QUANTIFICATION
Bruit de quantification
Le rapport Signal/Bruit pour un signal utilisant la pleine échelle vaut environ :
SNR dB =6.N + 2
• Amplitude du signal et rapport S/B :
Le rapport Signal/Bruit S/B=6N+2 est obtenu pour la pleine échelle et diminue
si l’amplitude du signal numérisé est plus faible.
Exemple: un CAN 8 bits travaille sur une plage d’entrée de -5V à+5V :
un signal d’amplitude Smax= 5V sera digitalisé sur 256 niveaux, d’où un rapport S/B
= 6.N + 2 = 50 dB
un signal d’amplitude 1,25V sera digitalisé sur 64 niveaux soit 6 bits, d’où un
rapport S/B = 38 dB pour S/Smax= 0,25 = -12 dB
Mlle Hechkel Amina 38
QUANTIFICATION UNIFORME (LINÉAIRE)
La fonction de quantification uniforme attribue le même niveau à tous les
signaux situés dans une plage de tension donnée : le quantum q est donc
constant.
Le bruit de quantification (ou bruit de numérisation) apparut, diminue si la
précision, c’est-à-dire le nombre de bits N, de la conversion augmente
Mlle Hechkel Amina 39
QUANTIFICATION UNIFORME (LINÉAIRE)
Le nombre de niveaux de quantification est bien-sûr lié au nombre de bits N
du CAN :
Un convertisseur 8 bits quantifie le signal analogique sur 256 niveaux, q =
19,5 mV si E = 5V
Un convertisseur 12 bits quantifie le signal analogique sur 1024 niveaux, q
= 4,9 mV si E = 5V
Un convertisseur 16 bits quantifie le signal analogique sur 65536 niveaux, q
= 0,076 mV si E = 5V
Application:
1. Calculer en Volts le quantum lorsque le signal analogique a une amplitude 10 et la conversion est sur 8 bits. (Réponse : q=20/256=0,078).
2. Le rapport signal/bruit est particulièrement défavorable pour les signaux de petites amplitudes. Une quantification non-linéaire est donc requise.
Mlle Hechkel Amina 40
QUANTIFICATION NON LINÉAIRE Pour obtenir un rapport signal/bruit de quantification constant (ie
indépendant de l'amplitude), il faut évidemment faire varier le pas de
quantification selon l'amplitude.
le pas est petit pour les échantillons de faible amplitude
le pas est grand pour des échantillons de forte amplitude
En téléphonie, la quantification est à pas variable et utilise une courbe
non linéaire appelée “loi A” en Europe et “loi mu” aux Etats-Unis
Quantification non linéaire
Mlle Hechkel Amina 41
FORMATS ET STANDARDS
On peut calculer la taille d’un fichier son comme suit :
Taille(en bits) = Fe * N * D * VAvec :
Fe : Fréquence d’échantillonnage (8 KHz, 44,1 KHz, …etc)
N : nombre de bits de quantification (8 bits, 16 bits)
D : Durée(en s)
V : Nombre de voies (mono : 1 voie, stéréo : 2 voies, quadri,
etc)
On peut aussi calculer le débit :
Débit (en bps)= Fe * N * V
Mlle Hechkel Amina 42
CODAGE
En principe, le codage désigne le type de correspondance que l'on
souhaite établir entre chaque valeur du signal analogique et le nombre
binaire qui représentera cette valeur.
Le type de codage : PCM - Différentiel (delta) - Prédictif - Adaptatif - etc.
Codage PCM (Pulse Coded Modulation)
En français, MIC : Modulation par Impulsions Codées.
Utilisé au départ pour la téléphonie.
Il s’agit de coder chaque échantillon à sa valeur réelle
(contrairement à ce qui se fait dans le codage différentiel).
Mlle Hechkel Amina 43
CODAGE (suite)
Codage différentiel ou codage "delta"
Ce codage consiste à évaluer (coder) la différence entre le niveau du signal à l'instant de l'échantillonnage et le niveau qu'il avait lors de l'échantillonnage précédent.
Standard DPCM (Differential PCM)
Codage différentiel
Mlle Hechkel Amina 44
CODAGE (suite)
Codage prédictif Fonction de prédiction Coder la différence entre la valeur réelle et la valeur prédite Standard : LPC (Linear Predictive Coding/ Codage linéaire
prédictif pour la parole), WarpedLPC. Codage adaptatif
Adapte le nombre de bits au type de variation sonore qu'il détecte. Très utile pour adapter la qualité d'un son à l'encombrement
du réseau qui le transmet. Standard : ADPCM (Adaptative PCM).
Codage par transformation Transformer le signal avant codage Standards : DCT (Discrete Cosine Transform), DFT (Fourier),
DWT (Wavelet)
Mlle Hechkel Amina 45
COMPRESSION DE SON
Un son numérisé est une séquence d'octets en mémoire.
La compression consiste à trouver une séquence d'octets plus
courte dont l'effet sonore soit semblable à celui de la séquence initiale.
Buts de la compression:
Gain de place dans le cas d'un enregistrement,
Économie de bande passante dans le cas d'une transmission,
Gain de temps dans le cas d'un transfert de fichier (Internet)
On calcule ainsi le taux de compression :
Taux de compression (%) = Taille compressé/ Taille originale
Exemple : C= 25/100= 0,25 soit 25 %
Mlle Hechkel Amina 46
ALGORITHME DE COMPRESSION On cite ci-dessous quelques algorithmes de
compression/décompression (Codec) :
Algorithme de compression sans perte
La suite de bits obtenue après les opérations de compression et de
décompression est strictement identique à l’originale, cet algorithme est utilisé
pour nombreux types de données (documents, fichiers exécutables, fichiers
textes).
RLE (Run Length Encoding): Toute suite de bits ou de caractères identiques
est remplacé par un couple :(nombre d’occurrence, bit ou caractère répété)
Exemple : AAAAAAAAZZZEEEE devient 7A3Z4E.
LZW : Codage par dictionnaire (une table de données contenant des chaînes
de caractères), peu efficace pour les images et donne de bons résultats pour
les textes et les données informatiques en général (plus de 50 %).
Mlle Hechkel Amina 47
ALGORITHME DE COMPRESSION
Algorithme de compression avec
perteLa suite de bits obtenue après les opérations de
compression et de décompression est différente de
l’originale mais l’information reste sensiblement la
même, utilisé pour les types de données : images,
sons et vidéos.
MPEG
ADPCM
Mlle Hechkel Amina 48
FORMATS DE FICHIERS AUDIO
Ils sont plus que 50 formats : WAV, MP3, WMA, AAC, OGG, RA,
MIDI,…etc
WAV : Waveform audio format
Développer par IBM et Microsoft (plateforme
Windows),
Conteneur capable de recevoir des formats variés
Il peut être mono ou stéréo.
Extension : .wav
Mlle Hechkel Amina 49
FORMATS DE FICHIERS AUDIO (SUITE)
MP3 : abréviation de MPEG-1/2 Audio Layer 3
Moving Picture Expert Group (Layer 3: couche 3)
La partie audio du MPEG-1 est décomposée en MPEG-1 Audio Layer I, II
et III. Ce dernier format est plus connu sous le nom de MP3 et permet
une compression sur 2 voies audio.
Concurrent de WMA,
Très rapide à l’encodage,
Débit jusqu’à 320 kbps.
WMA (Windows Media Audio)
Alternative au MP3 par Microsoft
Compatible seulement avec les logiciels Microsoft
Suffixe : .wma
Mlle Hechkel Amina 50
FORMATS DE FICHIERS AUDIO (SUITE)
AAC (Advanced Audio Coding) Extension du MPEG-2 Concurrent de WMA par Apple (iPod, iTunes) Compression avec bonne qualité De 8 à 96KHz et jusqu’à 48 canaux Extensions .mp4, .aac, .m4a
OGG Format Open source (libre et gratuit) Amélioration du MP3 (Compression et qualité) Compression selon Vorbis (algorithme différent de MP3, WMA
et AAC) RA (RealAudio)
Format de RealNetworks Application en streaming Grand taux de compression Compatible avec Realplayer uniquement.
Mlle Hechkel Amina 51
SON MULTI-CANAL
Désigne l’utilisation de plusieurs pistes audio en vue de la
restitution sur un système comportant plusieurs enceintes
(baffles) horizontalement (restitution 3D).
Exemple :
Il existe une terminologie associé : deux chiffres séparés par
un point (2.1, 5.1).
1er chiffre: Nombre de canaux principaux destinés à être restituer
sur une enceinte.
2ème chiffre: désigne la présence d’effets basse fréquence destinés
à être restitué sur une enceinte (caisson de basse).
1.0 : monocanal / 2.0 : source sonore stéréo.
Mlle Hechkel Amina 52
APPLICATION
Considérons une chanson de 5 min numérisée avec une carte
son en qualité CD.
1) Calculer le volume occupé par cette chanson en Méga octet.
Pour cette chanson la carte va générer 44100 échantillons par
seconde. Chaque échantillon va occuper 16 bits= 2 octets.
2) Déduire le débit en bps et la capacité d’un CD 700 MOctet
en minutes.
Mlle Hechkel Amina 53
PLAN
IntroductionIntroduction
L’image
La vidéoLa vidéo
BibliographieBibliographie
Multimédia
Le sonLe son
Mlle Hechkel Amina 54
DÉFINITIONS
Lumière: aspect particulaire / aspect ondulatoire
Onde monochromatique : caractérisée par une longueur
d’onde (en A°: Angstrom ou en nm : nanomètre).
Énergie électromagnétique
La couleur est une perception humaine de
l’apparence des objets soumis à un rayonnement
visible ; elle dépend de l’objet comme de la lumière.
Couleurs métamères: composition différente mais
même couleur résultante. 2 objets métamères peuvent ne
pas le rester sous un autre éclairage.
Mlle Hechkel Amina 55
SPECTRE ÉLECTROMAGNÉTIQUE DE LA LUMIÈRE
Mlle Hechkel Amina 56
PERCEPTION VISUELLE
Le système visuel humain
Les rayons lumineux réfléchis se focalisent sur une
zone particulière de la rétine.
La rétine contient environ 150 millions de cellules dont une
centaine de millions de cellules photo-réceptrices: les cônes et
bâtonnets.
Mlle Hechkel Amina 57
PERCEPTION VISUELLE (SUITE) On distingue ainsi 3 types de cônes :
Les cônes S sensibles à des longueurs d’onde courtes (short), les
cônes M sensibles à des longueurs d’onde moyennes (medium) et
les cônes L sensibles à des longueurs d’onde longues (long).
C’est là l’origine de l’aspect trichromatique de la vision des couleurs.
Les cônes L sont sensibles au jaune-vert à rouge, les cônes M au
vert et les cônes S au bleu.
Les cônes S sont les moins nombreux : 64 % L, 32 % M et
seulement 2% S, bleus.
Sensibilité plus grande à l’intensité (luminance) qu’aux variations de
couleur (chrominance)
Mlle Hechkel Amina 58
L’IMAGE – ESPACES COLORIMÉTRIQUES La couleur est une notion subjective
Expériences d’égalisation : comparer 2 sensations lumineuses.
Théorie trichromatique (Young-Helmotz 1801) La couleur est de nature tridimensionnelle: Trois primaires
sont donc nécessaires et suffisants pour produire toute couleur
Métamérisme: possibilité de produire une couleur à partir de primaires différents
Choix des 3 couleurs primaires: Monochromatique Aucune des 3 couleurs ne peut être obtenue par le
mélange des 2 autres Mélange additif : Rouge (R), le Vert (G) et le Bleu (B), Mélange soustractif : Jaune (Y), le Magenta (M) et le Cyan
(C).
Mlle Hechkel Amina 59
SYNTHÈSE DE LA COULEUR
Synthèse additive
• Addition de lumières colorées (rouge + vert=jaune)
• Juxtaposition spatiale ou temporelleR +G= J
R + B = M
B +G=C
R + B + G = W (blanc)
2 couleurs complémentaires produisent du blanc:
jaune et bleu, magenta et vert, cyan et rouge.
Exemple :
J + B = R + B + G = W
Mlle Hechkel Amina 60
SYNTHÈSE DE LA COULEUR Synthèse Soustractive
Principe d’absorption sélective (filtre)
La synthèse soustractive est très souvent associée aux primaires
CMJ (Cyan, Magenta, Jaune).
De l’encre jaune déposée sur une feuille blanche soustrait la
composante bleue à une lumière blanche.
Mlle Hechkel Amina 61
ESPACES DE REPRÉSENTATION Espaces RGB :
En utilisant les travaux de Wright et Guild, la CIE (Commission Internationale de l’Éclairage) a proposé ces 3 fonctions et a adopté trois primaires notées [Rc], [Gc] et [Bc], de longueurs d’onde respectives 700,0 nm, 546,1 nm et 435,8 nm. (L’indice c rappelle CIE).
Mlle Hechkel Amina 62
ESPACES DE REPRÉSENTATION Espaces virtuels :
En 1931, les travaux de Judd ont permis à la CIE d’établir le système
de référence colorimétrique dont les primaires sont virtuelles ou
imaginaires et permettent de pallier les inconvénients du système RGB.
Le système XYZ correspond à un changement de primaires et
s’obtient ainsi à l’aide d’une simple matrice de passage à partir du
système RGB:
X(l) = 2.7690 RC(l) + 1.7518 GC(l) +
1.1300 BC(l)
Y(l) = 1.000 RC(l) + 4.5907 GC(l) +
0.0601 BC(l)
Z(l) = 0 RC(l) + 0.0565 GC(l) + 5.5943
BC(l)
Mlle Hechkel Amina 63
ESPACES DE REPRÉSENTATION
Espaces uniformes : CIE Lab (CIE L*a*b*)
Noté souvent Lab est conçu pour qu’une distance dans
cet espace représente le même écart visuel quelque
soit la région où l’on considère cette distance. Les composantes L*, a* et b*:
a* correspond à un axe Rouge-Vert et b* à un axe Jaune-Bleu L* correspond à la luminance
Mlle Hechkel Amina 64
ESPACES DE REPRÉSENTATION Systèmes perceptuels
Il existe de nombreux systèmes de ce type présentés sous
différentes dénominations telles que ISH, HSL, HSV, TLS, LCH,
LSH, LST, ITS
Ces systèmes se différencient entre eux par l’origine choisie de
l’angle de teinte et par le calcul de la teinte et de la saturation. T: Teinte
S: Saturation
L: Luminance
Le sélecteur de couleur de Photoshop et modes colorimétriques supportés
Mlle Hechkel Amina 65
ESPACES DE REPRÉSENTATION Systèmes de luminance-chrominance pour la vidéo• Permettre le fonctionnement à la fois des téléviseurs NB
et couleur.– Il est en effet nécessaire qu’un téléviseur « Noir et Blanc » puisse
recevoir des émissions couleur. De même, les téléviseurs couleurs doivent pouvoir recevoir les émissions diffusées en noir et blanc.
– il faut pour cela que l’information de luminance qu’il peut décoder soit séparée des signaux de chrominance.
• Utilisé par les standards NTSC (USA et Japon), PAL et SECAM
• Séparation Luminance et Chrominance– Luminance : Y du système XYZ– Chrominance :
C1 = a1(R-Y) + b1(B-Y)C2 = a2(R-Y) + b2(B-Y)
avec a1, b1, a2, b2 spécifiques aux standards NTSC, PAL ou SECAM.
Mlle Hechkel Amina 66
ESPACES DE REPRÉSENTATION
NTSC : (illuminant C, primaires FCC : RF GF BF )– Y = 0,299RF + 0,587GF + 0,114BF– I = 0,74(RF - Y) - 0,27(BF – Y)– Q = 0,48(RF - Y) + 0,41(BF - Y)
YIQ peuvent être aussi calculés à partir des RGB de la CIE ou de XYZ.
PAL : (illuminant D65, primaires EBU : RE GE BE)– Y = 0,299RE + 0,587GE + 0,114BE– U = 0,493(BE - Y)– V = 0,877(RE - Y)
Le standard SECAM définit le système (Y,Cr,Cb) avec
:– Cr = -1.9(RE - Y)– Cb = 1,5(BE - Y)
Mlle Hechkel Amina 67
CONVERSION ENTRE MODÈLES Conversion de RVB vers CMJN
Conversion de RVB vers CMJN
Exemple: Convertir la couleur RGB(0.2,0.5,0) en CMY puis en CMYK.
RGB vers CMY
– C=1-R= 1-0.2= 0.8
– M=1-G= 1-0.5= 0.5
– Y=1-B= 1-0= 1
CMY vers CMYK– K=min(C,M,Y) = 0.5– C=C-K= 0.8-0.5= 0.3– M=M-K= 0.5-0.5= 0– Y=Y-K= 1-0.5= 0.5
Mlle Hechkel Amina 68
CONVERSION ENTRE MODÈLES RGB HSV(TSL) :h[0,360],s,v,r,g,b[0,1]
MAX=max(r, g, b) MIN=min(r,g,b)
Exemple: Convertir la couleur RGB(0.3,0.1,0.25) vers HSV – MAX = 0.3 MIN=0.1– H=60x((0.1-0.25)/(0.3-0.1))+360°= 315°– S=1-(0.1/0.3)= 0.66– V= 0.3
Mlle Hechkel Amina 69
CONVERSION ENTRE MODÈLES RGB HSV(TSL) h[0,360] s,v,r,g,b[0,1]
Exemple: Convertir la couleur RGB(0.3,0.1,0.25) vers HSV – MAX = 0.3 MIN=0.1– H=60x((0.1-0.25)/(0.3-0.1))+360°= 315°– S=1-(0.1/0.3)= 0.66– V= 0.3
Mlle Hechkel Amina 70
CONVERSION ENTRE MODÈLES: EXERCICE
Compléter le tableau suivant sachant que: R,G,B,C,M,Y et K est dans [0,255] H dans [0,360] S et V dans [0,240]
RGB CMY CMYK HSV
51.102.240
250,25,5
110,155,0,100
180,120,30
Mlle Hechkel Amina 71
L’IMAGE – DÉFINITION ET TYPES
Image numérique: ensemble de points élémentaires
représentant chacun une portion de l’image : le pixel (picture
element)
Une image est définie par:
Nombre de pixels en largeur et hauteur
L’étendu des nuances de gris ou de couleur de chaque
pixel (dynamique de l’image)
Deux types :
•Images Matricielles
• Images Vectorielles
Mlle Hechkel Amina 72
L’IMAGE – DÉFINITION ET TYPES Images vectorielles:
Représenter les données de l’image par des formes
géométriques décrites d’un point de vue mathématique
Fichier de taille réduite
Redimensionnement sans perte de qualité
Facilité de retouche (éléments indépendants)
Inutilisable pour les photographies
Formats non standardisés
• DXF, PIC, WMF, SVG, SWF, PDF
• Utilise XML
Mlle Hechkel Amina 73
L’IMAGE – DÉFINITION ET TYPES Images Matricielles
Matrice de pixels (pixelmap ou bitmap) Taille du fichier (poids de l’image) dépend de la résolution et
du codage de la couleur
Résolution : définit le degré de détail représenté par une
image en dpi (dots per inch) ou ppp (points par pouce=2.54 cm)
Pixellisation avec l’agrandissement
Formats standardisés : BMP, JPEG, GIF, PNG,
3types Images binaires Images en niveaux de gris Images en couleurs
Mlle Hechkel Amina 74
L’IMAGE – DÉFINITION ET TYPES Résolution et taille d’image
– Taille en pixels = taille en pouces * résolution
– Une image de 5*5 cm scannée a 100 dpi aura une
taille de 197 pixels sur 197 pixels
(5/2.54)*100= 196.85 pixels
– Pixellisation:
Mlle Hechkel Amina 75
L’IMAGE – DÉFINITION ET TYPES Images binaires
(bitmap) Chaque pixel est soit noir soit blanc 1 pixel = 1 bit en mémoire (0: noir , 1: blanc) Convient pour les documents texte
Images en niveaux de gris Pour n bits 2n niveaux de gris Généralement 1 pixel = 1 octet
256 niveaux de gris
Mlle Hechkel Amina 76
L’IMAGE – DÉFINITION ET TYPESImage en couleurs
Il existe plusieurs modes de codage de la couleur. Le
plus utilisé est le codage Rouge, Vert, Bleu (RVB) 24 bits.
Chaque pixel sur 3 octets soit 24 bits : le rouge de 0 à
255 , le vert de 0 à 255, le Bleu de 0 à 255.
On obtient ainsi 256 x 256 x 256 = 16777216 (plus de
16 millions de couleurs différentes
Donc : 1 pixel = 3 octets = 24 bits
Mlle Hechkel Amina 77
ACQUISITION/NUMÉRISATION Différents chemins possibles des images :
– Acquisition/numérisation
• Scène analogique -> image numérique
– Mémorisation
• Image volatile -> image permanente
– Traitement
• Produit une autre image de sortie, éventuellement d’autres
grandeurs de plus haut niveau (analyse d’images)
– Visualisation ou restitution
• Sous forme analogique le plus souvent
Mlle Hechkel Amina 78
ACQUISITION/NUMÉRISATION
Deux moyens
Outils de dessin : Photoshop, Autocad, ….
Numérisation d’image
Numérisation d’image
Échantillonnage + quantification
Mlle Hechkel Amina 79
ACQUISITION/NUMÉRISATION Échantillonnage
le découpage de l'espace à étudier en pavés réguliers de la
surface I(x,y) à étudier.
Superposition d’une grille au plan de l’image
Détermine le nombre de pixels en ligne et en colonne
Un nombre faible de pixels aliasing (escaliers sur les contours)
Mlle Hechkel Amina 80
ACQUISITION/NUMÉRISATION Quantification
Transformation d’une amplitude (niveau de gris, couleur) à
valeur continue (intervalle [0,1] dans IR) vers une valeur
discrète dans IN. Pour une image en 256 niveaux de gris chaque amplitude est codée
sur 1 octet.
Une quantification faible faux contours
Mlle Hechkel Amina 81
MATÉRIEL DE NUMÉRISATION
Capteurs photosensible
L’énergie incidente est convertie en signal électrique
La sortie est proportionnelle à lumière/couleur
CCD (Charge Coupled Device) ou CMOS (Complementary Metal
Oxide Semiconductor)
Mlle Hechkel Amina 82
MATÉRIEL DE NUMÉRISATION Exemples :
Scanner à main Scanner manuellement Orientation et vitesse variables Lecteurs de codes à barres
Scanner à plat Scan de documents texte ou images Vitesse et orientation automatiques
Scanner à diapositives : petite fenêtre (36mm) grande
résolution (4000dpi)
APN (Apparei Photo Numérique) :
taille de l’image en Mpixels
Mlle Hechkel Amina 83
L’IMAGE – MATÉRIEL DE NUMÉRISATION
Exercice:
Quelle est la taille en Mo de l’image obtenue par numérisation
d’une page A4 (21x29.7 cm) par un scanner ayant une résolution
de 1200 dpi à une profondeur de 36 bits ?
Soit un APN de 5 MP et 64 MO de mémoire interne. Quel est le taux
de compression à utiliser pour y stocker au moins 64 photos ?
Mlle Hechkel Amina 84
MÉMORISATION
Dualité Qualité/Taille en mémoire Algorithmes de compression des images
– Sans perte (RLE, LZW, Codage de Huffman)
– Avec perte
• Par transformation : DCT, DWT, FT
• Par prédiction : DPCM, ADPCM
Formats de fichiers image
– Propriétaires
– Ouverts et multiplateforme
Mlle Hechkel Amina 85
L’IMAGE – MÉMORISATION - COMPRESSION
RLE ou RLC(Run Length Encoding/Coding)
Basé sur la redondance des valeurs consécutives
Une suite de valeurs identiques est codée par 2 valeurs : le
nombre de répétitions et la valeur répétée
– Exemple :AAAAAAAAAABBBBBBCCCCCCC => en RLE 10 A 6 B 7 C
Algorithme efficace s’il y a beaucoup de surfaces uniformes
ESTIMATION => 1E1S1T1I1M1A1T1I1O1N
Mlle Hechkel Amina 86
L’IMAGE – MÉMORISATION - COMPRESSION
En noir et blanc :0000000000111110000001111111111 Donne 10 0 5 1 6 0 10 1
Format BMP4 pixels de couleur 0E : 0E 0E 0E 0EDonnées compressées : 04 0E2 pixels de couleur ABCD : AB CD AB CDDonnées compressées : 00 02 AB CD
– Si l’octet 1 différent de 0 alors octet 1 est le nombre de pixel àrépéter, l’octet 2 indique la couleur du pixel.– Si l’octet 1 = 0 alors si l’octet 2 >= 3, l’octet 2 indique le
nombred’octet à utiliser (de 3 a 255).– Si l’octet 1 et 2 = 00 00 -> fin de ligne.– Si l’octet 1 et 2 = 00 01 -> fin de l’image.
Mlle Hechkel Amina 87
L’IMAGE – MÉMORISATION - COMPRESSION
Exercice
1. Donner le codage RLE de la chaîne «BELLE BALLE
BLEUE». Calculer le taux et le gain de compression.
2. Donner le codage RLC de l’image ci-dessous avec les
hypothèses suivante:
• Chaque ligne est représentée par des entiers représentant
les longueurs des pages
• La dernière plage est remplacée par la marque de fin de
ligne
• Codage des lignes consécutives
Mlle Hechkel Amina 88
L’IMAGE – MÉMORISATION - COMPRESSION
Codage de Huffman (David Huffman1952)
But : réduire le nombres de bits utilisés pour le codage
des caractères fréquents dans un texte et d’augmenter
ce nombre pour des caractères plus rares.
Algorithme de compression :
on cherche la fréquence des caractères
on trie les caractères par ordre décroissant de fréquence
on construit un arbre pour donner le code binaire de chaque
caractère
Mlle Hechkel Amina 89
L’IMAGE – MÉMORISATION - COMPRESSION Construction de l’arbre : on relie deux à deux les caractères de
fréquence les plus basses et on affecte à ce nœud la somme des
fréquences des caractères. Puis on répète ceci jusqu'à ce que l’arbre
relie toutes les lettres. L’arbre étant construit, on met un 1 sur la
branche à droite du nœud et un 0 sur celle de gauche.
Exemple d’encodage de Huffman
Mlle Hechkel Amina 90
L’IMAGE – MÉMORISATION - COMPRESSION LZW (Lempel Ziv Welch) : Compression
Après la compression: nous obtenons une séquence de codes de 9 bits sur la sortie : TOBEORNOT<256><258><260><265><259><261><263>Elle nécessite 16 * 9 = 144 bits d'espace de stockage.
Sans compression:» La longueur de cette chaîne est de 24 caractères. Elle nécessite avec le codage ASCII : 24 * 8 = 192 bits d'espace de stockage.
w = Nul;tant que (lecture d'un caractère c) fairesi (wc existe dans le dictionnaire) alorsw = wc;sinonajouter wc au dictionnaire;écrire le code de w;w = c;fin sifin tant queécrire le code de w;
Mlle Hechkel Amina 91
L’IMAGE – MÉMORISATION - COMPRESSION LZW (Lempel Ziv Welch) :
Décompressionlecture d'un caractère c;écrire c; // ajout suite à un oubliw = c;tant que (lecture d'un caractère c) fairesi (c > 255 && l'index c existe dans le dictionnaire) alorsentrée = l'entrée du dictionnaire de c;sinon si (c > 255 && l'index c n'existe pas dans le dictionnaire) alorsentrée = w + w[0];sinonentrée = c;fin siécrire entrée;ajouter w+entrée[0] au dictionnaire;w = entrée;fin tant que
Mlle Hechkel Amina 92
L’IMAGE – MÉMORISATION - FORMATS BMP : Bitmap
• Pas de compression /RLE• Windows et OS/2• Peut utiliser une palette de couleurs• Codage des couleurs de 2 à 24 bits• Poids élevé du fichier
RAW : Format natif des appareils photo• Nécessite un prétraitement• Non standardisé (selon constructeur)• Jusqu’à 14 bits par couleurs• Qualité et facilité de retouche• Poids très élevé
Mlle Hechkel Amina 93
L’IMAGE – MÉMORISATION - FORMATS GIF : Graphics Interchange Format de Compuserve
• Palette de 2 à 256 couleurs (8 bits pour les couleurs)• Compression LZW• Adapté aux pages web et inapproprié aux photos• Gif animé et entrelacé
PNG : Portable Network Graphics• Jusqu’à 48 bits/pixel• Compression sans perte (deflate) : meilleur rapportqualité/poids• Gère la transparence (canal alpha)• Animation APNG• Entrelacé
Mlle Hechkel Amina 94
L’IMAGE – MÉMORISATION - FORMATS TIFF : Tagged Image File Format
• Format extrêmement flexible
– Compression : LZW, JPEG, ..
– Espaces de couleurs : RGB, CMYK, Lab, …
• Format utilisé avec les scanners et les imprimantes
• Métadonnées JPEG : Joint Photographic Experts Group
• Compression destructive : taux paramétrable
• Jusqu’à 24 bits/couleur
• Standard répandu
• Jusqu’à un facteur de 20:1
Mlle Hechkel Amina 95
L’IMAGE – TRAITEMENT Addition
+ = Soustraction
-- =
Mlle Hechkel Amina 96
L’IMAGE – TRAITEMENT
Autres traitements
– Détection de contours
– Correction couleurs, contraste
– Reconnaissance de caractères
– Reconnaissance de formes
Mlle Hechkel Amina 97
L’IMAGE – RESTITUTION Reconversion de l’image en analogique
– Visualisation sur écran– Impression sur papier
Caractéristiques des écrans :– Taille de diagonale en pouces (rapport H/V =
4/3)– Résolution en dpi (souvent 72dpi, 96dpi)
• varie selon le mode d’affichage: VGA (640x480), SVGA(800x600), XGA(1024x768), SXGA(1280x1024)
• Pitch ou pas de masque : distance entre 2 pixels (~0.28mm)
– Fréquence de rafraîchissement (60Hz)– Nombre de couleurs (Synthèse additive RGB)
Mlle Hechkel Amina 98
WEBOGRAPHIE - BIBLIOGRAPHIE
[1]: http://perso.wanadoo.fr/arsene.perez-mas
[2]: ACQUISITION et TRAITEMENT D'IMAGE NUMERIQUE -
Université Paul Sabatier IUT - Département de Mesures
Physiques, J.P. Gastellu-Etchegorry - Avril 2008
[3]: « Vidéo et imagerie numérique - Compression RLE » issu
de l'encyclopédie informatique Comment Ça Marche