institut supérieur des etudes technologiques de mahdia préparé par : hechkel amina assistant...

SUPPORT DE COURS:

FONDEMENT DU

MULTIMÉDIA

SUPPORT DE COURS:

FONDEMENT DU

MULTIMÉDIA

Institut supérieur des Etudes Technologiques de Mahdia

Préparé par : Hechkel AminaAssistant Technologue à ISET

Mahdia Année Universitaire : 2010/2011

Mlle Hechkel Amina 2

ELÉMENTS DE CONTENU

Chaîne multimédia : acquisition, traitement, analyse,

synthèse, stockage, intégration, communication, etc.

Transformée de Fourier : TFC, TFD, FFT.

Numérisation : Echantillonnage (Th. De Shannon, CAN,

CNA), Résolution, Quantification.

Perception visuelle et SVH (RGB et systèmes virtuels).

Objets multimédias : textes, sons, images animées,

vidéo (normes, codage, formats).

Outils logiciels.


PLAN

IntroductionIntroduction

Le sonLe son

L’imageL’image

La vidéoLa vidéo

BibliographieBibliographie

Multimédia


PLAN

Introduction

Le sonLe son

L’imageL’image

La vidéoLa vidéo


Multimédia


INTRODUCTION : DÉFINITION

Multimédia = multi + média

– Multi : plusieurs

– Média : (medium) milieu de diffusion de l’information

– Coexistence sur un même support de plusieurs médias

(texte, son, image, vidéo)

« Intégration sur un même support de données de

différents types en vue de leur manipulation

(éventuellement interactive) à l’aide de l’outil

informatique ».



Outil informatique :

– Choix du matériel et du logiciel (Norme MPC)– Traitement numérique– L’ordinateur est à la fois l’outil de :

• Acquisition• Traitement• Stockage• Restitution (communication)

Interactivité :

– L’utilisateur choisit :• Les éléments auxquels il veut accéder• Le moment auquel il accède à ces éléments



Les moyens de l’interaction– Les périphériques (clavier, souris, écran,

microphone, …)– Une interface (graphique)– Hypermédia (structure arborescente)


INTRODUCTION : HISTORIQUE

Né dans les années 80 – Microinformatique

– Interfaces graphiques

– Hypercard (Apple)

Rencontre de plusieurs domaines– Audiovisuel

– Informatique

– Télécommunications

– Arts graphiques


INTRODUCTION : HISTORIQUE

Bénéficie des avancées technologiques– Technologies de stockage– Méthodes de compression/Décompression– Puissance de calcul– Transmission de l’information

NTIC : Nouvelles Technologies de l’Information et de la Communication (IT)– Fusion du Multimédia, Internet, Téléphonie mobile

et Télévision numérique


INTRODUCTION : OBJECTIFS

Acquérir, Stocker, Manipuler, Gérer, Diffuser– Des chiffres, du texte, des images, de la vidéo

Besoins – Grandes quantités d’information– Numériser– Compromis

• Stockage• Qualité• Coût• Transmission


INTRODUCTION : OBJECTIFS

Caractéristiques du multimédia (d’après des études psychologiques)– La mémoire humaine est capable de mémoriser

• 10% de ce qu’on lit• 20% de ce qu’on entend• 30% de ce qu’on voit• 50% de ce qu’on entend et voit• 60% de ce qu’on dit• 70% de ce qu’on pratique• 80% de ce qu’on pratique et on expose

– Proverbe chinois : “j’entend et j’oublie, je vois et je me rappelle, j’expérimente et j’apprends

– Volumineuse, complexes (dimension spatiotemporelles)


INTRODUCTION : APPLICATIONS

Potentiel énorme d’utilisation– Se divertir– S’informer– Se former– Communiquer– Vendre...

Applications grand public– Journaux en ligne– Visites virtuelles (de musées)–Encyclopédies– VOD (Vidéo On Demand)– Jeux


INTRODUCTION : APPLICATIONS

Applications professionnelles– Présentation d’entreprise– Commerce électronique– Médecine (aide au diagnostic)– Architecture et bâtiments (simulation)


INTRODUCTION : PROJET MULTIMÉDIA

Recherche et analyse

– Public cible : niveau d’expertise et besoins

– Recherche de contenu

– Contexte d’utilisation (contraintes)

Conception

– Synopsis du projet

Scénarisation (storyboarding)

– Description détaillée des différents éléments multimédia

Prototypage

Développement

Test et validation


INTRODUCTION : LES MÉTIERS

De la production– Éditeurs, producteurs, juristes, prospecteurs

De la création– Auteurs, directeurs artistiques, scénaristes, ergonomes, illustrateurs

De la réalisation– Réalisateurs, directeurs techniques, développeurs (programmeurs,

infographistes, etc.) ingénieurs du son, dialoguistes, testeurs, traducteurs

De l’exploitation– Fournisseurs d’accès, spécialistes réseau, packaging

De la distribution– Commerciaux pour la vente sur support, pour la vente en ligne

De l’utilisation– Bibliothécaires, formateurs


PLAN


Le son

L’imageL’image

La vidéoLa vidéo


Multimédia


DÉFINITION : LE SON

Définition 1: C’est un phénomène ondulatoire dû à un

phénomène physique, c'est donc un phénomène continu

(analogique) qui peut-être produit par vibration.

Définition 2: Le son est une onde sinusoïdale produite par

la vibration mécanique d'un support fluide ou solide et

propagée grâce à l'élasticité du milieu environnant sous

forme d'ondes longitudinales.

Par extension, le son désigne la sensation auditive liée à cette

vibration

L'onde sonore est représentée le plus souvent par une courbe

sinusoïdale.


DÉFINITION : SON ET PROJET MULTIMÉDIA

Deux types d’utilisation:

Contenu Sonore

Narration

Description de contenu (voice-overs)

Musique (chanson)

Ambiance sonore

Fond sonore (musique d’accompagnement)

Effets sonores (clic sonore)


PROPRIÉTÉS DU SONLe son sous forme d’onde (spectre de modulation d'amplitude) Fréquence :

• L’inverse de la période (1/p)• C’est la hauteur (grave, aigu)• Nombre de pics (crête) par seconde• Unité : Hz (1 Hz= 1pics par seconde)• Plage audible : 20 Hz - 20KHz


PROPRIÉTÉS DU SON

Les sons dont les fréquences sont plus faibles que la plus petite

fréquence audible (donc, du côté des graves) sont appelés les

infrasons (20 Hz chez l'homme).

Les sons dont les fréquences sont plus élevées que la plus haute

fréquence audible (donc, du côté des aigus) sont appelés les

ultrasons (20 000 Hz chez l'homme).

Les fréquences les plus utilisées par l'Homme sont comprises entre 1

et 3 KHz. Mais, la plage audible est de 20Hz à environ 20 KHz (non

audibles : infrasons et ultrasons)

Largeur de bande : différence entre plus haute et plus basse

fréquence Intensité (volume)

http://fr.wikipedia.org/wiki/Infrason

http://fr.wikipedia.org/wiki/Ultrason


PROPRIÉTÉS DU SON

Intensité (différence de pressions)

L'intensité correspond à l’amplitude (différence de pression).

Exprimée en décibels (dB) qui sont des unités logarithmiques.

Exemples:

Voix humaine : 35 à 70 dB,

Aspirateur : 70 dB,

Trafic automobile intense : 85 dB,

Détonation d'une cartouche 9 mm : 120 dB,

Avion à réaction au décollage : 135 dB,

Amplificateur de grande puissance : 140 dB.


PROPRIÉTÉS DU SON

Timbre: C’est la différence entre deux sons ayant la même

hauteur et le même volume (même fréquence, même intensité) :

c’est la qualité de sensation.

Le timbre dépend de l'intensité des harmoniques qui

accompagne le son fondamental.

Exemple :

Des instruments de musique jouant un do ont des intensités

d'harmoniques différentes. Cela n'empêche pas de reconnaître

ce do qu'il soit émis par une soprane, un piano ou un cor de

chasse.


PROPRIÉTÉS DU SON

Fondamentale et harmoniques

Une onde périodique complexe peut-être décomposée en un

ensemble d’ondes périodiques simples. Ainsi, un son est, en

général, un mélange de fréquences dites " harmoniques " qui sont

des multiples entiers de la fréquence de base.

• Calcul des harmoniques : Transformée de Fourier – Signal

analogique

Signal analogique:

Signal discret :


PROPRIÉTÉS DU SON Vitesse de son

La vélocité du son varie suivant le milieu dans lequel il se

propage. Le principal facteur de la variation est la densité de ce

milieu : dans un gaz, sa vitesse est plus faible que dans un liquide.

Par exemple, le son se propage approximativement à 343 m.s-1

dans l'air et à 1500 m.s-1 dans l'eau.


NUMÉRISATION

Pour pouvoir représenter un son sur un ordinateur, il faut

arriver à le convertir en valeurs numériques : la

numérisation.

C’est la conversion de l’analogique au numérique. On dit

aussi discrétisation d’un signal continu vers un signal discret.

Deux étapes dans la numérisation sont l’échantillonnage

et la quantification.

Les contraintes sont:

Ne pas détériorer le signal analogique.

Limiter l’espace de stockage.


NUMÉRISATION La conversion est obtenue grâce à un circuit électronique intégré appelé

Convertisseur Analogique-Numérique(CAN).

Etapes résumées dans la figure 1 et 2 suivantes.

Exemple de numérisation d’un signal analogique


NUMÉRISATION: ÉCHANTILLONNAGE

Modèle de l’échantillonnage

L’opération mathématique associée à cette discrétisation revient à

multiplier le signal e(t) par un peigne de Dirac Te (t):

Xs (t) = X(t).p (t) = Xs(t). Σk (t – kTe)



Principe

On prend ainsi des valeurs de e(t) à des intervalles de temps régulier

(tous les Te, période d’échantillonnage) à une fréquence Fe dite

fréquence d’échantillonnage. Plus la fréquence est élevée, plus la

numérisation est de qualité.

Si le spectre du signal d’origine à une fréquence supérieur à Fe/2 :

effet de repliement.

Dans ce cas, il n’est plus possible de retrouver le signal d’origine.

Puisque l’opération d’échantillonnage modifie les caractéristiques

d’entrée. On devra donc respecter la condition de Shannon :



Principe

Avant d’échantillonner le signal, on applique un filtre pour limiter cet effet de

repliement : Filtre passe bas (filtre anti-repliement) pour enlever les fréquences

supérieures à ½ Fe.

Utilisation du filtre en amont de l’échantillonneur



Exemple

Pour la musique, la fréquence maximale audible est de 20 kHz, en

comptant très large. La fréquence d'échantillonnage des CD-audio,

de 44,1 kHz, respecte bien ce théorème.

Application à la voix en téléphonie : fréquence maximale : 3700 Hz.

Quelle fréquence d'échantillonnage minimale choisir ? Choix d’une fréquence d’échantillonnage

Les fréquences usuelles sont de 44,1 kHz et 48 kHz !!!

Le choix est également fonction des performances de l’oreille

Comme il faut au moins 2 échantillons pour recréer un signal, le

choix sera :

fe ≥ 2 fréquence max (théorème de Shannon ou de Nyquist)



L’échantillonnage blocage

Une fois le signal filtré et échantillonné, il reste à le quantifier.

On doit maintenir constant la valeur à quantifier afin de

permettre au CAN de traiter l'échantillon et de le numériser. On

appelle cette opération, le blocage. Ce blocage doit être d’une

durée supérieure au temps de conversion.

Chaine de Conversion Analogique numérique


NUMÉRISATION: QUANTIFICATION

Théorie de la quantification

Le signal échantillonné - bloqué peut à ce stade être converti

sous forme binaire (numérique) pour être stocké. Ce codage

s'appelle la quantification. De là vient le nom de la technique :

PCM ("Pulse Code Modulation") ou MIC ("Modulation Impulsion

Codée").

Le rôle de la quantification est de donner une image binaire

d’un signal analogique :

Passage : Analogique – Numérique

Signal Continu – Signal discret

Tension – chiffre



Effectué par un circuit intégré (CAN, ADC).

A Chaque valeur mesurée est associée une valeur binaire codée

sur n bits (nombre de bits de quantification).

N bits permettent de distinguer 2n niveaux de tension entre –Vm et

+Vm.

On a ainsi le pas de quantification :

Application :

Un signal de +/- 5 V codé su8 bits, donner le pas de quantification

q.

Réponse : 39 mV.



Fonction escalier d’un CAN La caractéristique d’entrée sortie d’un CAN est une

caractéristique en marche d’escalier. Chaque palier a une largeur d’un pas de quantification q. Le passage d’un palier à un autre correspond à une variation de ‘1’ du code.

Le pas de quantification est appelée quantum, il correspond à la résolution du convertisseur. Le quantum est la plus petite variation de tension que le convertisseur peut coder.

Fonction escalier d’un CAN



Bruit de quantification

Lors de la quantification, une erreur de codage entre le signal échantillonné et

la valeur du code correspond à un niveau de tension (ce niveau de tension étant la

moyenne des tensions correspondant à ce code) :

Gamme de tension Code unique

Lors du codage, tous les niveaux compris dans la gamme reçoivent le même

code.

La quantification fournie une valeur approximative du signal donc introduit un

bruit :

Rapport Signal Bruit (Signal Noise Ration) :



Bruit de quantification

Le rapport Signal/Bruit pour un signal utilisant la pleine échelle vaut environ :

SNR dB =6.N + 2

• Amplitude du signal et rapport S/B :

Le rapport Signal/Bruit S/B=6N+2 est obtenu pour la pleine échelle et diminue

si l’amplitude du signal numérisé est plus faible.

Exemple: un CAN 8 bits travaille sur une plage d’entrée de -5V à+5V :

un signal d’amplitude Smax= 5V sera digitalisé sur 256 niveaux, d’où un rapport S/B

= 6.N + 2 = 50 dB

un signal d’amplitude 1,25V sera digitalisé sur 64 niveaux soit 6 bits, d’où un

rapport S/B = 38 dB pour S/Smax= 0,25 = -12 dB


QUANTIFICATION UNIFORME (LINÉAIRE)

La fonction de quantification uniforme attribue le même niveau à tous les

signaux situés dans une plage de tension donnée : le quantum q est donc

constant.

Le bruit de quantification (ou bruit de numérisation) apparut, diminue si la

précision, c’est-à-dire le nombre de bits N, de la conversion augmente


QUANTIFICATION UNIFORME (LINÉAIRE)

Le nombre de niveaux de quantification est bien-sûr lié au nombre de bits N

du CAN :

Un convertisseur 8 bits quantifie le signal analogique sur 256 niveaux, q =

19,5 mV si E = 5V

Un convertisseur 12 bits quantifie le signal analogique sur 1024 niveaux, q

= 4,9 mV si E = 5V

Un convertisseur 16 bits quantifie le signal analogique sur 65536 niveaux, q

= 0,076 mV si E = 5V

Application:

1. Calculer en Volts le quantum lorsque le signal analogique a une amplitude 10 et la conversion est sur 8 bits. (Réponse : q=20/256=0,078).

2. Le rapport signal/bruit est particulièrement défavorable pour les signaux de petites amplitudes. Une quantification non-linéaire est donc requise.


QUANTIFICATION NON LINÉAIRE Pour obtenir un rapport signal/bruit de quantification constant (ie

indépendant de l'amplitude), il faut évidemment faire varier le pas de

quantification selon l'amplitude.

le pas est petit pour les échantillons de faible amplitude

le pas est grand pour des échantillons de forte amplitude

En téléphonie, la quantification est à pas variable et utilise une courbe

non linéaire appelée “loi A” en Europe et “loi mu” aux Etats-Unis

Quantification non linéaire


FORMATS ET STANDARDS

On peut calculer la taille d’un fichier son comme suit :

Taille(en bits) = Fe * N * D * VAvec :

Fe : Fréquence d’échantillonnage (8 KHz, 44,1 KHz, …etc)

N : nombre de bits de quantification (8 bits, 16 bits)

D : Durée(en s)

V : Nombre de voies (mono : 1 voie, stéréo : 2 voies, quadri,

etc)

On peut aussi calculer le débit :

Débit (en bps)= Fe * N * V


CODAGE

En principe, le codage désigne le type de correspondance que l'on

souhaite établir entre chaque valeur du signal analogique et le nombre

binaire qui représentera cette valeur.

Le type de codage : PCM - Différentiel (delta) - Prédictif - Adaptatif - etc.

Codage PCM (Pulse Coded Modulation)

En français, MIC : Modulation par Impulsions Codées.

Utilisé au départ pour la téléphonie.

Il s’agit de coder chaque échantillon à sa valeur réelle

(contrairement à ce qui se fait dans le codage différentiel).


CODAGE (suite)

Codage différentiel ou codage "delta"

Ce codage consiste à évaluer (coder) la différence entre le niveau du signal à l'instant de l'échantillonnage et le niveau qu'il avait lors de l'échantillonnage précédent.

Standard DPCM (Differential PCM)

Codage différentiel


CODAGE (suite)

Codage prédictif Fonction de prédiction Coder la différence entre la valeur réelle et la valeur prédite Standard : LPC (Linear Predictive Coding/ Codage linéaire

prédictif pour la parole), WarpedLPC. Codage adaptatif

Adapte le nombre de bits au type de variation sonore qu'il détecte. Très utile pour adapter la qualité d'un son à l'encombrement

du réseau qui le transmet. Standard : ADPCM (Adaptative PCM).

Codage par transformation Transformer le signal avant codage Standards : DCT (Discrete Cosine Transform), DFT (Fourier),

DWT (Wavelet)


COMPRESSION DE SON

Un son numérisé est une séquence d'octets en mémoire.

La compression consiste à trouver une séquence d'octets plus

courte dont l'effet sonore soit semblable à celui de la séquence initiale.

Buts de la compression:

Gain de place dans le cas d'un enregistrement,

Économie de bande passante dans le cas d'une transmission,

Gain de temps dans le cas d'un transfert de fichier (Internet)

On calcule ainsi le taux de compression :

Taux de compression (%) = Taille compressé/ Taille originale

Exemple : C= 25/100= 0,25 soit 25 %


ALGORITHME DE COMPRESSION On cite ci-dessous quelques algorithmes de

compression/décompression (Codec) :

Algorithme de compression sans perte

La suite de bits obtenue après les opérations de compression et de

décompression est strictement identique à l’originale, cet algorithme est utilisé

pour nombreux types de données (documents, fichiers exécutables, fichiers

textes).

RLE (Run Length Encoding): Toute suite de bits ou de caractères identiques

est remplacé par un couple :(nombre d’occurrence, bit ou caractère répété)

Exemple : AAAAAAAAZZZEEEE devient 7A3Z4E.

LZW : Codage par dictionnaire (une table de données contenant des chaînes

de caractères), peu efficace pour les images et donne de bons résultats pour

les textes et les données informatiques en général (plus de 50 %).


ALGORITHME DE COMPRESSION

Algorithme de compression avec

perteLa suite de bits obtenue après les opérations de

compression et de décompression est différente de

l’originale mais l’information reste sensiblement la

même, utilisé pour les types de données : images,

sons et vidéos.

MPEG

ADPCM


FORMATS DE FICHIERS AUDIO

Ils sont plus que 50 formats : WAV, MP3, WMA, AAC, OGG, RA,

MIDI,…etc

WAV : Waveform audio format

Développer par IBM et Microsoft (plateforme

Windows),

Conteneur capable de recevoir des formats variés

Il peut être mono ou stéréo.

Extension : .wav


FORMATS DE FICHIERS AUDIO (SUITE)

MP3 : abréviation de MPEG-1/2 Audio Layer 3

Moving Picture Expert Group (Layer 3: couche 3)

La partie audio du MPEG-1 est décomposée en MPEG-1 Audio Layer I, II

et III. Ce dernier format est plus connu sous le nom de MP3 et permet

une compression sur 2 voies audio.

Concurrent de WMA,

Très rapide à l’encodage,

Débit jusqu’à 320 kbps.

WMA (Windows Media Audio)

Alternative au MP3 par Microsoft

Compatible seulement avec les logiciels Microsoft

Suffixe : .wma


FORMATS DE FICHIERS AUDIO (SUITE)

AAC (Advanced Audio Coding) Extension du MPEG-2 Concurrent de WMA par Apple (iPod, iTunes) Compression avec bonne qualité De 8 à 96KHz et jusqu’à 48 canaux Extensions .mp4, .aac, .m4a

OGG Format Open source (libre et gratuit) Amélioration du MP3 (Compression et qualité) Compression selon Vorbis (algorithme différent de MP3, WMA

et AAC) RA (RealAudio)

Format de RealNetworks Application en streaming Grand taux de compression Compatible avec Realplayer uniquement.


SON MULTI-CANAL

Désigne l’utilisation de plusieurs pistes audio en vue de la

restitution sur un système comportant plusieurs enceintes

(baffles) horizontalement (restitution 3D).

Exemple :

Il existe une terminologie associé : deux chiffres séparés par

un point (2.1, 5.1).

1er chiffre: Nombre de canaux principaux destinés à être restituer

sur une enceinte.

2ème chiffre: désigne la présence d’effets basse fréquence destinés

à être restitué sur une enceinte (caisson de basse).

1.0 : monocanal / 2.0 : source sonore stéréo.


APPLICATION

Considérons une chanson de 5 min numérisée avec une carte

son en qualité CD.

1) Calculer le volume occupé par cette chanson en Méga octet.

Pour cette chanson la carte va générer 44100 échantillons par

seconde. Chaque échantillon va occuper 16 bits= 2 octets.

2) Déduire le débit en bps et la capacité d’un CD 700 MOctet

en minutes.


PLAN


L’image

La vidéoLa vidéo


Multimédia

Le sonLe son


DÉFINITIONS

Lumière: aspect particulaire / aspect ondulatoire

Onde monochromatique : caractérisée par une longueur

d’onde (en A°: Angstrom ou en nm : nanomètre).

Énergie électromagnétique

La couleur est une perception humaine de

l’apparence des objets soumis à un rayonnement

visible ; elle dépend de l’objet comme de la lumière.

Couleurs métamères: composition différente mais

même couleur résultante. 2 objets métamères peuvent ne

pas le rester sous un autre éclairage.


SPECTRE ÉLECTROMAGNÉTIQUE DE LA LUMIÈRE


PERCEPTION VISUELLE

Le système visuel humain

Les rayons lumineux réfléchis se focalisent sur une

zone particulière de la rétine.

La rétine contient environ 150 millions de cellules dont une

centaine de millions de cellules photo-réceptrices: les cônes et

bâtonnets.


PERCEPTION VISUELLE (SUITE) On distingue ainsi 3 types de cônes :

Les cônes S sensibles à des longueurs d’onde courtes (short), les

cônes M sensibles à des longueurs d’onde moyennes (medium) et

les cônes L sensibles à des longueurs d’onde longues (long).

C’est là l’origine de l’aspect trichromatique de la vision des couleurs.

Les cônes L sont sensibles au jaune-vert à rouge, les cônes M au

vert et les cônes S au bleu.

Les cônes S sont les moins nombreux : 64 % L, 32 % M et

seulement 2% S, bleus.

Sensibilité plus grande à l’intensité (luminance) qu’aux variations de

couleur (chrominance)


L’IMAGE – ESPACES COLORIMÉTRIQUES La couleur est une notion subjective

Expériences d’égalisation : comparer 2 sensations lumineuses.

Théorie trichromatique (Young-Helmotz 1801) La couleur est de nature tridimensionnelle: Trois primaires

sont donc nécessaires et suffisants pour produire toute couleur

Métamérisme: possibilité de produire une couleur à partir de primaires différents

Choix des 3 couleurs primaires: Monochromatique Aucune des 3 couleurs ne peut être obtenue par le

mélange des 2 autres Mélange additif : Rouge (R), le Vert (G) et le Bleu (B), Mélange soustractif : Jaune (Y), le Magenta (M) et le Cyan

(C).


SYNTHÈSE DE LA COULEUR

Synthèse additive

• Addition de lumières colorées (rouge + vert=jaune)

• Juxtaposition spatiale ou temporelleR +G= J

R + B = M

B +G=C

R + B + G = W (blanc)

2 couleurs complémentaires produisent du blanc:

jaune et bleu, magenta et vert, cyan et rouge.

Exemple :

J + B = R + B + G = W


SYNTHÈSE DE LA COULEUR Synthèse Soustractive

Principe d’absorption sélective (filtre)

La synthèse soustractive est très souvent associée aux primaires

CMJ (Cyan, Magenta, Jaune).

De l’encre jaune déposée sur une feuille blanche soustrait la

composante bleue à une lumière blanche.


ESPACES DE REPRÉSENTATION Espaces RGB :

En utilisant les travaux de Wright et Guild, la CIE (Commission Internationale de l’Éclairage) a proposé ces 3 fonctions et a adopté trois primaires notées [Rc], [Gc] et [Bc], de longueurs d’onde respectives 700,0 nm, 546,1 nm et 435,8 nm. (L’indice c rappelle CIE).


ESPACES DE REPRÉSENTATION Espaces virtuels :

En 1931, les travaux de Judd ont permis à la CIE d’établir le système

de référence colorimétrique dont les primaires sont virtuelles ou

imaginaires et permettent de pallier les inconvénients du système RGB.

Le système XYZ correspond à un changement de primaires et

s’obtient ainsi à l’aide d’une simple matrice de passage à partir du

système RGB:

X(l) = 2.7690 RC(l) + 1.7518 GC(l) +

1.1300 BC(l)

Y(l) = 1.000 RC(l) + 4.5907 GC(l) +

0.0601 BC(l)

Z(l) = 0 RC(l) + 0.0565 GC(l) + 5.5943

BC(l)


ESPACES DE REPRÉSENTATION

Espaces uniformes : CIE Lab (CIE L*a*b*)

Noté souvent Lab est conçu pour qu’une distance dans

cet espace représente le même écart visuel quelque

soit la région où l’on considère cette distance. Les composantes L*, a* et b*:

a* correspond à un axe Rouge-Vert et b* à un axe Jaune-Bleu L* correspond à la luminance


ESPACES DE REPRÉSENTATION Systèmes perceptuels

Il existe de nombreux systèmes de ce type présentés sous

différentes dénominations telles que ISH, HSL, HSV, TLS, LCH,

LSH, LST, ITS

Ces systèmes se différencient entre eux par l’origine choisie de

l’angle de teinte et par le calcul de la teinte et de la saturation. T: Teinte

S: Saturation

L: Luminance

Le sélecteur de couleur de Photoshop et modes colorimétriques supportés


ESPACES DE REPRÉSENTATION Systèmes de luminance-chrominance pour la vidéo• Permettre le fonctionnement à la fois des téléviseurs NB

et couleur.– Il est en effet nécessaire qu’un téléviseur « Noir et Blanc » puisse

recevoir des émissions couleur. De même, les téléviseurs couleurs doivent pouvoir recevoir les émissions diffusées en noir et blanc.

– il faut pour cela que l’information de luminance qu’il peut décoder soit séparée des signaux de chrominance.

• Utilisé par les standards NTSC (USA et Japon), PAL et SECAM

• Séparation Luminance et Chrominance– Luminance : Y du système XYZ– Chrominance :

C1 = a1(R-Y) + b1(B-Y)C2 = a2(R-Y) + b2(B-Y)

avec a1, b1, a2, b2 spécifiques aux standards NTSC, PAL ou SECAM.


ESPACES DE REPRÉSENTATION

NTSC : (illuminant C, primaires FCC : RF GF BF )– Y = 0,299RF + 0,587GF + 0,114BF– I = 0,74(RF - Y) - 0,27(BF – Y)– Q = 0,48(RF - Y) + 0,41(BF - Y)

YIQ peuvent être aussi calculés à partir des RGB de la CIE ou de XYZ.

PAL : (illuminant D65, primaires EBU : RE GE BE)– Y = 0,299RE + 0,587GE + 0,114BE– U = 0,493(BE - Y)– V = 0,877(RE - Y)

Le standard SECAM définit le système (Y,Cr,Cb) avec

:– Cr = -1.9(RE - Y)– Cb = 1,5(BE - Y)


CONVERSION ENTRE MODÈLES Conversion de RVB vers CMJN

Conversion de RVB vers CMJN

Exemple: Convertir la couleur RGB(0.2,0.5,0) en CMY puis en CMYK.

RGB vers CMY

– C=1-R= 1-0.2= 0.8

– M=1-G= 1-0.5= 0.5

– Y=1-B= 1-0= 1

CMY vers CMYK– K=min(C,M,Y) = 0.5– C=C-K= 0.8-0.5= 0.3– M=M-K= 0.5-0.5= 0– Y=Y-K= 1-0.5= 0.5


CONVERSION ENTRE MODÈLES RGB HSV(TSL) :h[0,360],s,v,r,g,b[0,1]

MAX=max(r, g, b) MIN=min(r,g,b)

Exemple: Convertir la couleur RGB(0.3,0.1,0.25) vers HSV – MAX = 0.3 MIN=0.1– H=60x((0.1-0.25)/(0.3-0.1))+360°= 315°– S=1-(0.1/0.3)= 0.66– V= 0.3


CONVERSION ENTRE MODÈLES RGB HSV(TSL) h[0,360] s,v,r,g,b[0,1]

Exemple: Convertir la couleur RGB(0.3,0.1,0.25) vers HSV – MAX = 0.3 MIN=0.1– H=60x((0.1-0.25)/(0.3-0.1))+360°= 315°– S=1-(0.1/0.3)= 0.66– V= 0.3


CONVERSION ENTRE MODÈLES: EXERCICE

Compléter le tableau suivant sachant que: R,G,B,C,M,Y et K est dans [0,255] H dans [0,360] S et V dans [0,240]

RGB CMY CMYK HSV

51.102.240

250,25,5

110,155,0,100

180,120,30


L’IMAGE – DÉFINITION ET TYPES

Image numérique: ensemble de points élémentaires

représentant chacun une portion de l’image : le pixel (picture

element)

Une image est définie par:

Nombre de pixels en largeur et hauteur

L’étendu des nuances de gris ou de couleur de chaque

pixel (dynamique de l’image)

Deux types :

•Images Matricielles

• Images Vectorielles


L’IMAGE – DÉFINITION ET TYPES Images vectorielles:

Représenter les données de l’image par des formes

géométriques décrites d’un point de vue mathématique

Fichier de taille réduite

Redimensionnement sans perte de qualité

Facilité de retouche (éléments indépendants)

Inutilisable pour les photographies

Formats non standardisés

• DXF, PIC, WMF, SVG, SWF, PDF

• Utilise XML


L’IMAGE – DÉFINITION ET TYPES Images Matricielles

Matrice de pixels (pixelmap ou bitmap) Taille du fichier (poids de l’image) dépend de la résolution et

du codage de la couleur

Résolution : définit le degré de détail représenté par une

image en dpi (dots per inch) ou ppp (points par pouce=2.54 cm)

Pixellisation avec l’agrandissement

Formats standardisés : BMP, JPEG, GIF, PNG,

3types Images binaires Images en niveaux de gris Images en couleurs


L’IMAGE – DÉFINITION ET TYPES Résolution et taille d’image

– Taille en pixels = taille en pouces * résolution

– Une image de 5*5 cm scannée a 100 dpi aura une

taille de 197 pixels sur 197 pixels

(5/2.54)*100= 196.85 pixels

– Pixellisation:


L’IMAGE – DÉFINITION ET TYPES Images binaires

(bitmap) Chaque pixel est soit noir soit blanc 1 pixel = 1 bit en mémoire (0: noir , 1: blanc) Convient pour les documents texte

Images en niveaux de gris Pour n bits 2n niveaux de gris Généralement 1 pixel = 1 octet

256 niveaux de gris


L’IMAGE – DÉFINITION ET TYPESImage en couleurs

Il existe plusieurs modes de codage de la couleur. Le

plus utilisé est le codage Rouge, Vert, Bleu (RVB) 24 bits.

Chaque pixel sur 3 octets soit 24 bits : le rouge de 0 à

255 , le vert de 0 à 255, le Bleu de 0 à 255.

On obtient ainsi 256 x 256 x 256 = 16777216 (plus de

16 millions de couleurs différentes

Donc : 1 pixel = 3 octets = 24 bits


ACQUISITION/NUMÉRISATION Différents chemins possibles des images :

– Acquisition/numérisation

• Scène analogique -> image numérique

– Mémorisation

• Image volatile -> image permanente

– Traitement

• Produit une autre image de sortie, éventuellement d’autres

grandeurs de plus haut niveau (analyse d’images)

– Visualisation ou restitution

• Sous forme analogique le plus souvent


ACQUISITION/NUMÉRISATION

Deux moyens

Outils de dessin : Photoshop, Autocad, ….

Numérisation d’image

Numérisation d’image

Échantillonnage + quantification


ACQUISITION/NUMÉRISATION Échantillonnage

le découpage de l'espace à étudier en pavés réguliers de la

surface I(x,y) à étudier.

Superposition d’une grille au plan de l’image

Détermine le nombre de pixels en ligne et en colonne

Un nombre faible de pixels aliasing (escaliers sur les contours)


ACQUISITION/NUMÉRISATION Quantification

Transformation d’une amplitude (niveau de gris, couleur) à

valeur continue (intervalle [0,1] dans IR) vers une valeur

discrète dans IN. Pour une image en 256 niveaux de gris chaque amplitude est codée

sur 1 octet.

Une quantification faible faux contours


MATÉRIEL DE NUMÉRISATION

Capteurs photosensible

L’énergie incidente est convertie en signal électrique

La sortie est proportionnelle à lumière/couleur

CCD (Charge Coupled Device) ou CMOS (Complementary Metal

Oxide Semiconductor)


MATÉRIEL DE NUMÉRISATION Exemples :

Scanner à main Scanner manuellement Orientation et vitesse variables Lecteurs de codes à barres

Scanner à plat Scan de documents texte ou images Vitesse et orientation automatiques

Scanner à diapositives : petite fenêtre (36mm) grande

résolution (4000dpi)

APN (Apparei Photo Numérique) :

taille de l’image en Mpixels


L’IMAGE – MATÉRIEL DE NUMÉRISATION

Exercice:

Quelle est la taille en Mo de l’image obtenue par numérisation

d’une page A4 (21x29.7 cm) par un scanner ayant une résolution

de 1200 dpi à une profondeur de 36 bits ?

Soit un APN de 5 MP et 64 MO de mémoire interne. Quel est le taux

de compression à utiliser pour y stocker au moins 64 photos ?


MÉMORISATION

Dualité Qualité/Taille en mémoire Algorithmes de compression des images

– Sans perte (RLE, LZW, Codage de Huffman)

– Avec perte

• Par transformation : DCT, DWT, FT

• Par prédiction : DPCM, ADPCM

Formats de fichiers image

– Propriétaires

– Ouverts et multiplateforme


L’IMAGE – MÉMORISATION - COMPRESSION

RLE ou RLC(Run Length Encoding/Coding)

Basé sur la redondance des valeurs consécutives

Une suite de valeurs identiques est codée par 2 valeurs : le

nombre de répétitions et la valeur répétée

– Exemple :AAAAAAAAAABBBBBBCCCCCCC => en RLE 10 A 6 B 7 C

Algorithme efficace s’il y a beaucoup de surfaces uniformes

ESTIMATION => 1E1S1T1I1M1A1T1I1O1N



En noir et blanc :0000000000111110000001111111111 Donne 10 0 5 1 6 0 10 1

Format BMP4 pixels de couleur 0E : 0E 0E 0E 0EDonnées compressées : 04 0E2 pixels de couleur ABCD : AB CD AB CDDonnées compressées : 00 02 AB CD

– Si l’octet 1 différent de 0 alors octet 1 est le nombre de pixel àrépéter, l’octet 2 indique la couleur du pixel.– Si l’octet 1 = 0 alors si l’octet 2 >= 3, l’octet 2 indique le

nombred’octet à utiliser (de 3 a 255).– Si l’octet 1 et 2 = 00 00 -> fin de ligne.– Si l’octet 1 et 2 = 00 01 -> fin de l’image.



Exercice

1. Donner le codage RLE de la chaîne «BELLE BALLE

BLEUE». Calculer le taux et le gain de compression.

2. Donner le codage RLC de l’image ci-dessous avec les

hypothèses suivante:

• Chaque ligne est représentée par des entiers représentant

les longueurs des pages

• La dernière plage est remplacée par la marque de fin de

ligne

• Codage des lignes consécutives



Codage de Huffman (David Huffman1952)

But : réduire le nombres de bits utilisés pour le codage

des caractères fréquents dans un texte et d’augmenter

ce nombre pour des caractères plus rares.

Algorithme de compression :

on cherche la fréquence des caractères

on trie les caractères par ordre décroissant de fréquence

on construit un arbre pour donner le code binaire de chaque

caractère


L’IMAGE – MÉMORISATION - COMPRESSION Construction de l’arbre : on relie deux à deux les caractères de

fréquence les plus basses et on affecte à ce nœud la somme des

fréquences des caractères. Puis on répète ceci jusqu'à ce que l’arbre

relie toutes les lettres. L’arbre étant construit, on met un 1 sur la

branche à droite du nœud et un 0 sur celle de gauche.

Exemple d’encodage de Huffman


L’IMAGE – MÉMORISATION - COMPRESSION LZW (Lempel Ziv Welch) : Compression

Après la compression: nous obtenons une séquence de codes de 9 bits sur la sortie : TOBEORNOT<256><258><260><265><259><261><263>Elle nécessite 16 * 9 = 144 bits d'espace de stockage.

Sans compression:» La longueur de cette chaîne est de 24 caractères. Elle nécessite avec le codage ASCII : 24 * 8 = 192 bits d'espace de stockage.

w = Nul;tant que (lecture d'un caractère c) fairesi (wc existe dans le dictionnaire) alorsw = wc;sinonajouter wc au dictionnaire;écrire le code de w;w = c;fin sifin tant queécrire le code de w;


L’IMAGE – MÉMORISATION - COMPRESSION LZW (Lempel Ziv Welch) :

Décompressionlecture d'un caractère c;écrire c; // ajout suite à un oubliw = c;tant que (lecture d'un caractère c) fairesi (c > 255 && l'index c existe dans le dictionnaire) alorsentrée = l'entrée du dictionnaire de c;sinon si (c > 255 && l'index c n'existe pas dans le dictionnaire) alorsentrée = w + w[0];sinonentrée = c;fin siécrire entrée;ajouter w+entrée[0] au dictionnaire;w = entrée;fin tant que


L’IMAGE – MÉMORISATION - FORMATS BMP : Bitmap

• Pas de compression /RLE• Windows et OS/2• Peut utiliser une palette de couleurs• Codage des couleurs de 2 à 24 bits• Poids élevé du fichier

RAW : Format natif des appareils photo• Nécessite un prétraitement• Non standardisé (selon constructeur)• Jusqu’à 14 bits par couleurs• Qualité et facilité de retouche• Poids très élevé


L’IMAGE – MÉMORISATION - FORMATS GIF : Graphics Interchange Format de Compuserve

• Palette de 2 à 256 couleurs (8 bits pour les couleurs)• Compression LZW• Adapté aux pages web et inapproprié aux photos• Gif animé et entrelacé

PNG : Portable Network Graphics• Jusqu’à 48 bits/pixel• Compression sans perte (deflate) : meilleur rapportqualité/poids• Gère la transparence (canal alpha)• Animation APNG• Entrelacé


L’IMAGE – MÉMORISATION - FORMATS TIFF : Tagged Image File Format

• Format extrêmement flexible

– Compression : LZW, JPEG, ..

– Espaces de couleurs : RGB, CMYK, Lab, …

• Format utilisé avec les scanners et les imprimantes

• Métadonnées JPEG : Joint Photographic Experts Group

• Compression destructive : taux paramétrable

• Jusqu’à 24 bits/couleur

• Standard répandu

• Jusqu’à un facteur de 20:1


L’IMAGE – TRAITEMENT Addition

+ = Soustraction

-- =


L’IMAGE – TRAITEMENT

Autres traitements

– Détection de contours

– Correction couleurs, contraste

– Reconnaissance de caractères

– Reconnaissance de formes


L’IMAGE – RESTITUTION Reconversion de l’image en analogique

– Visualisation sur écran– Impression sur papier

Caractéristiques des écrans :– Taille de diagonale en pouces (rapport H/V =

4/3)– Résolution en dpi (souvent 72dpi, 96dpi)

• varie selon le mode d’affichage: VGA (640x480), SVGA(800x600), XGA(1024x768), SXGA(1280x1024)

• Pitch ou pas de masque : distance entre 2 pixels (~0.28mm)

– Fréquence de rafraîchissement (60Hz)– Nombre de couleurs (Synthèse additive RGB)


WEBOGRAPHIE - BIBLIOGRAPHIE

[1]: http://perso.wanadoo.fr/arsene.perez-mas

[2]: ACQUISITION et TRAITEMENT D'IMAGE NUMERIQUE -

Université Paul Sabatier IUT - Département de Mesures

Physiques, J.P. Gastellu-Etchegorry - Avril 2008

[3]: « Vidéo et imagerie numérique - Compression RLE » issu

de l'encyclopédie informatique Comment Ça Marche

institut supérieur des etudes technologiques de mahdia préparé par : hechkel amina assistant...

Documents