soutenance de thèse

53
12 décembre 2005 Soutenance de thèse de Mi chel Narozny 1 Soutenance de thèse Michel Narozny Équipe Systèmes de Traitement des Signaux, Supélec, campus de Metz ANALYSE EN COMPOSANTES INDÉPENDANTES (ACI) ET COMPRESSION DE DONNÉES

Upload: chi

Post on 17-Mar-2016

86 views

Category:

Documents


3 download

DESCRIPTION

Michel Narozny Équipe Systèmes de Traitement des Signaux, Supélec, campus de Metz. Soutenance de thèse. ANALYSE EN COMPOSANTES IND ÉPENDANTES (ACI) ET COMPRESSION DE DONNÉES. Deux domaines de recherche…. Un sujet de thèse à la charnière entre deux domaines de recherche:. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Soutenance de thèse

12 décembre 2005 Soutenance de thèse de Michel Narozny

1

Soutenance de thèse

Michel Narozny

Équipe Systèmes de Traitement des Signaux, Supélec, campus de Metz

ANALYSE EN COMPOSANTES INDÉPENDANTES (ACI) ET

COMPRESSION DE DONNÉES

Page 2: Soutenance de thèse

12 décembre 2005 Soutenance de thèse de Michel Narozny

2

Deux domaines de recherche… Un sujet de thèse à la charnière entre deux domaines de recherche:

Analyse en composantes indépendantes

Séparation aveugle de sources,

Analyse de données (images, bourses),

Modélisation du cortex visuel,

Astronomie,…

Compression de donnéesPhotos numériques,

Vidéos,

Images médicales,

Musique,…

Mon sujet de thèse

Page 3: Soutenance de thèse

12 décembre 2005 Soutenance de thèse de Michel Narozny

3

Pourquoi associer ACI et compression?

Réduction de redondance

dans les données

Compression de données:

on cherche à réduire/éliminer la redondance dans

les données

BUT:

réduire la complexité des

codeurs

ACI:

outil pour réduire la redondance dans les

données

Page 4: Soutenance de thèse

12 décembre 2005 Soutenance de thèse de Michel Narozny

4

Redondance résiduelle exploitée par les codeurs

SPIHT

Exploite la redondance entre des coefficients d’ondelettes situés au

même endroit dans des sous-bandes différentes

● ● ●

●●

EBCOT (JPEG2000)

Exploite la redondance entre des coefficients d’ondelettes situés dans

une même sous-bande

Page 5: Soutenance de thèse

12 décembre 2005 Soutenance de thèse de Michel Narozny

5

Images de la galaxie 3C120 prises avec 4 filtres différents

L’ACI diminue la redondance

Images obtenues après ACI (algorithme FastICA)

Référence: D. Nuzillard and A. Bijaoui. Blind source separation and analysis of multispectral astronomical images. Astron. Astrophys. Suppl. Ser. 147, 129-138

Page 6: Soutenance de thèse

12 décembre 2005 Soutenance de thèse de Michel Narozny

6

Travaux précédents (1/2)Principe de réduction de redondance pour expliquer la stratégie de codage de l’information visuelle dans le cortex visuel primaire (V1)

L’ACI modélise bien les champs récepteurs des cellules simples de V1

Localisation dans l’espace et en fréquence + orientation

Olshausen BA. Principles of Image Representation in Visual Cortex. In:  The Visual Neurosciences, L.M. Chalupa, J.S. Werner, Eds.  MIT Press,  pp. 1603-15, 2003

Page 7: Soutenance de thèse

12 décembre 2005 Soutenance de thèse de Michel Narozny

7

Travaux précédents (2/2)Codage par transformée classique1 (Puga et Alves, 98)

l’ACI est moins performante que la transformée de Karhunen-Loève en codage à bas débit d’images en niveaux de gris

Codage prédictif2 (Marusic et Deng, 99)Les performances de l’ACI varient selon la méthode de quantification utilisée

Matching pursuit3 (Ferreira et Figueiredo, 03)

Publié au milieu de ma thèse

Gain de la méthode par rapport à JPEG de 2,3 dB à 0.62 bpp

1) A. T. Puga and A. P. Alves. An experiment on comparing PCA and ICA in classical transform image coding. ICA’98

2) S. Marusic and G. Deng. ICA-FIR based image redundancy reduction. ICA’99

3) A. J. Ferreira and M. A. T. Figueiredo. Class-adapted image compression using independent component analysis. ICIP’03

Page 8: Soutenance de thèse

12 décembre 2005 Soutenance de thèse de Michel Narozny

8

Objectif et contributions Objectif:

Comprendre le lien qui existe entre les performances en compression et la réduction de redondance dans les données

ContributionsÉvaluation des performances de l’ACI “standard” en codage par transformée (codage par blocs)

Nouveau point de vue en codage par transformée: le problème de la recherche de la transformation linéaire optimale peut se ramener à un problème d’ACI modifié

Proposition de deux nouveaux algorithmes d’ACI modifiés:

GCGsup: calcul de la transformation linéaire optimale

ICAorth: calcul de la transformation orthogonale optimale

Page 9: Soutenance de thèse

12 décembre 2005 Soutenance de thèse de Michel Narozny

9

Introduction Présentation du schéma de codage étudié

Évaluation des performances de l’ACI en compression

Proposition de transformations optimales obtenues à partir d’algorithmes d’ACI modifiés

Conclusion et perspectives

Plan de la présentation

Page 10: Soutenance de thèse

12 décembre 2005 Soutenance de thèse de Michel Narozny

10

Choix du type de transformation Choix des quantificateurs Choix du codeur entropique Choix des mesures de distorsion et de

débit Choix de la méthode d’allocation de débit

Présentation du schéma de codage étudié

Plan

Introduction

Présentation du schéma de codage étudié

Performances de l’ACI en compression

Transformations optimales obtenues à partir d’ algorithmes d’ACI modifiés

Conclusion et perspectives

Page 11: Soutenance de thèse

12 décembre 2005 Soutenance de thèse de Michel Narozny

11

Structure d’un codeur par transformée

Page 12: Soutenance de thèse

12 décembre 2005 Soutenance de thèse de Michel Narozny

12

Structure d’un décodeur

Inverse mathématique

Page 13: Soutenance de thèse

12 décembre 2005 Soutenance de thèse de Michel Narozny

13

Choix du type de transformation

Découpage de l’image en blocs de 8×8 pixels

Balayage de chaque bloc de haut en bas et de gauche à droite

Vecteur de 64 composantes

Transformation linéaire

(matrice de dimension

64×64)

Q1

Q2

Q64

Quantification

Page 14: Soutenance de thèse

12 décembre 2005 Soutenance de thèse de Michel Narozny

14

Choix des quantificateursDifférents types de quantificateurs: scalaires, vectorielsNotre choix: quantificateur scalaire uniforme infini

simplicité, souvent utilisé,

caractérisé seulement par son pas de quantification: q

optimal pour une source sans mémoire, sous l’hypothèse haute résolution et à condition d’être suivi par un codeur entropique

Rappel: hypothèse haute résolutionLe nombre de niveaux de quantification est élevé

La ddp des données à quantifier est constante dans chaque intervalle de quantification

Les représentants sont pris au milieu des intervalles

Page 15: Soutenance de thèse

12 décembre 2005 Soutenance de thèse de Michel Narozny

15

Choix du codeur entropique

Dernière étape de la chaîne de codage (sans perte)But: exploiter la redondance résiduelle présente dans les coefficients après quantificationIdée: représenter un coefficient quantifié (ou un ensemble de coefficients quantifiés) à l’aide d’un mot de code dont la longueur dépend de sa probabilité d’occurrenceExemples: codeurs de huffman, arithmétique, mais aussi… EBCOTNotre choix: ne pas utiliser de codeur entropique

Page 16: Soutenance de thèse

12 décembre 2005 Soutenance de thèse de Michel Narozny

16

Mesure de distorsion Erreur quadratique moyenne (EQM) entre le signal d’entrée et le signal reconstruit

Pic du rapport signal sur bruit en compression d’images (PRSB)

Mesure de débitDébit de compression (bpp)

Ri = débit de la ième composante

Compression à haut et moyen débits: entropie d’ordre 1 des coefficients quantifiés lorsque l’hypothèse haute résolution est vérifiée

Compression à bas débit: entropies d’ordres 2, 4 et 9

Choix des mesures de distorsion et de débit

)1(2log10 10 EQMPRSB

dyn

dyn = 8 pour une image codée sur 8 bits

)2(11

N

iiRN

R

Page 17: Soutenance de thèse

12 décembre 2005 Soutenance de thèse de Michel Narozny

17

Présentation du problèmeTrouver les pas de quantification des N quantificateurs qui minimisent la distorsion D sous la contrainte d’un débit cible Rcible

ou, d’une manière équivalente, qui minimisent le débit R sous la contrainte d’une distorsion cible Dcible

Approximation de la distorsion

Validité de l’approximation (1)lorsque l’hypothèse haute résolution est bien vérifiée

ou, lorsque les vecteurs colonnes de la transformation inverse sont orthogonaux ou quasi-orthogonaux

ou, lorsque les composantes transformées sont deux à deux indépendantes

L’allocation de débit (1/2)

)1(1

N

iiiDwD wi: carré de la norme de

la ième colonne de la transformation inverse

Page 18: Soutenance de thèse

12 décembre 2005 Soutenance de thèse de Michel Narozny

18

Méthode analytiqueoptimale lorsque l’hypothèse haute résolution est bien vérifiée (compression à haut et moyen débits)

Formule d’allocation de débit:

Algorithme de Shoham et Gersho Méthode d’optimisation numérique utilisant des couples débits-distorsions obtenus expérimentalement (voir rapport de thèse)

optimal quelque soit le débit, utilisé à bas débit dans nos tests

L’allocation de débit (2/2)

iYhic

~2

121

iY

iii

YEYY

~où et

(1)

Page 19: Soutenance de thèse

12 décembre 2005 Soutenance de thèse de Michel Narozny

19

Conclusion de la première partie

Proposition d’un dispositif expérimental simple pour évaluer les performances d’une transformation linéaire à haut, moyen et bas débits

Partie suivante: évaluation des performances de l’ACI

Page 20: Soutenance de thèse

12 décembre 2005 Soutenance de thèse de Michel Narozny

20

Algorithmes d’ACI testés Signaux testés Réduction de redondance obtenue avec

l’ACI Performances à haut, moyen et bas

débits

Performances de l’ACI en compressionPlan

Introduction

Présentation du schéma de codage étudié

Performances de l’ACI en compression

Transformations optimales obtenues à partir d’ algorithmes d’ACI modifiés

Conclusion et perspectives

Page 21: Soutenance de thèse

12 décembre 2005 Soutenance de thèse de Michel Narozny

21

Définition du modèle d’ACISources indépendantes (au plus une source gaussienne)

Observations

Mélange linéaire instantané: X = AS

Séparation Y=BS, B=DPA-1

Sources estimées

S1 S2 S3 S4

X1 X2 X3 X4

Y1 Y2 Y3 Y4

Page 22: Soutenance de thèse

12 décembre 2005 Soutenance de thèse de Michel Narozny

22

Trois approches théoriques célèbres

Approche du maximum de vraisemblanceLes ddp des sources sont supposées a priori connues

On peut relâcher cette hypothèse en choisissant des ddp a priori quelconques (on ne recouvre pas toujours les sources d’origine)

Minimisation de l’information mutuelleConnaissance a priori des ddp des sources n’est pas nécessaire

Les algorithmes sont plus lourds à mettre en œuvre

Infomax (approche de type réseaux de neurones)Équivalent au maximum de vraisemblance

Page 23: Soutenance de thèse

12 décembre 2005 Soutenance de thèse de Michel Narozny

23

Minimisation d’une approximation de l’information mutuelle ACI, FastICA, jadeR, SANG

Minimisation directe de l’information mutuelle ICAinf

Exploitation des statistiques d’ordres 2 et 4 des donnéesEVD24

Algorithmes de séparation aveugle de sources qui exploitent les statistiques d’ordre 2 des données

SOBI, AMUSE, EVD2

Algorithmes d’ACI testés

Page 24: Soutenance de thèse

12 décembre 2005 Soutenance de thèse de Michel Narozny

24

Image Lena (composante rouge), image médicale, signal musical

Résolution et taille des signaux testés

Signaux testés

Page 25: Soutenance de thèse

12 décembre 2005 Soutenance de thèse de Michel Narozny

25

Réduction de redondance obtenue avec l’ACI

Coefficient de corrélationInformation mutuelle

Page 26: Soutenance de thèse

12 décembre 2005 Soutenance de thèse de Michel Narozny

26

Les valeurs des coefficients de corrélation sont élevées avant transformation (ex: Identité, image médicale, N = 64)

Coefficients de corrélation avant transformation

Page 27: Soutenance de thèse

12 décembre 2005 Soutenance de thèse de Michel Narozny

27

Hormis ICAinf, tous les autres algorithmes d’ACI testés décorrèlent les composantes (exemple: jadeR, image médicale, N = 64)

Coefficients de corrélation après transformation

Coefficient de

corrélation

Page 28: Soutenance de thèse

12 décembre 2005 Soutenance de thèse de Michel Narozny

28

ICAinf, image médicale, N = 64

Coefficients de corrélation après transformation

Page 29: Soutenance de thèse

12 décembre 2005 Soutenance de thèse de Michel Narozny

29

Définition de la réduction d’information mutuelle

Exemple: image médicale, N = 64

Réduction d’information mutuelle

Précision: ±0,01 bpp

I (bpp)

(bpp)

Page 30: Soutenance de thèse

12 décembre 2005 Soutenance de thèse de Michel Narozny

30

Performances à haut, moyen et bas débits

Page 31: Soutenance de thèse

12 décembre 2005 Soutenance de thèse de Michel Narozny

31

Pour l’image médicale et N=64, les performances de la TKL sont meilleures d’environ 1,5 dB par rapport à celles de la meilleure transformation d’ACI (sur cet exemple, ICAinf)

Performances à haut et moyen débits

TKLICAinf

Page 32: Soutenance de thèse

12 décembre 2005 Soutenance de thèse de Michel Narozny

32

Performances à bas débitImage médicale, N=64, débit = entropie d’ordre 4

Page 33: Soutenance de thèse

12 décembre 2005 Soutenance de thèse de Michel Narozny

33

Signaux synthétiques

Performances à haut et moyen débits (signaux synthétiques)

Gain(ICAinf/TKL) 2,72 dB

Page 34: Soutenance de thèse

12 décembre 2005 Soutenance de thèse de Michel Narozny

34

Les performances de la TKL sont meilleures que celles de l’ACI sur des signaux réelsCependant il existe des signaux synthétiques (non gaussiens) pour lesquels les performances de l’ACI sont meilleures que celles de la TKLPar conséquent, ni l’ACI ni la TKL ne sont optimales pour compresser des signaux non gaussiensLes critères d’optimalité de l’ACI et de la TKL ne sont pas adaptés au problème de la compression il faut reformuler le problème

Conclusion de la deuxième partie

Page 35: Soutenance de thèse

12 décembre 2005 Soutenance de thèse de Michel Narozny

35

Présentation du problème d’optimisation Lien avec l’ACI Algorithmes GCGsup et ICAorth Résultats expérimentaux

Transformations optimales obtenues à partir d’algorithmes d’ACI modifiés

Plan

Introduction

Présentation du schéma de codage étudié

Performances de l’ACI en compression

Transformations optimales obtenues à partir d’ algorithmes d’ACI modifiés

Conclusion et perspectives

Page 36: Soutenance de thèse

12 décembre 2005 Soutenance de thèse de Michel Narozny

36

Cadre de l’étude Aucune hypothèse sur le caractère gaussien ou non des signaux

L’hypothèse haute résolution est vérifiée

Allocation de débit optimale entre les composantes

Distorsion asymptotique en fonction du débit cible:

Débit asymptotique en fonction de la distorsion cible:

Hypothèses

cibleA RD

cibleA DR

(1)

(2)

Page 37: Soutenance de thèse

12 décembre 2005 Soutenance de thèse de Michel Narozny

37

Gain de codage généralisé

Réduction de débit généralisée

Gain de codage généralisé

)()(

cibleA

cibleI

RDRDG

cibleAcibleI DRDRRmax

GR 2max log21

)()(max cibleAcibleI DRDRR

(1)

(2)

(3)

Page 38: Soutenance de thèse

12 décembre 2005 Soutenance de thèse de Michel Narozny

38

Critère d’optimisation proposé

Nouveau point de vue:

Le problème de la recherche de la transformation linéaire optimale en codage par transformée peut se

ramener à un problème d’ACI modifié

Transformation optimale

Critère utilisé en ACIMesure de distance à l’orthogonalité de A

Page 39: Soutenance de thèse

12 décembre 2005 Soutenance de thèse de Michel Narozny

39

Algorithme GCGsup Version modifiée de l’algorithme ICAinf de D.-T. Pham pour calculer la transformation linéaire A qui minimise C(A) L’algorithme (de type quasi-Newton) consiste à calculer à chaque itération une matrice ε par la résolution de (M = A-tA-1):

(i,j=1,…,N), puis à déplacer le point courant en A+εA.

Hypothèses simplificatrices:Les composantes transformées sont proches de l’indépendance

La solution du problème est une matrice proche d’une matrice dont les colonnes sont deux à deux orthogonales

Page 40: Soutenance de thèse

12 décembre 2005 Soutenance de thèse de Michel Narozny

40

Algorithme ICAorth

Autre version modifiée de l’algorithme ICAinf de D.-T. Pham pour calculer la transformation orthogonale A qui minimise C(A) L’algorithme (de type quasi-Newton) consiste à calculer les éléments de la matrice ε de la manière suivante:

(i,j=1,…,N), puis à déplacer le point courant en A+ε A.

lorsque ε est antisymmétrique A+ε A coïncide au second ordre avec la matrice eεA qui est orthogonale.

Page 41: Soutenance de thèse

12 décembre 2005 Soutenance de thèse de Michel Narozny

41

Réduction de redondance obtenue avec GCGsup et ICAorth

Coefficient de corrélation Réduction d’information mutuelle

Page 42: Soutenance de thèse

12 décembre 2005 Soutenance de thèse de Michel Narozny

42

Coefficients de corrélation après transformation

Les nouvelles transformations décorrèlent moins bien que la TKL (ex: GCGsup, image médicale, N=64)

Corrélations résiduelles

Page 43: Soutenance de thèse

12 décembre 2005 Soutenance de thèse de Michel Narozny

43

Réduction d’information mutuelle GCGsup et ICAorth permettent d’obtenir des composantes transformées plus indépendantes que celles obtenues avec la TKL

Lena

Image médicale

Résultats proches de ceux obtenus avec ICAinf

Page 44: Soutenance de thèse

12 décembre 2005 Soutenance de thèse de Michel Narozny

44

Performances à haut, moyen et bas débits

Page 45: Soutenance de thèse

12 décembre 2005 Soutenance de thèse de Michel Narozny

45

Performances à haut et moyen débits

Lena Image médicale

Gain (GCGsup/TKL) 0,43 dB

Gain (ICAorth/TKL) 0,37 dB

Gain (GCGsup/TKL) 0,8 dB

Gain (ICAorth/TKL) 0,9 dB

Page 46: Soutenance de thèse

12 décembre 2005 Soutenance de thèse de Michel Narozny

46

Performances à bas débit

Lena

Image médicale

PRSB = PRSB(GCGsup/ICAorth) – PRSB TKL

Page 47: Soutenance de thèse

12 décembre 2005 Soutenance de thèse de Michel Narozny

47

Lien entre indépendance, orthogonalité et performances en

compression

Page 48: Soutenance de thèse

12 décembre 2005 Soutenance de thèse de Michel Narozny

48

Rappel: réduction de débit généralisée

Réduction de débit généralisée

Réduction d’information mutuelle

Distance à l’orthogonalité

Page 49: Soutenance de thèse

12 décembre 2005 Soutenance de thèse de Michel Narozny

49

Indépendance et orthogonalité

TKL

Page 50: Soutenance de thèse

12 décembre 2005 Soutenance de thèse de Michel Narozny

50

Vecteurs de base (Lena, N=64)

TKL GCGsup

Page 51: Soutenance de thèse

12 décembre 2005 Soutenance de thèse de Michel Narozny

51

Conclusion

Étude située à la charnière entre deux domaines de recherche: l’ACI et la compression de données La TKL offre de meilleures performances que l’ACI standard en compression à haut, moyen et bas débitsNouveau point de vue en codage par transformée: le problème de la recherche de la transformation linéaire optimale peut se ramener à un problème d’ACI modifié Deux nouveaux algorithmes: GCGsup et ICAorth Gain de codage des nouvelles transformations par rapport à la TKL

Page 52: Soutenance de thèse

12 décembre 2005 Soutenance de thèse de Michel Narozny

52

Perspectives

Étude comparative des performances de la TKL et des nouvelles transformations sur un échantillon statistiquement représentatif d’imagesUtilisation d’un vrai codeur entropiqueCodage d’images multicomposantes

Schéma de codage associant des transformées en ondelettes et les transformations retournées par GCGsup et ICAorth

Critère multicomposante = somme pondérée des critères monocomposantes

Page 53: Soutenance de thèse

12 décembre 2005 Soutenance de thèse de Michel Narozny

53

Merci de votre attention!