fouille de données fonctionnelles - lipn · 2012. 7. 30. · 39 références zcohen g. , 1999...

39
1 1 Fouille de données Fouille de données fonctionnelles fonctionnelles Gilbert Gilbert Saporta Saporta Chaire de Statistique Appliquée Chaire de Statistique Appliquée Conservatoire National des Arts et Métiers Conservatoire National des Arts et Métiers 292 Rue Saint Martin 292 Rue Saint Martin 75141 Paris Cedex 03 75141 Paris Cedex 03 [email protected] [email protected]

Upload: others

Post on 13-Nov-2020

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Fouille de données fonctionnelles - LIPN · 2012. 7. 30. · 39 Références zCOHEN G. , 1999 Contribution à la prévision des processus aléatoires par l'analyse harmonique, Ph.D

11

Fouille de données Fouille de données fonctionnellesfonctionnelles

Gilbert Gilbert SaportaSaportaChaire de Statistique AppliquéeChaire de Statistique AppliquéeConservatoire National des Arts et MétiersConservatoire National des Arts et Métiers292 Rue Saint Martin292 Rue Saint Martin75141 Paris Cedex 0375141 Paris Cedex [email protected]@cnam.fr

Page 2: Fouille de données fonctionnelles - LIPN · 2012. 7. 30. · 39 Références zCOHEN G. , 1999 Contribution à la prévision des processus aléatoires par l'analyse harmonique, Ph.D

22

INTRODUCTIONINTRODUCTION

Premiers travaux:Premiers travaux:

J. C. Deville J. C. Deville –– 19741974P.P. BesseBesse –– 19791979G.G. SaportaSaporta –– 19811981

Ensuite...Ensuite...AguileraAguilera,, ValderramaValderrama –– 1993, 1995, 19981993, 1995, 1998Ramsay, Silverman Ramsay, Silverman –– 1995, 19971995, 1997VanVan der Heijdender Heijden –– 19971997PredaPreda, Cohen , Cohen –– 19991999Cardot, Ferraty, Vieu Cardot, Ferraty, Vieu -- 1999, 20051999, 2005

Page 3: Fouille de données fonctionnelles - LIPN · 2012. 7. 30. · 39 Références zCOHEN G. , 1999 Contribution à la prévision des processus aléatoires par l'analyse harmonique, Ph.D

33

NUMERIQUESNUMERIQUES QUALITATIVESQUALITATIVES

t T0

i1

i2

in

X

xt(1)

xt(2)

xt(n)

0 T

i1

i2

in state 1

state 2

state 3

state 4

« event history data »

Données fonctionnelles

Page 4: Fouille de données fonctionnelles - LIPN · 2012. 7. 30. · 39 Références zCOHEN G. , 1999 Contribution à la prévision des processus aléatoires par l'analyse harmonique, Ph.D

44

PROCESSUS NUMERIQUEPROCESSUS NUMERIQUEExemplesExemples::

Taille d’une familleTaille d’une famille t t années après le mariageannées après le mariageValeur boursiereValeur boursiere

Pour chaque Pour chaque tt

variable numérique:variable numérique:

Infinité non dénombrable de variables si t Infinité non dénombrable de variables si t ∈∈ [0;T][0;T]

(1)

( )

.

.

.

t

t

t n

x

x

x

⎛ ⎞⎜ ⎟⎜ ⎟⎜ ⎟=⎜ ⎟⎜ ⎟⎜ ⎟⎝ ⎠

Page 5: Fouille de données fonctionnelles - LIPN · 2012. 7. 30. · 39 Références zCOHEN G. , 1999 Contribution à la prévision des processus aléatoires par l'analyse harmonique, Ph.D

55

PROCESSUS QUALITATIFPROCESSUS QUALITATIF

ExemplesExemples::

Phases Phases du sommeildu sommeilStatut socialStatut socialStatut matrimonialStatut matrimonial

A chaque instantA chaque instant ttvariablevariable nominale xnominale xtt àà m m catégories.catégories.

Page 6: Fouille de données fonctionnelles - LIPN · 2012. 7. 30. · 39 Références zCOHEN G. , 1999 Contribution à la prévision des processus aléatoires par l'analyse harmonique, Ph.D

66

I ACP FONCTIONNELLEI ACP FONCTIONNELLE

XXtt centrécentréfonction de covariance:fonction de covariance:Opérateur de covarianceOpérateur de covariance CC

Combinaison linéaireCombinaison linéaire

( )2tX L T∈ Ω×

( ) ( ) ( )0

,T

f s C t s f s ds→∫

( , ) ( )t sC t s E X X=

0( )

T

tf t X dtξ = ∫

Page 7: Fouille de données fonctionnelles - LIPN · 2012. 7. 30. · 39 Références zCOHEN G. , 1999 Contribution à la prévision des processus aléatoires par l'analyse harmonique, Ph.D

77

Opérateurs linéaires associés à Xt

UU

UU**

UU**°° UU = C= CUU °° UU* * =W=W

( ) ( )

( ) ( )

2 2

0

ΩT

t

L T L

f t X f t dt

→ ∫

( ) ( )( )

2 2Ω

t

L L T

Y E YX

( ) ( )2 2Ω ΩL L→ ( )0

T

t tY X E X Y dt→ ∫

Page 8: Fouille de données fonctionnelles - LIPN · 2012. 7. 30. · 39 Références zCOHEN G. , 1999 Contribution à la prévision des processus aléatoires par l'analyse harmonique, Ph.D

88

I.1 Processus quasi I.1 Processus quasi –– deterministe deterministe

Même forme à une constanteMême forme à une constante prèsprès ξξii relative relative ààll’’individu iindividu i

( ) ( )t iX i f tξ=

-400

-300

-200

-100

0

100

200

300

400

500

1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33

Page 9: Fouille de données fonctionnelles - LIPN · 2012. 7. 30. · 39 Références zCOHEN G. , 1999 Contribution à la prévision des processus aléatoires par l'analyse harmonique, Ph.D

99

Tout processus peut être approchTout processus peut être approchéé par une par une somme de processus quasisomme de processus quasi ddééterministes.terministes.

ξξii(k(k))=coordonnée=coordonnée sur l’axesur l’axe kk

( )k kt

k

X f tξ# ∑

Page 10: Fouille de données fonctionnelles - LIPN · 2012. 7. 30. · 39 Références zCOHEN G. , 1999 Contribution à la prévision des processus aléatoires par l'analyse harmonique, Ph.D

1010

Choix de la baseChoix de la base ffkk(t)(t)

Fonctions orthogonales de Fonctions orthogonales de LL22(T)(T)

Fourier par exemple:Fourier par exemple:

MAIS les MAIS les ξξk k sont corrélés. sont corrélés.

( ) ( )0

10

Tk l si k l

f t f t dtsi k l

=⎧= ⎨ ≠⎩

( ) 2 2cos sink k t k tf t ouT Tπ π

= ( )0

Tk

k tX f t d tξ⇒ = ∫

Page 11: Fouille de données fonctionnelles - LIPN · 2012. 7. 30. · 39 Références zCOHEN G. , 1999 Contribution à la prévision des processus aléatoires par l'analyse harmonique, Ph.D

1111

I.2 Décomposition de Karhunen I.2 Décomposition de Karhunen –– Loeve Loeve

DécompositionDécomposition uniqueunique

ffkk= = ensemble orthonormé deensemble orthonormé de fonctionsfonctions dede LL22(T)(T)ξξkk = = ensemble orthogonalensemble orthogonal (non(non--corrcorréélation)lation) dedevariables variables dede LL22(Ω)(Ω)ffkk fonctions propresfonctions propres dede CC

ξξk k fonctions propres defonctions propres de WW

( )1

t k kk

X f tξ∞

=

= ∑

( ) ( ) ( )0

,T

k k kf t C t s f s dsλ = ∫

( )0

T

k t kX f t d tξ = ∫

( )k kV ξ λ=

Page 12: Fouille de données fonctionnelles - LIPN · 2012. 7. 30. · 39 Références zCOHEN G. , 1999 Contribution à la prévision des processus aléatoires par l'analyse harmonique, Ph.D

1212

Preuve

1.1. Multiplier des deux côtés par fMultiplier des deux côtés par fkk(t) et (t) et intégrer sur tintégrer sur t

( )

( )

1

0 01

( ) ( )

( ) ( )

t k j j kj

T T

t k j k j kj

X f t f t f t

X f t dt f t f t dt

ξ

ξ ξ

=

=

=

= =

∑∫ ∫

Page 13: Fouille de données fonctionnelles - LIPN · 2012. 7. 30. · 39 Références zCOHEN G. , 1999 Contribution à la prévision des processus aléatoires par l'analyse harmonique, Ph.D

1313

2 Multiplier des deux côtés par 2 Multiplier des deux côtés par ξξk k et prendre et prendre ll’’espespéérancerance

( )

( ) ( )

( )

1

2

1

0 0

0

( ) ( ) ( )

( ( ) ) ( ) ( )

( , ) ( )

t k j k jj

t k j k j k kj

T T

t s k t s k

T

k k k

X f t

E X E f t E f t

E X X f s ds E X X f s ds

C t s f s ds f t

ξ ξ ξ

ξ ξ ξ ξ

λ

=

=

=

= =

=

= =

∫ ∫∫

Page 14: Fouille de données fonctionnelles - LIPN · 2012. 7. 30. · 39 Références zCOHEN G. , 1999 Contribution à la prévision des processus aléatoires par l'analyse harmonique, Ph.D

1414

( )( )

( )

0

0 0

0 0

0

( )

( )

( ) ( )

T

t t

T T

t t s

T T

t t s

T

t

W X E X dt

X E X X f s ds dt

X E X X f s ds dt

X f t dt

ξ ξ

λ λξ

=

=

=

= =

∫ ∫

∫ ∫

Page 15: Fouille de données fonctionnelles - LIPN · 2012. 7. 30. · 39 Références zCOHEN G. , 1999 Contribution à la prévision des processus aléatoires par l'analyse harmonique, Ph.D

1515

I.3 décomposition de Karhunen–Loeve et ACP

ffkk facteurs principauxfacteurs principaux

ξξk k composantes principales composantes principales (coordonnées(coordonnées sur l’axe k)sur l’axe k)

KARHUNEN KARHUNEN –– LOEVE LOEVE ≡≡ SVD (SINGULARSVD (SINGULARVALUE VALUE DECOMPOSITION)DECOMPOSITION)

Page 16: Fouille de données fonctionnelles - LIPN · 2012. 7. 30. · 39 Références zCOHEN G. , 1999 Contribution à la prévision des processus aléatoires par l'analyse harmonique, Ph.D

1616

Coordonnées indépendantes de t; facteurs fonctions de t

X

X

XX

XX

X

ωn

ω2

ω1

ξ1

ξ2

Page 17: Fouille de données fonctionnelles - LIPN · 2012. 7. 30. · 39 Références zCOHEN G. , 1999 Contribution à la prévision des processus aléatoires par l'analyse harmonique, Ph.D

1717

Interprétation:

Comme en ACP

Exemple: taille des familles

( ) ( )( )

; k kt k

f tr X

ξ =σ

0 20

r(xt, ξ1)

size effect

r(xt, ξ2)

200

speed

5

Page 18: Fouille de données fonctionnelles - LIPN · 2012. 7. 30. · 39 Références zCOHEN G. , 1999 Contribution à la prévision des processus aléatoires par l'analyse harmonique, Ph.D

1818

LA PRODUCTION INDUSTRIELLE EN FRANCE DE 1980 A 1988

0

200

400

600

800

1000

1200

1400

1600

1800

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36

thèse G.Cohen, 1999

Page 19: Fouille de données fonctionnelles - LIPN · 2012. 7. 30. · 39 Références zCOHEN G. , 1999 Contribution à la prévision des processus aléatoires par l'analyse harmonique, Ph.D

1919

LES SIX PREMIÈRES COMPOSANTES TEMPORELLES ET LEURS PRÉVISIONS

Composantes temporelles N°1

0 , 0 0

0 , 0 5

0 , 1 0

0 , 1 5

0 , 2 0

0 , 2 5

0 , 3 0

0 , 3 5

1 3 5 7 9 1 1 1 3 1 5 1 7 1 9 2 1 2 3 2 5 2 7 2 9 3 1 3 3 3 5 Composantes temporelles N°2

- 0 , 3 0

- 0 , 2 0

- 0 , 1 0

0 , 0 0

0 , 1 0

0 , 2 0

0 , 3 0

1 3 5 7 9 1 1 1 3 1 5 1 7 1 9 2 1 2 3 2 5 2 7 2 9 3 1 3 3 3 5

Composantes temporelles N°3

- 0 , 2 0

- 0 , 1 0

0 , 0 0

0 , 1 0

0 , 2 0

0 , 3 0

0 , 4 0

1 3 5 7 9 1 1 1 3 1 5 1 7 1 9 2 1 2 3 2 5 2 7 2 9 3 1 3 3 3 5

Page 20: Fouille de données fonctionnelles - LIPN · 2012. 7. 30. · 39 Références zCOHEN G. , 1999 Contribution à la prévision des processus aléatoires par l'analyse harmonique, Ph.D

2020

Composantes temporelles N°4

- 0 , 4 0

- 0 , 3 0

- 0 , 2 0

- 0 , 1 0

0 , 0 0

0 , 1 0

0 , 2 0

0 , 3 0

0 , 4 0

1 3 5 7 9 1 1 1 3 1 5 1 7 1 9 2 1 2 3 2 5 2 7 2 9 3 1 3 3 3 5

Composantes temporelles N°5

- 0 , 2 0

- 0 , 1 0

0 , 0 0

0 , 1 0

0 , 2 0

0 , 3 0

0 , 4 0

1 3 5 7 9 1 1 1 3 1 5 1 7 1 9 2 1 2 3 2 5 2 7 2 9 3 1 3 3 3 5

Composantes temporelles N°6

- 0 , 4 0- 0 , 3 0- 0 , 2 0- 0 , 1 0

0 , 0 00 , 1 00 , 2 00 , 3 00 , 4 00 , 5 0

1 3 5 7 9 1 1 1 3 1 5 1 7 1 9 2 1 2 3 2 5 2 7 2 9 3 1 3 3

Page 21: Fouille de données fonctionnelles - LIPN · 2012. 7. 30. · 39 Références zCOHEN G. , 1999 Contribution à la prévision des processus aléatoires par l'analyse harmonique, Ph.D

2121

Remarques: Remarques: Si le processus XSi le processus Xtt est périodique en moyenne est périodique en moyenne quadratique de période sous multiple de T : quadratique de période sous multiple de T : C(t,s+T/k)=C(t,s), alors la décomposition de C(t,s+T/k)=C(t,s), alors la décomposition de KarhunenKarhunen--Loeve est la décomposition de Loeve est la décomposition de Fourier avec valeurs propres doubles Fourier avec valeurs propres doubles associées à sin(2kassociées à sin(2kππt/T) et cos(2kt/T) et cos(2kππt/T)t/T)L’ordre des valeurs propres n’est pas celui des L’ordre des valeurs propres n’est pas celui des fréquences fréquences

Page 22: Fouille de données fonctionnelles - LIPN · 2012. 7. 30. · 39 Références zCOHEN G. , 1999 Contribution à la prévision des processus aléatoires par l'analyse harmonique, Ph.D

2222

I.4 RI.4 Réésolution numsolution numéériqueriqueRésoudre:Résoudre:

SolutionsSolutions analytiques pour quelques processus bien connusanalytiques pour quelques processus bien connus(eg mouvement et pont brownien(eg mouvement et pont brownien motion)motion)

Pur n trajectoires:Pur n trajectoires:W W matricematrice n n ×× n (multidimensional scaling);n (multidimensional scaling);

wwijij se calcule facilement pour des processus de se calcule facilement pour des processus de sautssauts ⇒⇒ solutionssolutions exactes exactes ⇒⇒

Difficile si n est grandDifficile si n est grand

( ) ( )0

T

i j i jw x t x t d t= ∫

( ) ( ) ( )0

1, T

C t s f s ds f t ou Wn

λ ξ λξ= =∫

( ) ( )1

1 1 n

i ii

f t X tn

ξλ =

= ∑

Page 23: Fouille de données fonctionnelles - LIPN · 2012. 7. 30. · 39 Références zCOHEN G. , 1999 Contribution à la prévision des processus aléatoires par l'analyse harmonique, Ph.D

2323

DiscrétisationDiscrétisation tt00, t, t11,…..,,…..,ttpp

IntégrationIntégration numérique denumérique de

Matrice diagonale de poidsMatrice diagonale de poidsméthode des rectangles:méthode des rectangles:

méthode des trapèzes:méthode des trapèzes:Simpson …Simpson …

( ) ( ) ( )0

,T

C t s f s ds f tλ=∫( ) ( ) ( )

0,

p

j j jt

C t t f t a f tλ=

=∑

( )CAf f tλ=1j j ja t t+= −

1 1 11 00 .....

2 2 2j j p p

j p

t t t tt ta a a+ − −− −−= = =

Page 24: Fouille de données fonctionnelles - LIPN · 2012. 7. 30. · 39 Références zCOHEN G. , 1999 Contribution à la prévision des processus aléatoires par l'analyse harmonique, Ph.D

2424

Projection on a subspace Projection on a subspace EEpp

Convergence is proved if Convergence is proved if EEpp→→LL22

Step functionsStep functions

;t tX PX C PCP→ →

[ ]

( ) [ ]

,

;

t t

a

sa

Y X i f t a b

X f s d s i f t a b

= ∉

= ∈∫

( ) ( );t tV Y V X≤ ( ) ( ) ( ) ( )max ,b

a

V Yt C t s f s ds f tλ⇒ =∫

( ) 1f tb a

=−

a b

Page 25: Fouille de données fonctionnelles - LIPN · 2012. 7. 30. · 39 Références zCOHEN G. , 1999 Contribution à la prévision des processus aléatoires par l'analyse harmonique, Ph.D

2525

( ) ( ) ( )b

t t s aba

V X V Y E X M ds− = −∫

2 2 supf

C C TM with C Cfε εΔ− ≤ + =

( )2tM E X>

12 2j j

TMλ λ ε εΔ− < +

12

2

2

22

j jf f T M

w h e re T M

ε εδ

δε ε

Δ 2 2− < +

+ <

Page 26: Fouille de données fonctionnelles - LIPN · 2012. 7. 30. · 39 Références zCOHEN G. , 1999 Contribution à la prévision des processus aléatoires par l'analyse harmonique, Ph.D

2626

The The ““bestbest”” discretization discretization problem:problem:

If If XXtt brownianbrownian notion: N(0; notion: N(0; σσ22(t))(t))Best Best ΔΔ: fixed length intervals: fixed length intervals

Generalized to process with independent and Generalized to process with independent and stationary incrementsstationary increments

1i iTt t lp−− = =

( )211

0

6

pi i

i

t tfor ε

−+

=

−= ∑ ( )

2

3 16i il p pλ λ Δ− ≤ −

Min ε

Page 27: Fouille de données fonctionnelles - LIPN · 2012. 7. 30. · 39 Références zCOHEN G. , 1999 Contribution à la prévision des processus aléatoires par l'analyse harmonique, Ph.D

2727

II. L’analyse harmonique II. L’analyse harmonique qualitativequalitative

(Deville, (Deville, Saporta Saporta 1979)1979)

Évolution d’une variable qualitative, trajectoires Évolution d’une variable qualitative, trajectoires d’un processus qualitatifd’un processus qualitatif

0 T

i1

i2

in state 1

state 2

state 3

state 4

Page 28: Fouille de données fonctionnelles - LIPN · 2012. 7. 30. · 39 Références zCOHEN G. , 1999 Contribution à la prévision des processus aléatoires par l'analyse harmonique, Ph.D

2828

Cas généralCas général

XXtt tt∈∈[0; T][0; T]

Principe barycentrique en temps continu:Principe barycentrique en temps continu:

( )

0

0

1

1 1

T

t t

Tx x

i t tx

z X a d tT

z a i d tT

α

α

⎧=⎪

⎪⎨⎪ =⎪⎩

∑∫1 '

tt t ta N X zα −= ( )1 , ....., nt t ta a a=

1

0

équa tion in tégra le1 T

tt ts s tN N a ds aT

λ− =∫

0

é q u a tio n m a tr ic ie lle1 T

tA d t z zT

λ⎡ ⎤

=⎢ ⎥⎣ ⎦∫

Page 29: Fouille de données fonctionnelles - LIPN · 2012. 7. 30. · 39 Références zCOHEN G. , 1999 Contribution à la prévision des processus aléatoires par l'analyse harmonique, Ph.D

2929

«« Multidimensional scalingMultidimensional scaling » avec un indice de » avec un indice de présence présence –– rareté rareté

AAtt –– matrice de similaritématrice de similarité

matrice intégrée, positive définiematrice intégrée, positive définie

~ produits scalaires~ produits scalaires↓↓

représentation euclidienne représentation euclidienne

( ) 1' 't t t t t

jA X X X X i

−⎛ ⎞⎜ ⎟= = •⎜ ⎟⎜ ⎟⎝ ⎠

tA dt∫

0

1/ntx

Page 30: Fouille de données fonctionnelles - LIPN · 2012. 7. 30. · 39 Références zCOHEN G. , 1999 Contribution à la prévision des processus aléatoires par l'analyse harmonique, Ph.D

3030

Résolution numériqueRésolution numériqueExacteExacte

Rassemblement de Rassemblement de toutestoutes les dates de changement d’étatles dates de changement d’état

AFCAFC

ApprochéeApprochéeDécomposer T en p périodes Décomposer T en p périodes Approximation par des fonctions constantes par intervallesApproximation par des fonctions constantes par intervalles

Page 31: Fouille de données fonctionnelles - LIPN · 2012. 7. 30. · 39 Références zCOHEN G. , 1999 Contribution à la prévision des processus aléatoires par l'analyse harmonique, Ph.D

3131

Exemple (Deville 82):Exemple (Deville 82):French women married more than 3 timesFrench women married more than 3 timesn=423 m=4 single n=423 m=4 single tt∈∈[15; 45][15; 45]

marriedmarrieddivorceddivorcedwidowedwidowed

20-25

15-20

35-40

15-20

40-45

35-40

30-35

25-30

20-25

15-20

15-20

20-2525-30

30-3535-40

40-45

Page 32: Fouille de données fonctionnelles - LIPN · 2012. 7. 30. · 39 Références zCOHEN G. , 1999 Contribution à la prévision des processus aléatoires par l'analyse harmonique, Ph.D

3232

Variables supplémentairesVariables supplémentaires

clerks>1925

First marriage without child

Last marriage with child

3 to 5 childrenupper classes

workers

1892-1904

1 or 2 children 1905-14

NO CHILD

Page 33: Fouille de données fonctionnelles - LIPN · 2012. 7. 30. · 39 Références zCOHEN G. , 1999 Contribution à la prévision des processus aléatoires par l'analyse harmonique, Ph.D

3333

Premier facteurPremier facteur

celibataires(single)

15 20 25 30 35 40 45

-4

-3

-2

-1

1

2

3

veuve(widow)

maries

divorce

t

Page 34: Fouille de données fonctionnelles - LIPN · 2012. 7. 30. · 39 Références zCOHEN G. , 1999 Contribution à la prévision des processus aléatoires par l'analyse harmonique, Ph.D

3434

Deuxième facteurDeuxième facteur

single

15 20 25 30 35 40 45

divorced widowmarried

Page 35: Fouille de données fonctionnelles - LIPN · 2012. 7. 30. · 39 Références zCOHEN G. , 1999 Contribution à la prévision des processus aléatoires par l'analyse harmonique, Ph.D

3535

Troisieme facteurTroisieme facteur

celibataires

15 20 25 30 35 40 45

veuve

maries

divorce

t

Page 36: Fouille de données fonctionnelles - LIPN · 2012. 7. 30. · 39 Références zCOHEN G. , 1999 Contribution à la prévision des processus aléatoires par l'analyse harmonique, Ph.D

3636

III Classification (non supervisée)

kk--means, Ward etc. applicables sans means, Ward etc. applicables sans difficulté à des courbes dès que l’on a une difficulté à des courbes dès que l’on a une distance.distance.Processus numériquesProcessus numériques

D’autres distances sont possiblesD’autres distances sont possibles

( )2

2

0( ; ) ( ) ( )

T

i jd i j x t x t dt= −∫

Page 37: Fouille de données fonctionnelles - LIPN · 2012. 7. 30. · 39 Références zCOHEN G. , 1999 Contribution à la prévision des processus aléatoires par l'analyse harmonique, Ph.D

3737

Espaces de SobolevEspaces de Sobolev

Conséquences inattendues d’un lissage ou d’une Conséquences inattendues d’un lissage ou d’une interpolation lissée quand il manque des interpolation lissée quand il manque des observations (Besse, 1979): observations (Besse, 1979): utiliser des splines de utiliser des splines de lissage revient à changer de métrique et donc d’espace lissage revient à changer de métrique et donc d’espace car c’est aussi faire des hypothèses de régularité car c’est aussi faire des hypothèses de régularité (dérivabilité..) sur le processus.(dérivabilité..) sur le processus.Interpoler revient à faire une transformation des Interpoler revient à faire une transformation des données donc implicitement des produits scalaires; données donc implicitement des produits scalaires; L’analyse n’est pas meilleure, elle est différente. L’analyse n’est pas meilleure, elle est différente.

Page 38: Fouille de données fonctionnelles - LIPN · 2012. 7. 30. · 39 Références zCOHEN G. , 1999 Contribution à la prévision des processus aléatoires par l'analyse harmonique, Ph.D

3838

Développements et perspectives

Utiliser les composantes de l’ACP Utiliser les composantes de l’ACP fonctionnelle pour faire du supervisé fonctionnelle pour faire du supervisé

Mais moins bon que PLSMais moins bon que PLS

Plusieurs fonctions : fonctionnel vectoriel Plusieurs fonctions : fonctionnel vectoriel extension des méthodes 3extension des méthodes 3--way way

Page 39: Fouille de données fonctionnelles - LIPN · 2012. 7. 30. · 39 Références zCOHEN G. , 1999 Contribution à la prévision des processus aléatoires par l'analyse harmonique, Ph.D

3939

Références

COHEN G. , 1999 Contribution à la prévision des processus aléatoires par l'analyse harmonique, Ph.D. CNAM Dabo-Niang S., Ferraty F. (2008): Functional and Operatorial Statistics, Springer-VerlagDEVILLE J.C., 1974, « Méthodes statistiques et numériques de l’analyse harmonique », Annales de l’INSEE 15, 3-101 DEVILLE J.C., SAPORTA G., 1979, « Analyse harmonique qualitative », Data Analysis and Informatics, E. Diday eds., North-Holland, 375-389 DEVILLE J.C., SAPORTA G., 1983, « Correspondence analysis, with an extension towards nominal time-series », Journal of Econometrics 22, 169-189 HEIJDEN PGM van der.,1987, Correspondence analysis of longitudinal categorical data, DSWO Press, Leiden PREDA C. , 1999, Analyse factorielle d’un processus, Ph.D. Université Lille 1RAMSAY, J.O. and SILVERMAN, B.W. ,2005: Functional Data Analysis. 2nd ed.SpringerRAMSAY, J.O. and SILVERMAN, B.W., 2002: Applied Functional Data Analysis. Methods and Case Studies. SpringerSAPORTA G., 1985, « Data analysis for numerical and categorical individual time-series », Applied Stochastic Models and Data Analysis vol.1., n°2, 109-119