m1 - management stratégique & economie de l ...rabdesse/documents/ufr-seg/master/m… ·...

24
M1 - Management Stratégique & Economie de l’Environnement, de l’Energie et des Transports UE : Outils statistiques - Analyse des données Polycopié 3 : Segmentation & Analyse Discriminante Barycentrique Année Universitaire 2017-2018 R. Abdesselam Courriel ; [email protected] http ://perso.univ-lyon2.fr/~rabdesse/Documents/

Upload: dinhnguyet

Post on 15-Sep-2018

215 views

Category:

Documents


0 download

TRANSCRIPT

M1 - Management Stratégique & Economie de l’Environnement, de l’Energie et des Transports

UE : Outils statistiques - Analyse des donnéesPolycopié 3 : Segmentation & Analyse Discriminante Barycentrique

Année Universitaire 2017-2018

R. Abdesselam

Courriel ; [email protected]://perso.univ-lyon2.fr/~rabdesse/Documents/

Segmentation – Arbre de décision binaire

Les méthodes de segmentation cherchent à résoudre les problèmes dediscrimination et de régression non paramètrique en segmentant de façonprogressive les individus d'un tableau de données pour obtenir un arbre de décisionbinaire. Elles sont utilisées dans de nombreux domaines notamment en marketing(segmentation des consommateurs, risque pour un crédit bancaire, etc.)

Les arbres de décision sont des outils de modélisation très utilisés pour laclassification supervisée (prédiction d’une variable qualitative) ou de régression(prédiction d’une variable quantitative).

La simplicité de l’interprétation de leurs résultats, présentés sous forme d’un arbrebinaire, constituent un apport efficace pour l’aide à la décision.

Ces méthodes qui requièrent moins d’hypothèses que d’autres méthodes statistiquesclassiques, sont efficaces en présence d’échantillons de tailles importantes. Les arbresde décision sont particulièrement bien adaptés aux situations où les variablesexplicatives sont nombreuses.

Les algorithmes les plus utilisés pour la construction des arbres binaires sont lesalgorithmes : AID-(Automatic Interaction Detection), CART-Classification AndRegression Tree, et C4.5.

2

Segmentation – Arbre de décision binaire

Quantitative : REGRESSION PAR ARBREY (X1, X2, …, Xp)

Les règles d’arrêt :

- Effectif minimum par segment.

- Test de Student : comparaisons de moyennes

dans les deux segments.

Y : Variable à expliquer

Qualitative : ARBRE DE DECISIONY (X1, X2, …, Xp)

Les règles d’arrêt :

- Effectif minimum par segment.

- Test d’indépendance du Khi-deux : Tableau

de contingence croisant Y avec Xi la variable de

segmentation, pour quantifier la liaison. On

choisit la variable Xj la plus liée avec Y.

(X1, X2, …, Xp) : variables explicatives ou de ségmentation

Type : quantitatives, qualitatives ou mixte

Segmentation – Arbre de décision binaire

Comparée aux autres méthodes de discrimination et de classement, lasegmentation n’est pas vraiment une méthode multidimensionnelle au sensgéométrique du terme (pas de calcul de distance comme en AFD).

La segmentation utilise les variables explicatives conditionnellement les unes parrapport aux autres. On peut donc parfois atteindre des effets d’interaction assezdifficiles à détecter par d’autres méthodes.

Avantages :- L’ érgonomie des résultats, l’arbre de décision binaire fourni est lisible par tout

utilisateur et constitue à ce titre un moyen de communication des résultats très apprécié.- La mixité des variables explicatives, elles peuvent être nominales, ordinales,

continues ou un mélange des trois types.- La validation de la segmentation par une méthode ré-échantillonnage est une des

techniques de validations les plus transparentes pour l’utilisateur.- La robustesse de la méthode vis à vis des valeurs extrêmes et des données erronées.

Inconvénients :- Son utilisation exclusive insuffisante.

- l’aspect séquentiel est redoutable : en effet, les covariations qui servent àsélectionner les variables ne mesurent pas un lien causal et une variable peut en cacherune autre beaucoup plus fondamentale, qui n’apparaîtra pas dans la suite du processus.

- l’instabilité des arbres obtenus : de nouvelles techniques tentent d’apporter dessolutions à ce problème.

4

Segmentation - Arbres de décision

Arbre de décision (Discrimination)

Dictionnaire des variables-------------------------------------------------------------------------------------------------------------

1 . Type de client ( appréciation de l’agence ) ( 2 MODALITES )

BON - bon client MAUV - mauvais client

-------------------------------------------------------------------------------------------------------------

Thème 1 - Signalétique :

2 . Genre ( 2 MODALITES )

FEMM - Femme HOMM - Homme

3 . Age du client ( 3 MODALITES )

AGE1 - moins de 40 ans AGE2 - 40 à 50 ans AGE3 - plus de 50 ans

4 . Situation familiale ( 4 MODALITES )

CELB - célibataire MARI – marié(e) DIVO – divorcé(e) VEUF – veuf(ve)

5 . Niveau d’éducation - Diplôme ( 4 MODALITES )

PDIPL – Pas de diplôme DSEC – Diplôme d’études secondaires

NUNI – Niveau universitaire intermédiaire BPLU - Bac+3 et plus

6 . Profession ( 3 MODALITES )

CADR - cadre EMPL – employé(e) INTER – profession intermédiaire

Thème 2 - Caractéristiques du compte bancaire client :

7 . Domiciliation du salaire du client à l’agence ( 2 MODALITES )

OUI - salaire domicilié NON – salaire non domicile

8 . Autorisation de découvert ( 2 MODALITES )

OUI - découvert autorisé NON - découvert interdit

9 . Interdiction de chéquier ( 2 MODALITES )

OUI - chéquier interdit NON - chéquier autorisé

10 . Montant de l'épargne ( CONTINUE )

11 . Nombre d'années d'ancienneté client ( CONTINUE )

12 . Encours moyens du compte bancaire ( CONTINUE )

13 . Mouvements bancaires moyens ( CONTINUE )

14 . Cumul moyen des débits bancaires ( CONTINUE )

-----------------------------------------------------------------------------------------------------------

Var

iab

le

à se

gm

ente

r

Var

iab

les

de

seg

men

tati

on

Mix

te -

Th

ème

2

Arbre de décision (Discrimination)1 . Type de client ( QUALITATIVE ) Bon / Mauvais

Racine :

Effectif : 328

Pourcentages Bon (50%) Mauvais (50%)

Nœud n°9 : Segment terminal

Caractéristiques :

Effectif : 20 clients (6%)

Bon : 4 clients (5%)

Mauvais : 16 clients (95%)

Ancienneté < 4 ans

Montant des encours < 480

Domiciliation du salaire à l’agence : Oui 10 niveaux – 6 segments terminaux

Arbre de décision (Discrimination)

Effectifs (apprentissage)

Type de client Classé Bon Classé Mauvais Total

Bon 131 34 165

Mauvais 28 135 163

Total 159 169 328

Effectifs (test)

Type de client Classé Bon Classé Mauvais Total

Bon 52 20 72

Mauvais 14 54 68

Total 66 74 140

Matrice de classement en % (apprentissage)

Type de client Bien classé Mal classé

Bon 79,4 20,6

Mauvais 82,8 17,2

Total 81,1 18,9

Matrice de classement en % (test)

Type de client Bien classé Mal classé

Bon 72,2 27,8

Mauvais 79,4 20,6

Total 75,7 24,3

Tableaux de classement

Matrices de confusion

Arbre de décision (Discrimination)

1 . Marque du constructeur ( Française / Etrangère )

4 niveaux – 4 segments terminaux

Arbre de décision (Discrimination)

2 . Puissance fiscale ( 4CV , 5CV , 6CV )

3 niveaux – 3 segments terminaux

Arbre de décision (Régression)Dictionnaire des variables

-------------------------------------------------------------------------------------------------------------

1 . Type de client ( appréciation de l’agence ) ( 2 MODALITES )

BON - bon client MAUV - mauvais client

-------------------------------------------------------------------------------------------------------------

Thème 1 - Signalétique :

2 . Genre ( 2 MODALITES )

FEMM - Femme HOMM - Homme

3 . Age du client ( 3 MODALITES )

AGE1 - moins de 40 ans AGE2 - 40 à 50 ans AGE3 - plus de 50 ans

4 . Situation familiale ( 4 MODALITES )

CELB - célibataire MARI – marié(e) DIVO – divorcé(e) VEUF – veuf(ve)

5 . Niveau d’éducation - Diplôme ( 4 MODALITES )

PDIPL – Pas de diplôme DSEC – Diplôme d’études secondaires

NUNI – Niveau universitaire intermédiaire BPLU - Bac+3 et plus

6 . Profession ( 3 MODALITES )

CADR - cadre EMPL – employé(e) INTER – profession intermédiaire

Thème 2 - Caractéristiques du compte bancaire client :

7 . Domiciliation du salaire du client à l’agence ( 2 MODALITES )

OUI - salaire domicilié NON – salaire non domicile

8 . Autorisation de découvert ( 2 MODALITES )

OUI - découvert autorisé NON - découvert interdit

9 . Interdiction de chéquier ( 2 MODALITES )

OUI - chéquier interdit NON - chéquier autorisé

10 . Montant de l'épargne ( CONTINUE )

11 . Nombre d'années d'ancienneté client ( CONTINUE )

12 . Encours moyens du compte bancaire ( CONTINUE )

13 . Mouvements bancaires moyens ( CONTINUE )

14 . Cumul moyen des débits bancaires ( CONTINUE )

-----------------------------------------------------------------------------------------------------------

Var

iab

le à

seg

men

ter

Var

iab

les

de

seg

men

tati

on

-M

ixte

Arbre de décision (Régression)11 . Nombre d'années d'ancienneté client ( CONTINUE )

Racine :

Effectif : 377

Moyenne - Années d’ancienneté = 6.025

Nœud n°9 : Segment terminal

Caractéristiques :

Effectif : 91 clients (24%)

Moyenne - Années d’ancienneté = 7.354

Montant des encours < 772.5

Domiciliation du salaire : Oui

Moyenne des mouvements 2830

7 niveaux – 8 segments terminaux

Arbre de décision (Régression)

Prix de la voiture ( CONTINUE )

Arbre de décision ( Régression )

Description de la méthodeAlgorithme AID

Effectif minimum pour segmenter 5

Pourcentage minimum dans les feuilles 2,000

Nombre maximum de niveaux 14

Seuil de spécialisation 1,000

Proba. critique pour la segmentation 0,010

Proba. critique pour la fusion 0,050

Caractéristiques de l'arbreNb noeuds 15

Nb feuilles 8

Profondeur max 4

Nb variables explicatives 4

Echantillon d'apprentissage 377

Echantillon test 91

Impact global des variablesVariable Impact global

Domiciliation du salaire 0,017

Autorisation de découvert 0,000

Interdiction de chéquier 0,000

Montant de l'épargne 0,012

Montant encours 0,017

Moyenne des mouvements 0,027

Nombre Cumulé des débits 0,010

Indicateur Apprentissage Test

Taille de l'échantillon 377,000 91,000

Moyenne des erreurs 0,000 0,767

Réduction de l'erreur 0,754 0,782

Analyse Discriminante Barycentrique

L’analyse discriminante barycentrique est une des techniques d’exploration desdonnées mettant en pratique les méthodes d’analyse de données classiques,dans un contexte méthodologique en fonction de l’objectif recherché et de lanature des variables retenues pour cette étude.

C’est une méthode structurelle des données qualitatives qui revient à faire uneanalyse des correspondances du tableau croisant en ligne la variable à expliqueret en colonne les variables explicatives.

Le tableau ainsi constitué et en fait une bande du tableau de Burt qui permet dedécrire les liens éventuels entre la variable à expliquer et l’ensemble des variablesexplicatives.

On enchaîne ensuite, sur les composantes de l’analyse des correspondances, uneClassification Ascendante Hiérarchique - CAH afin de caractériser les lignes dutableau de Burt, c’est-à-dire les modalités de la variable à expliquer.

Dans le cas où les variables explicatives sont indépendantes deux à deux,l’analyse barycentrique est équivalente à l’Analyse Factorielle Discriminante – AFDsur variables explicatives qualitatives.

15

Analyse Discriminante Barycentrique

---------------------------------------------------------------------------------------------

1 . POID - Poids redressement ( CONTINUE )

---------------------------------------------------------------------------------------------

Thème : Signalétique - Variables discriminantes

5 . Sexe ( 2 MODALITES )

HOMM - Homme FEMM - Femme

6 . Age du créateur repreneur ( 5 MODALITES )

-25a - moins de 25 ans 2529 - 25-29 ans 3039 - 30-39 ans

4049 - 40-49 ans 50+ - 50 ans et plus

7 . Qualification prof. avant création ( 9 MODALITES )

ARCO - artisan commerçant AGMA - agent de maîtrise EMPL - employé

ETUD – etudiant CHEF - chef d'entreprise OUVR - ouvrier

INAQ – inactif CADR – cadre PRIN - profession intermédiaire

9 . Niveau diplôme ( 4 MODALITES )

CBBE - CAP/BEP/BEPC BAGT - Bac général tech

B+2+ - Bac +2 et plus PDIP - Pas de diplôme

10 . Nationalité ( 3 MODALITES )

FRAN - française EURO - europe AUTR - hors UE

---------------------------------------------------------------------------------------------

Variable à discriminer

32 . Pérennité en classes des entreprises ( 5 MODALITES )

< 1 - Less than 1 year 1-2 - 1-2 year life span

2-3 - 2-3 year life span 3-4 - 3-4 year life span

Livg - Living firms

--------------------------------------------------------------------------------

Dictionnaire des variables

Analyse Discriminante Barycentrique

TABLEAU DE BURT

| HOMM FEMM | -25a 2529 3039 4049 50+ | ARCO CHEF CADR AGMA PRIN EMPL OUVR ETUD INAQ | CBBE BAGT B+2+ PDIP | FRAN EURO AUTR |

-----+------------+--------------------------+----------------------------------------------+---------------------+----------------+

< 1 | 4307 2455 | 613 1747 2290 1470 642 | 574 205 872 261 586 2215 889 355 805 | 2482 1140 1550 1590 | 5921 277 564 |

1-2 | 5729 2755 | 711 1798 2640 2210 1125 | 965 455 1331 381 512 2549 1169 322 800 | 3310 1354 1786 2034 | 7565 288 631 |

2-3 | 5436 2510 | 505 1563 2665 2274 939 | 803 492 1531 402 492 2072 1047 312 795 | 3011 1247 1799 1889 | 6915 344 687 |

3-4 | 4625 2329 | 479 1399 2155 1812 1109 | 813 512 1046 354 342 2022 918 202 745 | 2725 1051 1454 1724 | 6169 332 453 |

Livg |26604 10543 | 1438 65901316211255 4702 | 5838 2557 6960 1658 2366 9093 5231 1326 2118 |14453 562810371 6695 |34243 1419 1485 |

-----+------------+--------------------------+----------------------------------------------+---------------------+----------------+

| HOMM FEMM | -25a 2529 3039 4049 50+ | ARCO CHEF CADR AGMA PRIN EMPL OUVR ETUD INAQ | CBBE BAGT B+2+ PDIP | FRAN EURO AUTR |

5 Classes d’entreprises

Analyse Discriminante Barycentrique

Pérénité des entreprises selon la signalétique du Créateur-Repreneur d’entreprise

less 1 year : 10.05%

2-3 year : 11.81%

1-2 year : 12.61%

3-4 year : 10.33%

Living : 55.20% Living firms

3-4 years

1-2 years

2-3 years

Less 1 year

SELECTION DES INDIVIDUS ET DES VARIABLES UTILES : FREQUENCES ACTIVES 23 VARIABLES

---------------------------------------------------------------------------------------------------

1 . Man ( CONTINUE )

2 . Woman ( CONTINUE )

3 . Under 25 years ( CONTINUE )

4 . 25-29 years old ( CONTINUE )

5 . 30-39 years old ( CONTINUE )

6 . 40-49 years old ( CONTINUE )

7 . 50 years old - over ( CONTINUE )

8 . Craftsman-shopkeeper ( CONTINUE )

9 . Manager ( CONTINUE )

10 . Executive ( CONTINUE )

11 . Skilled worker ( CONTINUE )

12 . Semi skilled worker ( CONTINUE )

13 . employee ( CONTINUE )

14 . Worker ( CONTINUE )

15 . Student over 15 y. ( CONTINUE )

16 . inactive people ( CONTINUE )

17 . Intermediate Level ( CONTINUE )

18 . Second.School exam ( CONTINUE )

19 . After 2 years univ. ( CONTINUE )

20 . unqualified ( CONTINUE )

21 . French ( CONTINUE )

22 . European Union ( CONTINUE )

23 . Non European Union ( CONTINUE )

---------------------------------------------------------------------------------------------------

INDIVIDUS

----------------------------- NOMBRE -------------- POIDS ---------------

POIDS DES INDIVIDUS: Poids des individus (somme des frequences actives).

RETENUS ............ NITOT = 5 PITOT = 336465.000

ACTIFS ............. NIACT = 5 PIACT = 336465.000

SUPPLEMENTAIRES .... NISUP = 0 PISUP = 0.000

-------------------------------------------------------------------------

Dictionnaire des variables

Analyse Discriminante Barycentrique

CARACTERISATION DES CLASSES

Classe 1 / 5 : Less 1 year+---------------+-------------------------+-------------------------------------------------------------------------+---------+

| V.TEST PROBA | POURCENTAGES | FREQUENCES CARACTERISTIQUES | POIDS |

| | CLA/FRE FRE/CLA GLOBAL | NUM . LIBELLE IDEN | |

+---------------+-------------------------+-------------------------------------------------------------------------+---------+

| | | | |

| | 10.05 | Classe 1 / 5 aa1a | 33810 |

| | | | |

| 12.24 0.0000 | 13.34 5.17 3.89 | 4 . 25-29 years old 25-2 | 13097 |

| 11.97 0.0000 | 16.36 1.81 1.11 | 3 . Under 25 years Unde | 3746 |

| 11.95 0.0000 | 15.30 2.38 1.56 | 16 . inactive people inac | 5263 |

| 10.18 0.0000 | 12.34 6.55 5.34 | 13 . employee empl | 17951 |

| 9.17 0.0000 | 14.76 1.67 1.14 | 23 . Non European Union Non | 3820 |

| 9.00 0.0000 | 11.92 7.26 6.12 | 2 . Woman Woma | 20592 |

| 7.50 0.0000 | 13.63 1.73 1.28 | 12 . Semi skilled worker Semi | 4298 |

| 6.43 0.0000 | 14.10 1.05 0.75 | 15 . Student over 15 y. Stud | 2517 |

| 5.31 0.0000 | 11.40 4.70 4.14 | 20 . unqualified unqu | 13930 |

| 3.03 0.0012 | 10.94 3.37 3.10 | 18 . Second.School exam Seco | 10420 |

| | | | |

| -2.73 0.0032 | 9.56 7.35 7.72 | 17 . Intermediate Level Inte | 25983 |

| -2.81 0.0025 | 8.54 0.77 0.91 | 11 . Skilled worker Skil | 3056 |

| -2.83 0.0023 | 9.74 17.51 18.07 | 21 . French Fren | 60813 |

| -4.08 0.0000 | 9.14 4.58 5.04 | 19 . After 2 years univ. Afte | 16960 |

| -6.46 0.0000 | 9.22 12.74 13.88 | 1 . Man Man | 46701 |

| -8.10 0.0000 | 7.54 1.90 2.53 | 7 . 50 years old - over 50 y | 8517 |

| -10.00 0.0000 | 7.43 2.58 3.49 | 10 . Executive Exec | 11740 |

| -11.34 0.0000 | 7.73 4.35 5.65 | 6 . 40-49 years old 40-4 | 19021 |

| -12.38 0.0000 | 4.86 0.61 1.25 | 9 . Manager Mana | 4221 |

| -12.44 0.0000 | 6.38 1.70 2.67 | 8 . Craftsman-shopkeeper Craf | 8993 |

+---------------+-------------------------+-------------------------------------------------------------------------+---------+

Analyse Discriminante Barycentrique

CARACTERISATION DES CLASSES

Classe 2 / 5 : 2-3 years+---------------+-------------------------+-------------------------------------------------------------------------+---------+

| V.TEST PROBA | POURCENTAGES | FREQUENCES CARACTERISTIQUES | POIDS |

| | CLA/FRE FRE/CLA GLOBAL | NUM . LIBELLE IDEN | |

+---------------+-------------------------+-------------------------------------------------------------------------+---------+

| | | | |

| | 11.81 | Classe 2 / 5 aa2a | 39730 |

| | | | |

| 11.15 0.0000 | 17.98 1.73 1.14 | 23 . Non European Union Non | 3820 |

| 7.19 0.0000 | 15.11 2.00 1.56 | 16 . inactive people inac | 5263 |

| 6.41 0.0000 | 13.56 4.75 4.14 | 20 . unqualified unqu | 13930 |

| 4.14 0.0000 | 13.04 3.85 3.49 | 10 . Executive Exec | 11740 |

| 3.11 0.0009 | 13.48 1.27 1.11 | 3 . Under 25 years Unde | 3746 |

| 2.26 0.0119 | 13.15 1.01 0.91 | 11 . Skilled worker Skil | 3056 |

| 1.76 0.0393 | 12.93 0.87 0.79 | 22 . European Union Euro | 2660 |

| 1.73 0.0416 | 12.19 6.32 6.12 | 2 . Woman Woma | 20592 |

| | | | |

| -2.27 0.0116 | 11.03 2.36 2.53 | 7 . 50 years old - over 50 y | 8517 |

| -3.70 0.0001 | 11.37 17.40 18.07 | 21 . French Fren | 60813 |

| -5.03 0.0000 | 10.61 4.53 5.04 | 19 . After 2 years univ. Afte | 16960 |

| -8.88 0.0000 | 8.93 2.02 2.67 | 8 . Craftsman-shopkeeper Craf | 8993 |

+---------------+-------------------------+-------------------------------------------------------------------------+---------+

Analyse Discriminante Barycentrique

CARACTERISATION DES CLASSES

Classe 3 / 5 : 1-2 years+---------------+-------------------------+-------------------------------------------------------------------------+---------+

| V.TEST PROBA | POURCENTAGES | FREQUENCES CARACTERISTIQUES | POIDS |

| | CLA/FRE FRE/CLA GLOBAL | NUM . LIBELLE IDEN | |

+---------------+-------------------------+-------------------------------------------------------------------------+---------+

| | | | |

| | 12.61 | Classe 3 / 5 aa3a | 42420 |

| | | | |

| 11.11 0.0000 | 18.98 1.68 1.11 | 3 . Under 25 years Unde | 3746 |

| 7.09 0.0000 | 14.60 4.79 4.14 | 20 . unqualified unqu | 13930 |

| 7.02 0.0000 | 16.52 1.49 1.14 | 23 . Non European Union Non | 3820 |

| 6.49 0.0000 | 14.20 6.01 5.34 | 13 . employee empl | 17951 |

| 5.55 0.0000 | 15.20 1.89 1.56 | 16 . inactive people inac | 5263 |

| 3.89 0.0001 | 13.73 4.24 3.89 | 4 . 25-29 years old 25-2 | 13097 |

| 3.41 0.0003 | 13.38 6.49 6.12 | 2 . Woman Woma | 20592 |

| 1.67 0.0474 | 13.21 2.65 2.53 | 7 . 50 years old - over 50 y | 8517 |

| | | | |

| -2.39 0.0085 | 12.27 13.51 13.88 | 1 . Man Man | 46701 |

| -2.80 0.0026 | 10.83 0.68 0.79 | 22 . European Union Euro | 2660 |

| -3.65 0.0001 | 10.78 1.07 1.25 | 9 . Manager Mana | 4221 |

| -4.26 0.0000 | 11.62 5.21 5.65 | 6 . 40-49 years old 40-4 | 19021 |

| -4.26 0.0000 | 11.34 3.14 3.49 | 10 . Executive Exec | 11740 |

| -5.17 0.0000 | 11.52 6.22 6.81 | 5 . 30-39 years old 30-3 | 22912 |

| -5.54 0.0000 | 10.73 2.27 2.67 | 8 . Craftsman-shopkeeper Craf | 8993 |

| -8.55 0.0000 | 10.53 4.21 5.04 | 19 . After 2 years univ. Afte | 16960 |

+---------------+-------------------------+-------------------------------------------------------------------------+---------+

Analyse Discriminante Barycentrique

CARACTERISATION DES CLASSES

Classe 4 / 5 : 3-4 years+---------------+-------------------------+-------------------------------------------------------------------------+---------+

| V.TEST PROBA | POURCENTAGES | FREQUENCES CARACTERISTIQUES | POIDS |

| | CLA/FRE FRE/CLA GLOBAL | NUM . LIBELLE IDEN | |

+---------------+-------------------------+-------------------------------------------------------------------------+---------+

| | | | |

| | 10.33 | Classe 4 / 5 aa4a | 34770 |

| | | | |

| 8.74 0.0000 | 14.16 2.14 1.56 | 16 . inactive people inac | 5263 |

| 7.96 0.0000 | 13.02 3.19 2.53 | 7 . 50 years old - over 50 y | 8517 |

| 7.87 0.0000 | 12.38 4.96 4.14 | 20 . unqualified unqu | 13930 |

| 4.79 0.0000 | 12.79 1.38 1.11 | 3 . Under 25 years Unde | 3746 |

| 4.68 0.0000 | 11.31 6.70 6.12 | 2 . Woman Woma | 20592 |

| 4.15 0.0000 | 11.26 5.82 5.34 | 13 . employee empl | 17951 |

| 3.75 0.0001 | 12.13 1.47 1.25 | 9 . Manager Mana | 4221 |

| 3.53 0.0002 | 12.48 0.95 0.79 | 22 . European Union Euro | 2660 |

| 3.03 0.0012 | 11.86 1.30 1.14 | 23 . Non European Union Non | 3820 |

| 2.22 0.0132 | 11.58 1.02 0.91 | 11 . Skilled worker Skil | 3056 |

| | | | |

| -1.69 0.0452 | 10.14 17.74 18.07 | 21 . French Fren | 60813 |

| -3.30 0.0005 | 9.90 13.30 13.88 | 1 . Man Man | 46701 |

| -3.79 0.0001 | 9.53 5.21 5.65 | 6 . 40-49 years old 40-4 | 19021 |

| -3.91 0.0000 | 8.03 0.58 0.75 | 15 . Student over 15 y. Stud | 2517 |

| -4.14 0.0000 | 9.04 2.34 2.67 | 8 . Craftsman-shopkeeper Craf | 8993 |

| -4.83 0.0000 | 9.41 6.20 6.81 | 5 . 30-39 years old 30-3 | 22912 |

| -5.25 0.0000 | 8.91 3.01 3.49 | 10 . Executive Exec | 11740 |

| -5.31 0.0000 | 7.96 0.98 1.28 | 12 . Semi skilled worker Semi | 4298 |

| -7.91 0.0000 | 8.57 4.18 5.04 | 19 . After 2 years univ. Afte | 16960 |

+---------------+-------------------------+-------------------------------------------------------------------------+---------+

Analyse Discriminante Barycentrique

CARACTERISATION DES CLASSES

Classe 5 / 5 : Living firms+---------------+-------------------------+-------------------------------------------------------------------------+---------+

| V.TEST PROBA | POURCENTAGES | FREQUENCES CARACTERISTIQUES | POIDS |

| | CLA/FRE FRE/CLA GLOBAL | NUM . LIBELLE IDEN | |

+---------------+-------------------------+-------------------------------------------------------------------------+---------+

| | | | |

| | 55.20 | Classe 5 / 5 aa5a | 185735 |

| | | | |

| 18.96 0.0000 | 64.92 3.14 2.67 | 8 . Craftsman-shopkeeper Craf | 8993 |

| 16.06 0.0000 | 61.15 5.58 5.04 | 19 . After 2 years univ. Afte | 16960 |

| 11.36 0.0000 | 59.17 6.06 5.65 | 6 . 40-49 years old 40-4 | 19021 |

| 9.08 0.0000 | 59.28 3.75 3.49 | 10 . Executive Exec | 11740 |

| 8.27 0.0000 | 56.97 14.32 13.88 | 1 . Man Man | 46701 |

| 7.09 0.0000 | 60.58 1.38 1.25 | 9 . Manager Mana | 4221 |

| 7.08 0.0000 | 57.45 7.09 6.81 | 5 . 30-39 years old 30-3 | 22912 |

| 6.06 0.0000 | 56.31 18.44 18.07 | 21 . French Fren | 60813 |

| 2.59 0.0048 | 56.53 2.82 2.75 | 14 . Worker Work | 9254 |

| | | | |

| -1.91 0.0280 | 53.35 0.76 0.79 | 22 . European Union Euro | 2660 |

| -2.47 0.0067 | 54.01 3.03 3.10 | 18 . Second.School exam Seco | 10420 |

| -2.53 0.0057 | 52.68 0.71 0.75 | 15 . Student over 15 y. Stud | 2517 |

| -11.43 0.0000 | 50.32 3.55 3.89 | 4 . 25-29 years old 25-2 | 13097 |

| -11.89 0.0000 | 51.20 5.68 6.12 | 2 . Woman Woma | 20592 |

| -12.56 0.0000 | 50.65 4.90 5.34 | 13 . employee empl | 17951 |

| -17.25 0.0000 | 48.06 3.60 4.14 | 20 . unqualified unqu | 13930 |

| -20.34 0.0000 | 38.87 0.80 1.14 | 23 . Non European Union Non | 3820 |

| -20.75 0.0000 | 38.39 0.77 1.11 | 3 . Under 25 years Unde | 3746 |

| -21.92 0.0000 | 40.24 1.14 1.56 | 16 . inactive people inac | 5263 |

+---------------+-------------------------+-------------------------------------------------------------------------+---------+