analyse et représentation des données spatiales et

36
Analyse et représentation des données spatiales et textuelles - ARDST Christine ZANIN [email protected] Code Moodle : L3GEO_ARDST_2020 Partie 1 : Introduction Stat&Carto, une nécessaire complémentarité Mathilde RESCH [email protected]

Upload: others

Post on 21-Oct-2021

9 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Analyse et représentation des données spatiales et

Analyse et représentation des données

spatiales et textuelles - ARDST

Christine [email protected]

Code Moodle :L3GEO_ARDST_2020

Partie 1 : IntroductionStat&Carto, une nécessaire complémentarité

Mathilde [email protected]

Page 2: Analyse et représentation des données spatiales et

ARDST - L3 - Cours1 – 2020-2021

30h Cours intégré – 3 ECTS - coefficient 110 séances les jeudis

24/09 ; 01/10 ; 08/10 ; 15/10 ; 22/10 ; 12/11 ; 19/11 ; 26/11 ; 03/12 ; 10/12

Groupe 1 : 10 séances le jeudi de 9h30-12h30, salle OdG 377 Christine Zanin

Groupe 2 : 10 séances le jeudi de 16h à 19h, salle OdG 377. Mathilde Resch

Analyse et représentation des données spatiales et textuelles - ARDST

Page 3: Analyse et représentation des données spatiales et

ARDST - L3 - Cours1 – 2020-2021

●Programme général

Introduction générale et présentation de l’analyse de données (2 séances)

Rappels de statistiques univariées et bivariées

Rappels de sémiologie graphique et de cartographie des données statistiques

Application : Election présidentielle 2017 et contexte social à Paris

Chapitre 1 : introduction aux analyses factorielles (3 séances)

Application : Election présidentielle 2017 et contexte social à Paris (suite)

Chapitre 2 : introduction aux méthodes de classification (3 séances)

Application : Cycles de températures Europe/Afrique

Chapitre 3 : introduction aux méthodes d’analyse textuelle (1 séance)

Application : Conflit autour des captages d’eau à Paris

Page 4: Analyse et représentation des données spatiales et

ARDST - L3 - Cours1 – 2020-2021

●Evaluation

1) La connaissance des notions théoriques : 1 DST (3ème séance)

2) Le travail personnel (DM(s)) : rendu des cartes de chaque TD(3 au minimum).

3) La capacité d’analyse des résultats d’une analyse de données :1 DST (dernière séance)

100% en CC

Page 5: Analyse et représentation des données spatiales et

ARDST - L3 - Cours1 – 2020-2021

STAT - CARTO

Page 6: Analyse et représentation des données spatiales et

ARDST - L3 - Cours1 – 2020-2021

Approches descriptives (analyse des données)

Approches explicatives

Approches exploratoires

Approche statistiques spatiales

Les méthodes statistiques en géographie

Ensemble de techniques et méthodes statistiques pour identifier, décrire et expliquer les formes de répartitions d’un phénomène dans l’espace.

Page 7: Analyse et représentation des données spatiales et

ARDST - L3 - Cours1 – 2020-2021

La statistique descriptive, statistique exploratoire ouanalyse des données, a pour but de résumer l'informationcontenue dans les données de façon synthétique et efficace

La statistique inférentielle ou confirmatoire va au delà dela simple description des données. Elle a pour but de fairedes prévisions et de prendre des décisions au vu desobservations.

Les méthodes statistiques en géographie

Page 8: Analyse et représentation des données spatiales et

ARDST - L3 - Cours1 – 2020-2021

Les modalités de choix d’un traitement statistique

Page 9: Analyse et représentation des données spatiales et

ARDST - L3 - Cours1 – 2020-2021

Les tableaux de données(Rappels)

Modalité de la

variable « total des

inscrits » pour le

Limousin, à

savoir 17446

Régio Code Total des inscrits

IUT STS CPGE

ILE-DE-France IDF 426698 4,1 10,2 5,2

CHAMPAGNE-ARDENNES CHAM 29294 10,3 18,8 4,1

PICARDIE PICA 30836 9,3 23,1 3,2

HAUTE-NORMANDIE H.NO 36796 10,7 15,8 3,5

CENTRE CENT 48457 9,7 18,7 4,3

BASSE-NORMANDIE B.NO 30746 9,2 16,3 3,4

BOURGOGNE BOUR 31976 8,0 19,0 4,7

NORD PAS DE CALAIS NORD 117059 7,4 17,3 4,2

LORRAINE LORR 63595 9,3 13,6 3,2

ALSACE ALSA 54309 7,4 13,2 4,0

FRANCHE-COMTE FR C 27506 9,7 17,6 3,2

PAYS DE LA LOIRE PAYS 74630 7,4 21,9 4,7

BRETAGNE BRET 83478 8,5 17,2 3,9

POITOU-CHARENTES POIT 37373 8,4 16,3 3,3

AQUITAINE AQUI 78595 6,5 14,3 3,3

MIDI PYRENEES MIDI 89119 7,2 12,3 3,4

LIMOUSIN LIMO 17446 9,8 20,4 2,7

RHONE ALPES RHON 174158 8,3 13,7 4,2

AUVERGNE AUVE 32893 8,1 16,3 3,9

LANGUEDOC-ROUSSILLON LANG 74359 5,4 13,4 2,8

PROVENCE ALPES COTE D'AZUR PACA 129117 6,4 11,9 3,8

CORSE CORS 4342 6,8 15,7 1,7

Variable ou

caractère

statistique

Quantitatif

de stock, de taux

etc.

Individus

Statistiques (élément observé)

Ici des unités

spatiales

c. à d. des régions

Page 10: Analyse et représentation des données spatiales et

ARDST - L3 - Cours1 – 2020-2021

Régions Code Total des inscrits

IUT STS CPGE

ILE-DE-France IDF 426698 4,1 10,2 5,2

CHAMPAGNE-ARDENNES CHAM 29294 10,3 18,8 4,1

PICARDIE PICA 30836 9,3 23,1 3,2

HAUTE-NORMANDIE H.NO 36796 10,7 15,8 3,5

CENTRE CENT 48457 9,7 18,7 4,3

BASSE-NORMANDIE B.NO 30746 9,2 16,3 3,4

BOURGOGNE BOUR 31976 8,0 19,0 4,7

NORD PAS DE CALAIS NORD 117059 7,4 17,3 4,2

LORRAINE LORR 63595 9,3 13,6 3,2

ALSACE ALSA 54309 7,4 13,2 4,0

FRANCHE-COMTE FR C 27506 9,7 17,6 3,2

PAYS DE LA LOIRE PAYS 74630 7,4 21,9 4,7

BRETAGNE BRET 83478 8,5 17,2 3,9

POITOU-CHARENTES POIT 37373 8,4 16,3 3,3

AQUITAINE AQUI 78595 6,5 14,3 3,3

MIDI PYRENEES MIDI 89119 7,2 12,3 3,4

LIMOUSIN LIMO 17446 9,8 20,4 2,7

RHONE ALPES RHON 174158 8,3 13,7 4,2

AUVERGNE AUVE 32893 8,1 16,3 3,9

LANGUEDOC-ROUSSILLON LANG 74359 5,4 13,4 2,8

PROVENCE ALPES COTE D'AZUR PACA 129117 6,4 11,9 3,8

CORSE CORS 4342 6,8 15,7 1,7

Lecture verticale du tableau :

• Privilégier l’entrée par les variables ou caractères• Privilégier les ressemblances entre les variables

Lecture horizontale du tableau :

• Privilégier l’entrée par les individus ou unités spatiales• Privilégier les ressemblances en liens avec la proximité

Les tableaux de données(Rappels)

Page 11: Analyse et représentation des données spatiales et

ARDST - L3 - Cours1 – 2020-2021

Exemples de questionnements géographiques possibles :• Quelle est l’importance des étudiants dans les régions

métropolitaines françaises ?

• Quel est le secteur disciplinaire qui regroupe le plus d’inscrits ? Etc

Pour analyser et interpréter il faut commencer par faire du tri, ordonner, résumer

A partir de quels éléments peut-on commencer à construire un résumé

• Quels ordres de grandeur à retenir ?

• Quelles sont les formations qui introduisent le plus de différenciations entre les régions ?

• L’importance d’un cycle de formation dépend-elle systématiquement des cycles antérieurs ?

La construction du tableau de données

Page 12: Analyse et représentation des données spatiales et

ARDST - L3 - Cours1 – 2020-2021

Résumer les données

Nous disposons de plusieurs types de paramètres, dont les plus simples sont :

Page 13: Analyse et représentation des données spatiales et

ARDST - L3 - Cours1 – 2020-2021

Pour les géographes 3 types d’analyses

DONC ….

Page 14: Analyse et représentation des données spatiales et

ARDST - L3 - Cours1 – 2020-2021

LA cartographie ou DES cartographies

La carte permet de dépasser l'horizonClaude Aschenbrenner (www.serialmapper.com)

« Aucune carte n’est digne d’un regard si le pays de l’Utopie n’y figure pas » Oscar Wilde

« La cartographie est l’ensemble des études et des opérations scientifiques, artistiques et techniques, intervenant à partir des résultats d’opérations directes ou de l’exploitation d’une documentation, en vue de l’élaboration et de l’établissement de cartes, plans et autres modes d’expression, ainsi que dans leur utilisation. » Le comité Français de Cartographie

Page 15: Analyse et représentation des données spatiales et

ARDST - L3 - Cours1 – 2020-2021

LA cartographie ou DES cartographies

Un monde de cartes ou le passage par une représentation graphique adaptée d’un territoire :« comprendre et maîtriser l’espace ».

• La cartographie antique• La cartographique topographique• La cartographie thématique• La cartographie statistique

« Si ardu étant ce chemin qu’il serait difficile de le donner à entendre par des paroles ou de l’écrire avec la plume. La meilleure explication qu’ait trouvé pour cela le génie des hommes est de le donner en peinture sur une carte. » Martin Cortès, géographe et mathématicien du XVIe siècle

Page 16: Analyse et représentation des données spatiales et

ARDST - L3 - Cours1 – 2020-2021

Cartes topographiques

Échelle jusqu’au 1/100 000Objectif : carte de base comprenant les éléments essentiels à la localisation ;Contenu : relief, hydrographie, chemins et routes, etc. ;Représentation : selon des signes conventionnels.

Page 17: Analyse et représentation des données spatiales et

ARDST - L3 - Cours1 – 2020-2021

Carte chorographique Échelle du 1/100 000 au 1 000 000Objectif mise en évidence d’états des surfaces (extension d’objets ou phénomènes) ; carte pouvant être plus ou moins compliquée selon la quantité de phénomènes représentés ;Contenu données qualitatives ;Représentation couleurs ou trames, avec ou sans fond (topographique, image, etc.) ;Exemple cartes géologiques, administratives, etc.

Cartes thématiques

Page 18: Analyse et représentation des données spatiales et

ARDST - L3 - Cours1 – 2020-2021

carte choroplèthe(carte en plages de valeurs)Objectif montrer les variations d’intensité d’un phénomène surfacique ;Contenu données quantitatives ;Représentation couleur (teintes différentes) ou trames, blanc = valeur nulle ;Exemple carte de densité.

Cartes thématiques statistiques

Page 19: Analyse et représentation des données spatiales et

ARDST - L3 - Cours1 – 2020-2021

carte en pointsObjectif signaler avec exactitude la présence effective d’un objet en un lieu donné ou indiquer la localisation supposée de collections d’objets, le point ayant une valeur définie par convention (par ex., chaque point « vaut » 100 000 habitants) ;Contenu données quantitatives (par ex., 1 point équivaut à 100 000 moutons) ou données qualitatives (par ex., 1 point bleu signifie un village où on parle français, 1 point rouge où on parle romanche, etc.) ;Représentation pour une collection d’objets, les points sont en principe répartis à l’intérieur de la conscription avec la même densité, mais peuvent aussi être répartis de manière hétérogène, selon le type de signification ;Exemple répartition de population.

Cartes thématiques statistiques

Page 20: Analyse et représentation des données spatiales et

ARDST - L3 - Cours1 – 2020-2021

carte en courbesObjectif exprimer des différences de valeurs dans l’espace (comme les cartes en plages), mais, ici, l’information est obtenue sur des points ;Contenu données obtenues à partir de données ponctuelles, par interpolation ou pas. Données absolues ou relatives ; Représentation lignes ;Exemples courbes de niveau du Modèle Numérique de Terrain, carte des profondeurs marines, carte de la pluviosité, etc.

Cartes thématiques statistiques

Page 21: Analyse et représentation des données spatiales et

ARDST - L3 - Cours1 – 2020-2021

carte en proportionsObjectif cartes qui conduisent à tirer parti des hiérarchies et des relations de proportionnalité pour simplifier les représentations, tout en gardant la gradation des ordres de grandeur. Représenter visuellement les proportions exactes des phénomènes ;Contenu données quantitatives ;Représentation barres proportionnelles, cercles proportionnels ;Exemples cercles proportionnels à la population.

Cartes thématiques statistiques

Page 22: Analyse et représentation des données spatiales et

ARDST - L3 - Cours1 – 2020-2021

carte en diagrammesObjectif exprimer plusieurs choses à la fois sur chaque lieu ;Contenu plusieurs données quantitatives ;Représentation barres, camemberts, histogrammes, carrés ;Exemple Structure agraire origine de la propriété.

ATTENTION à la construction et la signification visuelle de ce type de carte : ici, la carte donne une image complexe à lire et à mémoriser, voire « fausse ».

Cartes thématiques statistiques

Page 23: Analyse et représentation des données spatiales et

ARDST - L3 - Cours1 – 2020-2021

carte en symbolesObjectif figurer la présence ou l’absence d’une donnée ;Contenu données qualitatives ;Représentation par symboles conventionnels ou abstraits ;Exemple site de détente à Overijssel.

carte de réseaux, en fluxObjectif montrer des flux (mouvement) ou des réseaux (les cartes routières dans leurs éléments de base sont des cartes en réseau) ;Contenu données quantitatives ;Représentation points et lignes ;Exemple flux migratoires.

Cartes thématiques statistiques

Page 24: Analyse et représentation des données spatiales et

ARDST - L3 - Cours1 – 2020-2021

Le fond de carte traditionnel constitue un espace euclidien représentant l’espace réel par une projection cartographique ;

Le fond de carte peut être déformé (anamorphose) pour devenir porteur d’une information additionnelle ;

• On obtient un cartogramme, dont l’information est véhiculée par l’écart avec le connu.

Anamorphoses et cartogrammes, arrangements « quantifiés » du fond de carte

Cartes thématiques statistiques

Page 25: Analyse et représentation des données spatiales et

ARDST - L3 - Cours1 – 2020-2021

Cartes en 3D, lissées, carroyées, etc…

De nouveaux modes de représentations ….

Page 26: Analyse et représentation des données spatiales et

ARDST - L3 - Cours1 – 2020-2021

LA cartographie ou DES cartographies

Le point commun entre toutes ces représentations ?

LA SEMIOLOGIE GRAPHIQUELES VARIABLES VISUELLES

LES REGLES DE PERCEPTIONUn certain graphisme/esthétisme

Page 27: Analyse et représentation des données spatiales et

ARDST - L3 - Cours1 – 2020-2021

Une progression sur plusieurs années

Licence 1 Licence 2 Licence 3 M1

Statistique

descriptive

univariée

Statistiques et Cartographies

Statistique descriptive

bi variée et statistique

inférentielle

Statistique

descriptive

multivariée

Modèles

Validité des données

Tests

probabilistes

Page 28: Analyse et représentation des données spatiales et

ARDST - L3 - Cours1 – 2020-2021

Sémiologie graphiqueVariables visuelles

Démarche cartographiqueReprésentation d’une

variable statistiqueReprésentation des

résultats d’une régressionRubriques d’habillage

Principes de mise en page

Ce qui est supposé connu L1 & L2

STATISTIQUE CARTOGRAPHIE

Collectes de l’information géoMises en forme de l’informationIdentifier la nature des variables

Traitements uni et bi variéInterprétation des résultats

(tendances centrales, résumés, dispersion, discrétisation,

corrélation, covaration, régression, variations)

Statistiques et Cartographies

Page 29: Analyse et représentation des données spatiales et

ARDST - L3 - Cours1 – 2020-2021

d’inventaire ou Thématique etc.

… Il faut oublier la carte de base qui cherche à tout représenter. Il faut faire des CHOIX en vue d’un objectif et d’un public précis.

STATISTIQUE CARTOGRAPHIE

Collectes de l’informationMises en formes ET principaux traitements

… ce qui est privilégié jusqu’à présent LES TRAITEMENTS dits DE BASE, leurs complémentarités et leurs limites.

Statistiques et Cartographies

Polysémies et confusions

Page 30: Analyse et représentation des données spatiales et

ARDST - L3 - Cours1 – 2020-2021

Adopter une démarche cartographique

Page 31: Analyse et représentation des données spatiales et

ARDST - L3 - Cours1 – 2020-2021

Avant tout traduire …. des idées graphiquement

Page 32: Analyse et représentation des données spatiales et

ARDST - L3 - Cours1 – 2020-2021

Des éléments de statistique en cartographie

Page 33: Analyse et représentation des données spatiales et

ARDST - L3 - Cours1 – 2020-2021

En guise de conclusion….

Etudier un phénomène c’est d’abord se poser des questionssur ses variations

Nécessité de formuler une problématique

Prise en compte de la dimension temporelle

Prise en compte de la dimension spatiale

Etudier un phénomène avec des méthodes et des outils statistiques c’est le mesurer

Page 34: Analyse et représentation des données spatiales et

ARDST - L3 - Cours1 – 2020-2021

En guise de conclusion….

Avoir recours aux statistiques uni- et bivariées permet

• Certes de résumer l’information : ordres de grandeur, étalements ou dispersions, comparaisons

• Mais suppose une forte perte de l’ensemble de l’information contenue dans le tableau initial

Avoir recours aux corrélations et aux régressions linéaires oblige à

• Poser des hypothèses fortes quant à la dépendance des variables• Se positionner dans une démarche explicative et non purement

descriptive• A renoncer à appréhender les faits de répartition

Page 35: Analyse et représentation des données spatiales et

ARDST - L3 - Cours1 – 2020-2021

En guise de conclusion….

En quoi le recours à l’analyse de données peut être une réponse à ces limites ?

Page 36: Analyse et représentation des données spatiales et

ARDST - L3 - Cours1 – 2020-2021

Pour réviser et approfondir

• Lambert N., ZANIN C., 2016, Manuel de Cartographie, Paris, Armand Colin, Cursus.

• Dumolard P., Dubus N., Charleux L., 2002, Les statistiques en géographie, Paris, Belin, Atouts géographie

http://grasland.script.univ-paris7.fr

http:/ums-riate.fr/ecoleyaounde2006/index.php