analyse et représentation des données spatiales et
TRANSCRIPT
Analyse et représentation des données
spatiales et textuelles - ARDST
Christine [email protected]
Code Moodle :L3GEO_ARDST_2020
Partie 1 : IntroductionStat&Carto, une nécessaire complémentarité
Mathilde [email protected]
ARDST - L3 - Cours1 – 2020-2021
30h Cours intégré – 3 ECTS - coefficient 110 séances les jeudis
24/09 ; 01/10 ; 08/10 ; 15/10 ; 22/10 ; 12/11 ; 19/11 ; 26/11 ; 03/12 ; 10/12
Groupe 1 : 10 séances le jeudi de 9h30-12h30, salle OdG 377 Christine Zanin
Groupe 2 : 10 séances le jeudi de 16h à 19h, salle OdG 377. Mathilde Resch
Analyse et représentation des données spatiales et textuelles - ARDST
ARDST - L3 - Cours1 – 2020-2021
●Programme général
Introduction générale et présentation de l’analyse de données (2 séances)
Rappels de statistiques univariées et bivariées
Rappels de sémiologie graphique et de cartographie des données statistiques
Application : Election présidentielle 2017 et contexte social à Paris
Chapitre 1 : introduction aux analyses factorielles (3 séances)
Application : Election présidentielle 2017 et contexte social à Paris (suite)
Chapitre 2 : introduction aux méthodes de classification (3 séances)
Application : Cycles de températures Europe/Afrique
Chapitre 3 : introduction aux méthodes d’analyse textuelle (1 séance)
Application : Conflit autour des captages d’eau à Paris
ARDST - L3 - Cours1 – 2020-2021
●Evaluation
1) La connaissance des notions théoriques : 1 DST (3ème séance)
2) Le travail personnel (DM(s)) : rendu des cartes de chaque TD(3 au minimum).
3) La capacité d’analyse des résultats d’une analyse de données :1 DST (dernière séance)
100% en CC
ARDST - L3 - Cours1 – 2020-2021
STAT - CARTO
ARDST - L3 - Cours1 – 2020-2021
Approches descriptives (analyse des données)
Approches explicatives
Approches exploratoires
Approche statistiques spatiales
Les méthodes statistiques en géographie
Ensemble de techniques et méthodes statistiques pour identifier, décrire et expliquer les formes de répartitions d’un phénomène dans l’espace.
ARDST - L3 - Cours1 – 2020-2021
La statistique descriptive, statistique exploratoire ouanalyse des données, a pour but de résumer l'informationcontenue dans les données de façon synthétique et efficace
La statistique inférentielle ou confirmatoire va au delà dela simple description des données. Elle a pour but de fairedes prévisions et de prendre des décisions au vu desobservations.
Les méthodes statistiques en géographie
ARDST - L3 - Cours1 – 2020-2021
Les modalités de choix d’un traitement statistique
ARDST - L3 - Cours1 – 2020-2021
Les tableaux de données(Rappels)
Modalité de la
variable « total des
inscrits » pour le
Limousin, à
savoir 17446
Régio Code Total des inscrits
IUT STS CPGE
ILE-DE-France IDF 426698 4,1 10,2 5,2
CHAMPAGNE-ARDENNES CHAM 29294 10,3 18,8 4,1
PICARDIE PICA 30836 9,3 23,1 3,2
HAUTE-NORMANDIE H.NO 36796 10,7 15,8 3,5
CENTRE CENT 48457 9,7 18,7 4,3
BASSE-NORMANDIE B.NO 30746 9,2 16,3 3,4
BOURGOGNE BOUR 31976 8,0 19,0 4,7
NORD PAS DE CALAIS NORD 117059 7,4 17,3 4,2
LORRAINE LORR 63595 9,3 13,6 3,2
ALSACE ALSA 54309 7,4 13,2 4,0
FRANCHE-COMTE FR C 27506 9,7 17,6 3,2
PAYS DE LA LOIRE PAYS 74630 7,4 21,9 4,7
BRETAGNE BRET 83478 8,5 17,2 3,9
POITOU-CHARENTES POIT 37373 8,4 16,3 3,3
AQUITAINE AQUI 78595 6,5 14,3 3,3
MIDI PYRENEES MIDI 89119 7,2 12,3 3,4
LIMOUSIN LIMO 17446 9,8 20,4 2,7
RHONE ALPES RHON 174158 8,3 13,7 4,2
AUVERGNE AUVE 32893 8,1 16,3 3,9
LANGUEDOC-ROUSSILLON LANG 74359 5,4 13,4 2,8
PROVENCE ALPES COTE D'AZUR PACA 129117 6,4 11,9 3,8
CORSE CORS 4342 6,8 15,7 1,7
Variable ou
caractère
statistique
Quantitatif
de stock, de taux
etc.
Individus
Statistiques (élément observé)
Ici des unités
spatiales
c. à d. des régions
ARDST - L3 - Cours1 – 2020-2021
Régions Code Total des inscrits
IUT STS CPGE
ILE-DE-France IDF 426698 4,1 10,2 5,2
CHAMPAGNE-ARDENNES CHAM 29294 10,3 18,8 4,1
PICARDIE PICA 30836 9,3 23,1 3,2
HAUTE-NORMANDIE H.NO 36796 10,7 15,8 3,5
CENTRE CENT 48457 9,7 18,7 4,3
BASSE-NORMANDIE B.NO 30746 9,2 16,3 3,4
BOURGOGNE BOUR 31976 8,0 19,0 4,7
NORD PAS DE CALAIS NORD 117059 7,4 17,3 4,2
LORRAINE LORR 63595 9,3 13,6 3,2
ALSACE ALSA 54309 7,4 13,2 4,0
FRANCHE-COMTE FR C 27506 9,7 17,6 3,2
PAYS DE LA LOIRE PAYS 74630 7,4 21,9 4,7
BRETAGNE BRET 83478 8,5 17,2 3,9
POITOU-CHARENTES POIT 37373 8,4 16,3 3,3
AQUITAINE AQUI 78595 6,5 14,3 3,3
MIDI PYRENEES MIDI 89119 7,2 12,3 3,4
LIMOUSIN LIMO 17446 9,8 20,4 2,7
RHONE ALPES RHON 174158 8,3 13,7 4,2
AUVERGNE AUVE 32893 8,1 16,3 3,9
LANGUEDOC-ROUSSILLON LANG 74359 5,4 13,4 2,8
PROVENCE ALPES COTE D'AZUR PACA 129117 6,4 11,9 3,8
CORSE CORS 4342 6,8 15,7 1,7
Lecture verticale du tableau :
• Privilégier l’entrée par les variables ou caractères• Privilégier les ressemblances entre les variables
Lecture horizontale du tableau :
• Privilégier l’entrée par les individus ou unités spatiales• Privilégier les ressemblances en liens avec la proximité
Les tableaux de données(Rappels)
ARDST - L3 - Cours1 – 2020-2021
Exemples de questionnements géographiques possibles :• Quelle est l’importance des étudiants dans les régions
métropolitaines françaises ?
• Quel est le secteur disciplinaire qui regroupe le plus d’inscrits ? Etc
Pour analyser et interpréter il faut commencer par faire du tri, ordonner, résumer
A partir de quels éléments peut-on commencer à construire un résumé
• Quels ordres de grandeur à retenir ?
• Quelles sont les formations qui introduisent le plus de différenciations entre les régions ?
• L’importance d’un cycle de formation dépend-elle systématiquement des cycles antérieurs ?
La construction du tableau de données
ARDST - L3 - Cours1 – 2020-2021
Résumer les données
Nous disposons de plusieurs types de paramètres, dont les plus simples sont :
ARDST - L3 - Cours1 – 2020-2021
Pour les géographes 3 types d’analyses
DONC ….
ARDST - L3 - Cours1 – 2020-2021
LA cartographie ou DES cartographies
La carte permet de dépasser l'horizonClaude Aschenbrenner (www.serialmapper.com)
« Aucune carte n’est digne d’un regard si le pays de l’Utopie n’y figure pas » Oscar Wilde
« La cartographie est l’ensemble des études et des opérations scientifiques, artistiques et techniques, intervenant à partir des résultats d’opérations directes ou de l’exploitation d’une documentation, en vue de l’élaboration et de l’établissement de cartes, plans et autres modes d’expression, ainsi que dans leur utilisation. » Le comité Français de Cartographie
ARDST - L3 - Cours1 – 2020-2021
LA cartographie ou DES cartographies
Un monde de cartes ou le passage par une représentation graphique adaptée d’un territoire :« comprendre et maîtriser l’espace ».
• La cartographie antique• La cartographique topographique• La cartographie thématique• La cartographie statistique
« Si ardu étant ce chemin qu’il serait difficile de le donner à entendre par des paroles ou de l’écrire avec la plume. La meilleure explication qu’ait trouvé pour cela le génie des hommes est de le donner en peinture sur une carte. » Martin Cortès, géographe et mathématicien du XVIe siècle
ARDST - L3 - Cours1 – 2020-2021
Cartes topographiques
Échelle jusqu’au 1/100 000Objectif : carte de base comprenant les éléments essentiels à la localisation ;Contenu : relief, hydrographie, chemins et routes, etc. ;Représentation : selon des signes conventionnels.
ARDST - L3 - Cours1 – 2020-2021
Carte chorographique Échelle du 1/100 000 au 1 000 000Objectif mise en évidence d’états des surfaces (extension d’objets ou phénomènes) ; carte pouvant être plus ou moins compliquée selon la quantité de phénomènes représentés ;Contenu données qualitatives ;Représentation couleurs ou trames, avec ou sans fond (topographique, image, etc.) ;Exemple cartes géologiques, administratives, etc.
Cartes thématiques
ARDST - L3 - Cours1 – 2020-2021
carte choroplèthe(carte en plages de valeurs)Objectif montrer les variations d’intensité d’un phénomène surfacique ;Contenu données quantitatives ;Représentation couleur (teintes différentes) ou trames, blanc = valeur nulle ;Exemple carte de densité.
Cartes thématiques statistiques
ARDST - L3 - Cours1 – 2020-2021
carte en pointsObjectif signaler avec exactitude la présence effective d’un objet en un lieu donné ou indiquer la localisation supposée de collections d’objets, le point ayant une valeur définie par convention (par ex., chaque point « vaut » 100 000 habitants) ;Contenu données quantitatives (par ex., 1 point équivaut à 100 000 moutons) ou données qualitatives (par ex., 1 point bleu signifie un village où on parle français, 1 point rouge où on parle romanche, etc.) ;Représentation pour une collection d’objets, les points sont en principe répartis à l’intérieur de la conscription avec la même densité, mais peuvent aussi être répartis de manière hétérogène, selon le type de signification ;Exemple répartition de population.
Cartes thématiques statistiques
ARDST - L3 - Cours1 – 2020-2021
carte en courbesObjectif exprimer des différences de valeurs dans l’espace (comme les cartes en plages), mais, ici, l’information est obtenue sur des points ;Contenu données obtenues à partir de données ponctuelles, par interpolation ou pas. Données absolues ou relatives ; Représentation lignes ;Exemples courbes de niveau du Modèle Numérique de Terrain, carte des profondeurs marines, carte de la pluviosité, etc.
Cartes thématiques statistiques
ARDST - L3 - Cours1 – 2020-2021
carte en proportionsObjectif cartes qui conduisent à tirer parti des hiérarchies et des relations de proportionnalité pour simplifier les représentations, tout en gardant la gradation des ordres de grandeur. Représenter visuellement les proportions exactes des phénomènes ;Contenu données quantitatives ;Représentation barres proportionnelles, cercles proportionnels ;Exemples cercles proportionnels à la population.
Cartes thématiques statistiques
ARDST - L3 - Cours1 – 2020-2021
carte en diagrammesObjectif exprimer plusieurs choses à la fois sur chaque lieu ;Contenu plusieurs données quantitatives ;Représentation barres, camemberts, histogrammes, carrés ;Exemple Structure agraire origine de la propriété.
ATTENTION à la construction et la signification visuelle de ce type de carte : ici, la carte donne une image complexe à lire et à mémoriser, voire « fausse ».
Cartes thématiques statistiques
ARDST - L3 - Cours1 – 2020-2021
carte en symbolesObjectif figurer la présence ou l’absence d’une donnée ;Contenu données qualitatives ;Représentation par symboles conventionnels ou abstraits ;Exemple site de détente à Overijssel.
carte de réseaux, en fluxObjectif montrer des flux (mouvement) ou des réseaux (les cartes routières dans leurs éléments de base sont des cartes en réseau) ;Contenu données quantitatives ;Représentation points et lignes ;Exemple flux migratoires.
Cartes thématiques statistiques
ARDST - L3 - Cours1 – 2020-2021
Le fond de carte traditionnel constitue un espace euclidien représentant l’espace réel par une projection cartographique ;
Le fond de carte peut être déformé (anamorphose) pour devenir porteur d’une information additionnelle ;
• On obtient un cartogramme, dont l’information est véhiculée par l’écart avec le connu.
Anamorphoses et cartogrammes, arrangements « quantifiés » du fond de carte
Cartes thématiques statistiques
ARDST - L3 - Cours1 – 2020-2021
Cartes en 3D, lissées, carroyées, etc…
De nouveaux modes de représentations ….
ARDST - L3 - Cours1 – 2020-2021
LA cartographie ou DES cartographies
Le point commun entre toutes ces représentations ?
LA SEMIOLOGIE GRAPHIQUELES VARIABLES VISUELLES
LES REGLES DE PERCEPTIONUn certain graphisme/esthétisme
ARDST - L3 - Cours1 – 2020-2021
Une progression sur plusieurs années
Licence 1 Licence 2 Licence 3 M1
Statistique
descriptive
univariée
Statistiques et Cartographies
Statistique descriptive
bi variée et statistique
inférentielle
Statistique
descriptive
multivariée
Modèles
Validité des données
Tests
probabilistes
ARDST - L3 - Cours1 – 2020-2021
Sémiologie graphiqueVariables visuelles
Démarche cartographiqueReprésentation d’une
variable statistiqueReprésentation des
résultats d’une régressionRubriques d’habillage
Principes de mise en page
Ce qui est supposé connu L1 & L2
STATISTIQUE CARTOGRAPHIE
Collectes de l’information géoMises en forme de l’informationIdentifier la nature des variables
Traitements uni et bi variéInterprétation des résultats
(tendances centrales, résumés, dispersion, discrétisation,
corrélation, covaration, régression, variations)
Statistiques et Cartographies
ARDST - L3 - Cours1 – 2020-2021
d’inventaire ou Thématique etc.
… Il faut oublier la carte de base qui cherche à tout représenter. Il faut faire des CHOIX en vue d’un objectif et d’un public précis.
STATISTIQUE CARTOGRAPHIE
Collectes de l’informationMises en formes ET principaux traitements
… ce qui est privilégié jusqu’à présent LES TRAITEMENTS dits DE BASE, leurs complémentarités et leurs limites.
Statistiques et Cartographies
Polysémies et confusions
ARDST - L3 - Cours1 – 2020-2021
Adopter une démarche cartographique
ARDST - L3 - Cours1 – 2020-2021
Avant tout traduire …. des idées graphiquement
ARDST - L3 - Cours1 – 2020-2021
Des éléments de statistique en cartographie
ARDST - L3 - Cours1 – 2020-2021
En guise de conclusion….
Etudier un phénomène c’est d’abord se poser des questionssur ses variations
Nécessité de formuler une problématique
Prise en compte de la dimension temporelle
Prise en compte de la dimension spatiale
Etudier un phénomène avec des méthodes et des outils statistiques c’est le mesurer
ARDST - L3 - Cours1 – 2020-2021
En guise de conclusion….
Avoir recours aux statistiques uni- et bivariées permet
• Certes de résumer l’information : ordres de grandeur, étalements ou dispersions, comparaisons
• Mais suppose une forte perte de l’ensemble de l’information contenue dans le tableau initial
Avoir recours aux corrélations et aux régressions linéaires oblige à
• Poser des hypothèses fortes quant à la dépendance des variables• Se positionner dans une démarche explicative et non purement
descriptive• A renoncer à appréhender les faits de répartition
ARDST - L3 - Cours1 – 2020-2021
En guise de conclusion….
En quoi le recours à l’analyse de données peut être une réponse à ces limites ?
ARDST - L3 - Cours1 – 2020-2021
Pour réviser et approfondir
• Lambert N., ZANIN C., 2016, Manuel de Cartographie, Paris, Armand Colin, Cursus.
• Dumolard P., Dubus N., Charleux L., 2002, Les statistiques en géographie, Paris, Belin, Atouts géographie
http://grasland.script.univ-paris7.fr
http:/ums-riate.fr/ecoleyaounde2006/index.php