5 •me partie les moyens du geomarketing : cartes et …

38
5 me PARTIE LES MOYENS DU GEOMARKETING : CARTES ET DONNEES I La cartographie II Les donnes statistiques et les fichiers III Le gocodage Le gomarketing regroupe l’ensemble form par des donnes de caractre cartographique ou conomique, le systme informatique de traitement et les mthodes appliques la production d’informations pertinentes d’aide la dcision. Ce chapitre traitera des donnes et des systmes d’information, ainsi que des principales rgles respecter dans l’utilisation de ce qui constitue la matire premire de l’analyse. Le gocodage, lien logique entre la donne et la localisation dans l’espace sera abord galement dans cette partie de l’ouvrage, car bien que tout fait spcifique au gomarketing, cette technique relve plus du traitement de l’adresse et des modes de structuration des donnes postales, que de l’analyse cartographique.

Upload: others

Post on 18-Jun-2022

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 5 •me PARTIE LES MOYENS DU GEOMARKETING : CARTES ET …

5 �me PARTIE

LES MOYENS DU GEOMARKETING :CARTES ET DONNEES

I La cartographie

II Les donn�es statistiques et les fichiers

III Le g�ocodage

Le g�omarketing regroupe l’ensemble form� par des donn�es de caract�recartographique ou �conomique, le syst�me informatique de traitement et les m�thodesappliqu�es � la production d’informations pertinentes d’aide � la d�cision.

Ce chapitre traitera des donn�es et des syst�mes d’information, ainsi que desprincipales r�gles � respecter dans l’utilisation de ce qui constitue la mati�re premi�rede l’analyse.Le g�ocodage, lien logique entre la donn�e et la localisation dans l’espace seraabord� �galement dans cette partie de l’ouvrage, car bien que tout � fait sp�cifique aug�omarketing, cette technique rel�ve plus du traitement de l’adresse et des modes destructuration des donn�es postales, que de l’analyse cartographique.

Page 2: 5 •me PARTIE LES MOYENS DU GEOMARKETING : CARTES ET …

Chapitre I

I. La cartographie

1. Modalit�s d’utilisation de la cartographie en g�omarketing

Est il n�cessaire de poss�der une formation de cartographe pour mettre en oeuvre desanalyses g�omarketing ?A cette question pr�liminaire, la r�ponse est clairement n�gative. Le g�omarketing fait appel � des donn�es de type cartographique, �conomique, de consommation ou decomportement. L’analyste n’a nul besoin d’�tre cartographe pour comprendre qu’un�l�ment naturel (fleuve...) ou artificiel (autoroute...) peut �tre interpr�t� comme unobstacle qui limite les possibilit�s d’�changes de certaines zones proches ou, aucontraire, comme un moyen de communication qui am�liore celles d’autres zonesplus �loign�es. Par contre, il devra �tre suffisamment familiaris� avec l’usage, lalecture et l’interpr�tation des cartes pour prendre en compte ces informations dans sonanalyse.L’analyste en g�omarketing utilise la cartographie pour localiser des ph�nom�nesdans l’espace; l’explication de ces ph�nom�nes peut tenir � une topographieparticuli�re (�loignement, proximit�, obstacle…), mais doit n�cessairement faireappel � bien d’autres composantes de caract�re socio-�conomique, dont lestechniques de traitement sont �trang�res � celles de la cartographie.A l’extr�me, il importe plus de conna�tre la fiabilit� d’une s�rie statistique et lesmanipulations permises dans ce domaine, que la m�thode qui permet de tracer descourbes de niveau.Laissons les cartographes faire leur m�tier, c’est � dire fabriquer les cartes, etaccordons aux analystes marketing le soin d’utiliser ces derni�res, avec d’autresdonn�es, pour en extraire des informations d’aide � la d�cision.En tout cas, un analyste devra poss�der les qualit�s d’un bon cartographe, � savoir,outre l’indispensable rigueur dans toutes les op�rations de traitement des donn�esquelles qu’elles soient, le souci de l’exactitude et de la pr�cision, de l’exhaustivit� etde l’homog�n�it�.

Page 3: 5 •me PARTIE LES MOYENS DU GEOMARKETING : CARTES ET …

1.1. Exactitude et pr�cision :La cartographie doit �tre exacte quel qu’en soit l’usage, les donn�es �conomiquessont soumises � la m�me contrainte.Une topographie fine et pr�cise est indispensable pour les sp�cialistes du cadastre, del’am�nagement du territoire, pour les ing�nieurs en travaux publics qui construisentune route, implantent du c�ble. La repr�sentation g�om�trique des objets (voies,courbes de niveau, rivi�res…) qui constituent la g�ographie du terrain est un �l�mentd�terminant de l’objectif final de leur production.Il est clair qu’une diff�rence de quelques m�tres peut se r�v�ler catastrophique dans lecadre de la construction d’un pont ou d’un barrage. Pour les syst�mes de navigationautomobile embarqu�s (ordinateurs de bord), dix � vingt m�tres peuvent devenirimportants. Par contre une d’approximation de quelques dizaines de m�tres n’ajamais nui fondamentalement au calcul de la zone de chalandise d’un supermarch�.La pr�cision en g�omarketing a donc ses r�gles particuli�res; les cartes G�oRoute del’Institut G�ographique National (IGN) sont pr�cises � 10 m pr�s, ce qui estparfaitement suffisant pour analyser un ph�nom�ne �conomique.Par ailleurs le degr� de pr�cision requis est relatif au ph�nom�ne �tudi�; ainsi, enzone urbaine dense, il sera important, par exemple, de localiser sur quel segment de larue de Vaugirard � Paris se situent ses prospects; par contre nous nous soucierons peude la position pr�cise de l’habitat des m�nages d’une commune de 300 personnes enzone rurale.Il ne faut pas confondre pas la pr�cision de la carte, avec la repr�sentation qui en serafaite dans le cadre de l’analyse; ainsi nous pouvons travailler sur une carte au niveaudu num�ro dans la rue, sans pour autant afficher les num�ros, les noms de rues, oum�me la g�om�trie de ces rues, dans la mesure o� l’on veut faire mieux ressortir leph�nom�ne particulier �tudi�. Enfin, s’il est hautement recommand� d’affecter lavaleur, associ�e � une adresse, � un point le plus pr�cis possible, les imp�ratifs delisibilit� du r�sultat font qu’il est en g�n�ral n�cessaire d’agglom�rer les valeurs surun espace g�ographique adapt� � la taille de la zone �tudi�e et au volume des donn�estrait�es.

1.2. Homog�n�it� et exhaustivit� :Fondamentalement, le niveau d’information de la carte (d�partement, canton,commune, IRIS, Ilots…) doit �tre homog�ne avec celui des donn�es sur lesquellesl’on travaille (et r�ciproquement); il n’est d’aucun int�r�t d’utiliser une carte auniveau de la rue si les donn�es ne sont disponibles qu’au niveau communal.L’exhaustivit� est gage de pertinence : De m�me que l’on ne peut imaginer une carte de la France au niveau communal dontcertaines communes seraient exclues, il n’est pas permis, sauf � prendre lespr�cautions en usage sur le plan statistique, de tirer des conclusions d’une analyse quiexclurait des donn�es sur une partie des agents �conomiques, objets de l’�tude.

Page 4: 5 •me PARTIE LES MOYENS DU GEOMARKETING : CARTES ET …

2. Donn�es cartographiques utilis�es en g�omarketing

2.1. R�gles g�n�rales de la cartographieNous passerons bri�vement en revue les principes fondamentaux qui pr�sident � lar�alisation de cartes; quatre domaines sont essentiels qui r�pondent � des r�glespr�cises : le syst�me de projection, le syst�me de coordonn�es, l’�chelle et la g�n�ralisation.

1. La projection : processus de transformation des localisations d’une surface courbeen positions sur un plan en deux dimensions. Trois m�thodes principales sontpratiqu�es (Voir fig. 5.01) :

Par ailleurs, la projection peut �tre construite � partir d’un contact tangent commeindiqu� ci-dessus ou s�cant (le cercle, le c�ne et le cylindre pouvant couper le globe.Ensuite, interviennent les notions de point de vue qui peut �tre polaire (� partir dup�le), �quatorial (Cylindrique de Miller), Transverse (polaire d�plac�e de 90�) ouoblique.Enfin, la notion de perspective intervient dans lesprojections azimutales.Il est bien �vident que des distorsions sp�cifiquessont attach�es � chaque type de projection. Lesdistorsions sont importantes lorsqu’on repr�sentede grandes surfaces de territoires (Etats Unis parexemple - Voir fig. 5.02); elles sont tr�s faiblespour l’utilisateur lorsque les territoires trait�ssont restreints (cas de la plupart des payseurop�ens).

Fig. 5.01 : M�thodes de projection (cartes de Peter H. Dana)

Fig. 5.02 : Distorsions sur les USA (carte de Peter H. Dana)

Page 5: 5 •me PARTIE LES MOYENS DU GEOMARKETING : CARTES ET …

Les distorsions sont trait�es sur le plan math�matique sous trois aspects (Voir fig. 5.03) :- La conformit� (ou orthomorphie) : pr�servation des angles ou de l’�chelle � partird’un point (projections Mercator et Lambert conique). Les cartes conformes sontutilis�es en navigation ou en topographie.- L’�quivalence : toutes les aires repr�sent�es restent proportionnelles entre elles et avec la r�alit� (projections Behrmann, Peters, Albers, …..). Les cartes �quivalentes sont souvent pris�es par les sciences humaines.- L’�quidistance : l’�chelle reste constante � partir du centre de la projection ou desm�ridiens (projections �quidistantes coniques ou azimutales). Les cartes �quidistantesrepr�sentent un compromis entre les pr�c�dentes, elles sont souvent utilis�es par lescompagnies a�riennes ou les Atlas.

2. Les coordonn�es : Chaque point est rep�r� dans l’espace par ses coordonn�es qui reposent sur le principe g�n�ral de Longitude/Latitude/Altitude. Il existe de nombreux syst�mes de coordonn�es (LOLA, ECEF, UTM, GEOREF, UPS, BNG…). Ces coordonn�es s’expriment en degr�s et grades ou, plus simplement pour l’utilisateur, en m�tres dans un syst�me de coordonn�es cart�siennes.Le syst�me r�glementaire fran�ais, Lambert, repose sur une projection conique conforme r�partie en 4 zones, r�unies dans le syst�me � Lambert II �tendu � dont la d�formation aux points extr�mes est inf�rieure � 1 m.

3. L’�chelle : ratio des distances carte/terrain. Les �chelles courantes sont class�es en :

- � �chelle moyenne � : 1:25.000, 1:50.000, 1:100.000,- � �chelle petite � :1:250.000,- � �chelle tr�s petite � : 1:1.000.000

Les r�solutions varient entre 2,5m. et 100m., suivant l’�chelle. Les cartes � grande �chelle sont par exemple le Cadastre ou la BD TOPO de l’IGN (1:5.000 et 1 :10.000). L’ensemble du territoire fran�ais ne sera pas couvert par le RGE (R�f�rentiel � Grande Echelle) avant 2005. La pr�cision sera de l’ordre du m�tre.

Fig. 5.03 : Projection de Mercator Projection azimutale Projection de Peters (cartes de Peter H. Dana)

Page 6: 5 •me PARTIE LES MOYENS DU GEOMARKETING : CARTES ET …

Seules des cartes d’�chelles proches (m�me dans un syst�me de projection identique)peuvent �tre superpos�es pour �viter les risques de distorsion.Il est bien �vident que l’on doit travailler avec des cartes homog�nes en syst�mes decoordonn�es et de projection; il existe toutefois des m�thodes de conversionautomatique permettant de passer d’un syst�me � l’autre.

4. La g�n�ralisation : ce processus, fonction inverse de l’�chelle, consiste � simplifier la repr�sentation des objets afin de rendre la carte lisible avec l’augmentation de l’�chelle. La g�n�ralisation ob�it � des r�gles pr�cises sur base desquelles ont �t� cr��s des mod�les qui permettent d’informatiser les diff�rentes op�rations. Celles ci consistent essentiellement � �liminer certaines classes d’objets, simplifier la d�finition d’autres classes et, enfin, � fusionner les derni�res.

L’acquisition de donn�escartographiques est r�alis�eactuellement couramment � partirde photos satellite orthorectifi�eset trait�es en logiciels sp�cialis�squi assistent les analystes dansl’interpr�tation des images (Voir fig. 5.04 un exemple der�alisation Spot Image).

Quatre vingt pour cent des terres �merg�es, h�bergeant 95 % de la population du globe (de 65� de latitude nord / baie d’hudson � 56� de latitude sud / cap de Bonne Esp�rance) ont fait l’objet de prises de vues par interferom�trie dans le cadre du programme satellite Endeavour. Les donn�es, produites par le Jet Propusion Laboratory de Pasadena, qui atteignent un volume de 12 terabytes ne pourront �tre disponibles avant encore quelques ann�es. Ci contre une vue en perspective sur Hawai avec colorisation de l’altitude (Voir fig. 5.05).

Rappelons que les cartes de repr�sentation des donn�es physiques du terrain (les contours des terres, montagnes, vall�es, fleuves, routes ou b�timents) sont regroup�es sous l’appellation de � cartes topographiques � (si elles comprennent des renseignements d’altitude) ou � cartes planim�triques � (renseignements bidimensionnels)..

Fig. 5.04 : Cartes Spot Image

Fig. 5.05 : Carte du Jet Propulsion Laboratory

Page 7: 5 •me PARTIE LES MOYENS DU GEOMARKETING : CARTES ET …

L’analyse g�omarketing n’�tant actuellement envisageable qu’avec des moyensinformatiques, nous ne passerons en revue que les donn�es cartographiquesdisponibles dans ce cadre.Techniquement les donn�es sont trait�es sous trois formes, soit un format purementimage obtenu par scanerisation et dont le positionnement est rep�r� par au moins 2points qui permettent de caler la carte et de rep�rer les distances, soit en format dit “raster ” obtenu par digitalisation d’une carte papier, ou, enfin, en format “ vecteur ”,cr�e par vectorisation des �l�ments de la carte.Les trois formats peuvent �tre utilis�s s�par�ment ou conjointement (suivant lescapacit�s des logiciels utilis�s) en superposant tout ou partie des donn�es disponibles.Ci dessous, examinons une superposition de la carte vecteur IGN G�o route des Hautsde Seine avec une image saisie au scanner d’un simple d�pliant sur le quartier de LaD�fense (Voir fig. 5.06).On notera les d�calages nets constat�s entre la carte vecteur et l’image, sachant quel’objectif de cette derni�re se limite � fournir, sous forme d’une vue de type 3D, unplan d’orientation g�n�rale privil�giant la compr�hension des implantations desdiff�rentes constructions du quartier, plut�t que l’exactitude de la position des rues.

Les cartes raster ou lescartes vecteur nepeuvent �tre lues quepar des logicielssp�cialis�s de typeSIG ou assimil�s.Les �diteurs de cartespeuvent proposer lesfichiers raster etvecteur sous diff�rentsformats informatiques (fichiers textes…),adapt�s aux syst�mes

d’information g�ographique utilis�s.Les cartes sont

habituellementfournies d�j� compil�es par les�diteurs de SIG, afinde convenir au logicielde traitement utilis�.

Fig. 5.06 : La D�fense – superposition carte vecteur/image

Page 8: 5 •me PARTIE LES MOYENS DU GEOMARKETING : CARTES ET …

2.2. Cartes RasterLa carte � raster � est con�ue sur le principe de stockage des donn�es g�ographiquesdans une matrice qui couvre l’espace de la carte, chaque cellule comprend le codeligne, le code colonne et l’attribut de l’information pr�sente dans la cellule (Voir fig. 5.07).La principale difficult� li�e� la carte raster tient � lataille des cellules qui doit�tre homog�ne lorsqu’oncompile les diff�rentescouches de la carte. Laprobl�matique del’utilisation de ce formatr�side dans le choix de lataille des cellules la plusadapt�e (fonction de lar�solution de la carte, des disponibilit�s de stockage...)Bien que les formats raster soit plus couramment disponibles et moins on�reux queles formats vecteur, ils pr�sentent moins d’int�r�t en g�omarketing; d’une part, lacarte devient peu lisible lorsqu’on l’agrandit, puisqu’elle est compos�e de carreaux ou� la limite de points (principe du Bitmap) et d’autre part, elle restitue les informationsprincipalement en lecture visuelle par l’op�rateur (Voir fig. 5.08).Par contre, les op�rations de gestion des couches, les interpolations et les relationsop�rationnelles entre couches sont plus simples que dans le format vecteur.

Fig. 5.07 : Principe de la carte raster

Fig. 5.08 : Principe de la carte raster

Page 9: 5 •me PARTIE LES MOYENS DU GEOMARKETING : CARTES ET …

2.3. Cartes VecteurLe format vecteur, rep�re des points, des lignes et des polygones par les coordonn�esde longitude/latitude. Les points se voient affecter des coordonn�es. Entre deux points li�s un vecteur est trac�, ce qui constitue un arc ; un segment de voie est form� de 1 ou plusieurs arcs; chaque arc est un objet, au sens informatique, auquel sont affect�s un nom et une repr�sentation correspondant � sa classe (nom et code d’une rue parexemple, repr�sentation jaune liser�e rouge d’une certaine taille pour un segmentd’autoroute...) (Voir fig. 5.09 ainsi que le chapitre III traitant du g�ocodage).

Les objets d’une carte vecteur(points, lignes et polygones), sontorganis�s en classes (routesprincipales, limitesadministratives, parcs, places…) etchaque classe forme une couched’affichage; il est loisibled’afficher les couches souhait�es

dans l’ordre choisi et d’en exclure d’autres afin d’all�ger la lecture et ne repr�senterque les �l�ments int�ressants pour l’�tude d’un ph�nom�ne donn�.

Les cartes vecteur rassemblent plus ou moins d’informations; le co�t de ces produitsvarie bien �videmment en fonction du volume de donn�es contenues.

Fig. 5.10 : Carte vecteur et les couches cartographiques qui la constituent

Fig. 5.09 : Principe de la carte vecteur

Page 10: 5 •me PARTIE LES MOYENS DU GEOMARKETING : CARTES ET …

2.4. D�coupage du territoire fran�aisLes diff�rents pays font l’objet de d�coupages territoriaux nombreux et vari�s ; ainsi les principaux d�coupages en France peuvent �tre class�s dans les th�mes suivants : D�coupages administratifs, d�coupages des Minist�res de l’Education Nationale, de la Sant�, de la Justice, de la D�fense, de l’Emploi, de l’Int�rieur (�lectoraux), des Finances (cadastraux), de l’Environnement (risques), d�coupages agricoles, d�coupages municipaux (POS, ZUP, ZAD), d�coupages EDF, SNCF…Dans la pratique nous nous efforcerons de travailler sur des d�coupages pour lesquels les cartes aussi bien que les donn�es sont disponibles. Par ailleurs, il est relativement ais� de cr�er de nouveaux d�coupages qui int�grent rigoureusement des territoires de niveau inf�rieur, par exemple des regroupements de communes en syndicats communaux. Par contre, la cr�ation de secteurs ex-nihilo, d�limit�s par des rues, par exemple, doit �tre confi�e � des soci�t�s sp�cialis�es en cartographie qui vont cr�er une nouvelle couche de donn�es dans la carte, avec les positions et les attributs des limites, puis compiler � nouveau la cartographie obtenue.

En fonction du degr� de finesse de l’�tude � r�aliser et du d�tail des donn�es�conomiques dont il dispose, l’analyste travaillera sur l’un des principaux niveaux ded�coupage du territoire indiqu� dans le sch�ma hi�rarchique suivant. A noter que tous ces d�coupages sont disponibles en cartographie sauf les d�coupages cantonaux des grandes communes. Les donn�es les plus couramment disponibles sont aux niveaux surlign�s en jaune que l’on r�partira en 3 classes : Macro (D�partements et aires urbaines), M�so (secteurs postaux et communes) et Micro (IRIS et Ilots). Aucune donn�e �conomique n’est disponible sp�cifiquement pour les arrondissements et les quartiers ; les cantons ou pseudo cantons sont � �carter en g�omarketing pour des raisons expliqu�es plus loin et ne sont utilis�s que pour analyser des r�sultats �lectoraux. Pratiquement ces d�coupages sont regroup�s en deux classes de cartes : les cartes de niveau national qui peuvent inclure des d�coupages jusqu’� l’IRIS (ex. : le produit G�oFla de l’IGN, base 1:500.000) et des cartes au niveau de la rue (ex. : le produit G�oRoute de l’IGN, base 1:25.000).

REGIONS

DEPARTEMENTS

COMMUNES

ILOTS

IRIS

GRANDES COMMUNES

SECTEURS POSTAUX

AIRES URBAINES

QUARTIERS

ARRONDISSEMENTS

SECTEURS POSTAUX PSEUDO CANTONSCANTONS

CANTONS

Page 11: 5 •me PARTIE LES MOYENS DU GEOMARKETING : CARTES ET …

2.4.1. Niveau r�gional et d�partemental Ces niveaux seront rarement utilis�pour l’analyse, le d�coupage fran�aisen 26 r�gions (dont 22 en m�tropole) n’est pas suffisamment fin pourproduire des r�sultats int�ressants. Le codage des r�gions s’effectue sur 2 caract�res num�riquesLe niveau d�partemental (Voir fig. 5.11) sera �ventuellement retenu dansle cadre d’une �tude France enti�relorsqu’il s’agit de comparer plusieurss�ries de donn�es avec un mode derepr�sentation du type camemberts ouhistogrammes. Les d�partements au nombre de 100 (dont 96 en m�tropole) sont cod�s par l’INSEE

sur 2 caract�res num�riques (sauf la Corse : 2A et 2B et les d�partements d’outremer sur 3 caract�res d�butant par 97). Mentionnons le d�coupage en arrondissements � titre documentaire, puisque quasiment aucune donn�e n’est disponible � ce niveau. Il existe 342 arrondissements (dont 329 en m�tropole). Les arrondissements, cod�s sur 1 caract�re num�rique, sont des regroupements de cantons et de communes, ils ne doivent pas �tre confondus avec les arrondissements municipaux (Paris, Lyon, Marseille) : ainsi, l’arrondissement de Lyon inclut 41 cantons et 162 communes, l’arrondissement de Paris est identique au d�partement 75 et inclut les 20 arrondissements municipaux qui sont chacun � la fois une commune et un canton (le � 8� arrondissement de Paris � est ainsi la commune 75108 et le canton 22).

2.4.2. Niveau cantonal:L’analyste �vitera, dans la mesure du possible, de travailler au niveau cantonal (Voir fig. 5.12) ; outre le fait que peu de donn�es statistiques soient disponibles � ce niveau,

les d�coupages irr�guliers(Voir le cas du canton d’Eygui�res), ou m�mescind�s en territoires nonadjacents (cas d’Arles etd’Aix en Provence),nuisent �videmment � lapertinence des r�sultats en analyse spatiale.

Fig. 5.11 : D�coupage r�gional et d�partemental

Fig. 5.12 : D�coupage cantonal (pseudo cantons)

Page 12: 5 •me PARTIE LES MOYENS DU GEOMARKETING : CARTES ET …

Les cantons sont cod�s sur 4 caract�res, dont les deux premiers correspondent aud�partement. Il existe 4.032 cantons (dont 3.876 en m�tropole).En fait, les seules cartographies disponibles (ainsi que les donn�es INSEEcorrespondantes) sont celles des � pseudo-cantons � , c’est � dire les d�coupages dontla taille est �gale ou sup�rieure � la commune, leur code se termine par un chiffrecompris entre 95 et 99. Dans la r�alit�, des communes importantes peuvent �tredivis�es en cantons, il s’agit alors de la � fraction cantonale �.Ainsi la commune de Aix en Provence, divis�e en 2 cantons, n’est disponible cartographiquement que sous la forme du pseudo-canton 1397 et le canton appel� Aixen Provence, code 1302, regroupe en fait les communes de Meyreuil et Eguilles. Le probl�me est identique pour Arles dont la commune se voit attribuer le nom de pseudo canton 1398 et o� le canton 1303 Arles est compos� des communes de St Martin de Crau et de Fonvielle.

2.4.3. Niveau secteur postal :Les codes postaux ne sont que rarement utilis�s en France en g�omarketing, leurd�coupage �tant (� l’exception de communes importantes comme Lyon, Marseille,Paris 16�…) au mieux identique, sinon moins fin que celui des communes; par contrenous les utiliserons couramment en Belgique ou aux Pays Bas, par exemple, paysdans lesquels une m�me rue peut �tre r�partie dans plusieurs codes postaux. LaFrance est d�coup�e en 6081 secteurs postaux.Si, outre le code postal, le nom de la commune est connu, il est recommand� d’effectuer un codage suppl�mentaire au code commune et de travailler au niveauplus fin; il arrive par contre, fr�quemment, que des r�sultats d’enqu�tes nefournissent, pour des raisons de discr�tion ou de facilit� de saisie, que le code postal. Le code postal est compos� de 5 caract�res num�riques dont les 2 premiers d�signent le d�partement.A noter �galement la disparition programm�e par la poste du d�coupage en codes postaux et le remplacement � venir de ces derniers par le code INSEE communes.La carte ci contre illustre l’intrication de quelques d�coupages administratifs (Voir fig. 5.13).

Fig. 5.13 : Superposition de 4 d�coupages administratifs

Page 13: 5 •me PARTIE LES MOYENS DU GEOMARKETING : CARTES ET …

2.4.4. Niveau communal :La carte dite � au niveaucommunal � (Voir fig. 5.14)fournit non seulement les limitesdes communes, mais contient aussi les limites cantonales,d�partementales et r�gionales,les axes routiers, le r�seauhydrographique, les for�ts, lesagglom�rations urbaines (tellesque d�finies par l’INSEE). L’ensemble de ces donn�es est,par exemple disponible dans laversion G�o Fla/Route 120 del’IGN.Le d�coupage communal (36679

communes dont 36565 en m�tropole) est int�ressant dans le cadre d’�tudes Franceenti�re, car de nombreuses donn�es sont disponibles � ce niveau; en outre, lesanalyses qui portent sur des donn�es � adress�es � (sur les clients, les prospects… pour lesquels on dispose du code postal et du nom de la commune) peuvent �trer�alis�es au niveau communal, gr�ce � une op�ration de codage au barycentre de la commune. Le code INSEE commune � 5 caract�res est constitu� des 2 caract�res ducode D�partement, les 3 suivants sont affect�s globalement dans l’ordre alphab�tiquedes communes � l’int�rieur de chaque d�partement. Les exceptions sont les suivantes : le code de Paris est globalement 75056, mais chaque arrondissement �tant une commune, leurs codes vont de 75101 � 75120. Par

contre pour Marseille et Lyon les codes commune sont 13055 et 69123 , toutefois chaque arrondissement de ces communes a �galement un code INSEE de 13201 � 13216 et de 69381 � 69389.Signalons �galement des anomalies au niveau du rattachement des communes aux d�partements ; une dizaine de communes sont rattach�es � un d�partement voisin de celui dans lequel elles sont situ�es g�ographiquement, ainsi : - Messenaire, 21403 est situ�e en bordure de la Ni�vre (58) et de la Sa�ne et Loire (71) mais est rattach�e � la C�te d’Or (21),

Fig. 5.14 : D�coupage communal

Fig. 5.15 : Communes rattach�es � un d�partement diff�rent de leur localisation g�ographique

Page 14: 5 •me PARTIE LES MOYENS DU GEOMARKETING : CARTES ET …

- Othe, 54412 est situ�e dans la Meuse (55), 3 communes du Nord (59) sont situ�es dans le Pas de Calais (62), 4 communes du Vaucluse (84) sont situ�es dans la Drome (26),- Enfin, (Voir fig. 5.15) 5 communes du d�partement des Hautes Pyr�n�es (R�gion Midi Pyr�n�es) sont localis�es dans le d�partement Pyr�n�es Atlantiques (R�gion Aquitaine).Parmi les autres curiosit�s, citons �galement la commune de Moncale 2B165 en Corse compl�tement incluse dans la commune de Calenzana 2B049, ou bien (Voir fig. 5.16), la commune de Vauciennes 60658 (d�partement de l’Oise) d�coup�e en deux territoires dont l’un est inclus dans la commune de Coyolles 02232 (d�partement de l’Aisne).

D ‘autres communes sont d�coup�es en territoires non adjacents, par exemple, la commune de Senez dans les Alpes de Haute Provence (Voir fig. 5.17),

Depuis quelque temps, la carte communaleest disponible au niveau de l’Europeenti�re, sans discontinuit� entre les pays;toutefois, comme nous l’avons d�j� signal�, la disparit�des tailles descommunes et des concepts qui leur sont attach�s rend les comparaisons difficiles. N�anmoins, cette carte peut �treint�ressante, enparticulier, pour les�tudes qui portent surles zones frontali�res (Voir fig. 5.18).

Fig. 5.16 : Curiosit� du d�coupage administratif

Fig. 5.18 : D�coupage communal transfrontalier

Fig. 5.17 : Commune d�coup�e en 2 territoires disjoints

Page 15: 5 •me PARTIE LES MOYENS DU GEOMARKETING : CARTES ET …

2.4.5. Niveau quartiers :Les quartiers, comme leur nom l’indique, sont desdivisions de chaque arrondissement de Paris en 4zones correspondant � un d�coupage historique (Voir fig. 5.18 les quartiers des 8� et 17� arrondissements municipaux), ils sans grand int�r�tpratique pour les analyses pratiqu�es eng�omarketing, dans la mesure o� peu de donn�essont disponibles � ce niveau.Seuls certains fichiers sp�cialis�s utilisent lesquartiers comme r�f�rent (Ex : fichier AAAr�serv� aux constructeurs automobiles).

Jusqu’au dernier recensement, les quartiers �taient des d�coupages souvent fantaisistes ; seule Marseille avait une configuration de quartiers qui correspondaient pr�cis�ment aux IRIS 5000.

Ainsi, � Nice, (Voir fig. 5.19), les quartiers se r�sumaient � des zones qui pars�mentle centre ville, ou qui sont elles-m�mesinclues dans un autre quartier (lesquartiers reconnus comme tels sontcolor�s en jaune, la partie centrale deNice, n’existait pas comme quartier).La notion de quartier a �t� largement remani�e dans le cadre de l’introduction des IRIS 2000. De nouveaux quartiers ont �t� cr��s par regroupement d’IRIS, appel�s � quartiers v�cus � ou � grands quartiers �. Ainsi la commune de Nice est actuellement d�coup�e en 38 quartiers (Voir fig. 5.20 carte INSEE); � noter que le d�coupage de Paris n’a pas �t� modifi�.Chaque quartier se voit affecter un nom et un code ; ce dernier est compos� de 2 caract�res num�riques, num�ros d’ordre affect�s de fa�on s�quentielle en partant du centre de la commune. Assez curieusement les quartiers de Paris sont cod�s de 01 � 80, alors que pour Lyon et Marseille le codage est effectu� par arrondissement avec un nombre variable de quartiers par arrondissement.

Fig. 5.19 : Quartiers de Nice (version 1990)�

Fig. 5.18 : Quartiers de Paris 8� et Paris 17�

Fig. 5.19 : Quartiers de Nice (version 1999)�

Page 16: 5 •me PARTIE LES MOYENS DU GEOMARKETING : CARTES ET …

2.4.6. Niveau IRIS INSEE :Les IRIS (Il�ts Regroup�s pour l’Information Statistique) sont comme leur nom l’indique desregroupements d’�lots �tablis par l’INSEE sur basede crit�res d’homog�n�it� de populations. La cartedes IRIS est �dit�e par l’INSEE.Ils constituent un d�coupage de la commune et nesont en aucun cas “� cheval” sur plusieurscommunes (Voir fig. 5.21).Le principe en est le suivant : jusqu’aurecensement de 1999, les IRIS ne pouvaientinclure moins de 5.000 habitants; n’�taient doncd�coup�es en IRIS que les communes d’au moins10.000 h. ; � compter de 1999, la CNIL(Commission Nationale Informatique et Libert�s) a admis que la barre de 5.000 h.soit abaiss�e � environ 2.000 h.; toutefois, seules les communes de plus de 3.600 h.peuvent �tre d�coup�es en 2 IRIS ou plus (16.000 IRIS, dont 15.375 en m�tropole, sont donc r�partis sur 1.838 communes). Les � IRIS 5000 � sont renomm�s � IRIS 2000 � .Enfin les 15375 IRIS 2000 des communes d�coup�es sont class�s en 3 cat�gories:- 14187 � IRIS habitat � , (population comprise entre 1.800 et 5.000 habitants), cod�s

H- 855 � IRIS activit� � (zones industrielles, par exemple qui comptent plus de 1.000

salari�s et deux fois plus de salari�s que de r�sidents), cod�s A, - 333 � IRIS divers � (ex: parcs nationaux, for�ts, zones portuaires….), cod�s D.34755 communes ne sont pas d�coup�es, elles sont assimil�es � des IRISLes IRIS sont enti�rement compris dans les quartiers; leurs codes sont compos�s de 9 caract�res num�riques dont les 5 premiers sont le code INSEE commune, les 2 suivants le code quartier et les 2 derniers un num�ro d’ordre dans le quartier. Le mode de codage sp�cifique des quartiers de Paris, Lyon et Marseille est �tendu aux IRIS. Pour les communes non d�coup�es le code commune est suivi de 0000. La plupart des IRIS, sauf pour Paris et Marseille comportent �galement des noms de lieux (nom de la commune si celle ci n’est pas divis�e).

Il faut savoir �galement que la superposition de la carte IRIS aux autres cartes n’est pas satisfaisante sur le plan de la g�om�trie. Ainsi sur la carte G�oRoute interurbaine des Andelys (Voir fig. 5.22), nous constatons que les limites de communes en ROUGE et les limites d’IRIS en BLEU pr�sentent des �carts tr�s significatifs. En effet, la g�om�trie de la carte � Contours IRIS � est extraite de la base cartographique G�oFla IGN (base

Fig. 5.21 : D�coupage � l’IRIS

Fig. 5.22 : Les Andelys superposition des IRIS � G�oRoute

Page 17: 5 •me PARTIE LES MOYENS DU GEOMARKETING : CARTES ET …

1:500.000) pour toutes les communes qui ne sont pas d�coup�es � l’�lot, m�me si elles sont d�coup�es en IRIS (en BEIGE).Par contre, si la commune est d�coup�e en �lots, la cartographie de ses IRIS est �tablie � partir de la cartographie � Contours Ilots �, elle m�me issue de la carte G�oRoute IGN au 1:25.000 (Voir paragraphe suivant) ; on constate donc

une meilleure concordance pour la seule commune d’Evreux mais pas d’am�lioration pour les communes de Gravigny, St S�bastien ou Arni�res qui sont disponibles dans G�oroute (th�me urbain), mais ne sont pas d�coup�es en �lots. Enfin des recalages manuels ont du �tre effectu�s (Voir fig. 5.23).

Outre les aspects de g�om�trie, il faut signaler un autre type de probl�mes li� � la constitution des IRIS 2000. Les zone IRIS, comme cela a �t� dit plus haut, sont constitu�es par regroupement d’�lots ; en principe ces �lots doivent �tre contigus. Dans la pratique, nous pouvons constater que de nombreux IRIS sont constitu�s de 2 zones non adjacentes (Voir fig. 5.24).

Les raisons avanc�es pour justifier la chose sont que les d�coupages ont �t� effectu�s avec les municipalit�s et que la taille minimum de l’IRIS doit �tre de 1800 habitants. Le premier argument explique que certains d�coupages aient �t� r�alis�s sans pr�cautions suffisantes (Ex : l’IRIS 4313 Roquette 13, coup� en 2 par l’�lot 1130103 qui ne compte que 4 habitants). Le second motif n’est pas convaincant, en effet des donn�es IRIS sont publi�es pour des communes qui n’ont que quelques dizaines d’habitants ; il est choquant de constater que la protection de la vie priv�e et de l’anonymat ne s’applique qu’aux IRIS Habitat et pas aux IRIS Activit� et Divers ou aux toutes petites communes. Il aurait �t� plus logique, de la part de la CNIL, d’imposer des regroupements des donn�es communales lorsque les tailles de communes sont trop faibles. Ainsi toutes les donn�es du recensement sont disponiblessur 34 IRIS qui ne contiennent qu’un seul m�nage (574330106, 772880204, 710760199, 751155732, 25700106, 956070109, 561850101, 764740101 …).

Fig. 5.23 : Evreux superposition des IRIS � G�oRoute

Fig. 5.24 : IRIS scind�s � Paris

Page 18: 5 •me PARTIE LES MOYENS DU GEOMARKETING : CARTES ET …

2.4.7. Niveau �lots INSEE :L’�lot est une zone d’habitations de 600 � 700habitants en moyenne d�limit�e par 3 voies ou plus(rue, voie ferr�e ou cours d’eau) ; les r�gles de laCNIL font que le nombre de donn�es disponibles � l’�lot est tr�s limit�. Dans les zones d’habitat dense,les �lots sont r�duits � un p�t� de maisons (Voir fig. 5.25). Dans le cadre des op�rations du recensement,l’�lot est appel� � district �.La cartographie � l’�lot, �dit�e par l’INSEE, appel�e Contours �lots est restreinte � 220.000 �lots r�partis dans 1.238 communes (toutes les communes de plus de 10.000 habitants et toutes les communes des agglom�rations de plus de 50.000 habitants) ; ceci implique que sur ces 1.238 communes, 1076 seulement sont �galement d�coup�es en IRIS, en effet une commune de moins de 5.000 habitants qui appartient � une agglom�ration de plus de 50.000 sera d�coup�e en �lots, mais pas en IRIS. Inversement 762 communes (de 5 � 10.000 h) auront un d�coupage en IRIS, mais pas en �lots.Ces diff�rences de crit�res font que la codification des �lots n’est pas directement rattach�e � celle des IRIS. Le code �lots comprend 9 ou 12 caract�res num�riques, (5 premiers : code INSEE commune, 3 suivants : code CIL pour Paris, Lyon, Marseille et pour 15 communes, 4 derniers : num�ro alphanum�rique d’ordre). Il n’est donc pas possible d’affecter un �lot � un IRIS sur la base de son code, il faut recourir � une table de correspondance. Ainsi, l’IRIS 75001 0102 contient les �lots 75101 011 0001, 0002, 0003 et 0040.La logique de codification de tous ces d�coupages n’est pas tr�s �vidente ; le tableau suivant permet de se faire une id�e g�n�rale de la m�thode et met en exergue les exceptions constat�es :DEPARTE-

MENTARRONDIS-

SEMENT VILLE CANTON COMMUNE ARRONDIS. COMMUNAL QUARTIER IRIS ILOT

AIN BOURG EN BRESSE

BOURG EN BRESSE

BOURG EN BRESSE CENTRE CHAMP DE

FOIRE 01053AC04, BC01,

01 012 0137 01053 01053 01 01053 01 02 BK05…SEINE PARIS PARIS PARIS 6� PARIS 6� PARIS 6� MONNAIE MONNAIE 3

75 751 75056 7520 75106 75106 75106 21 75106 21 03 751060610001 � 06 10015

RHONE LYON LYON 1� LYON LYON 1� TERREAUX -BAT D'ARG.

LOUIS PRADEL 69381381AS01/

69 691 6911 69123 69381 69381 01 69381 01 02 /2/3/13/15BOUCHES DU RHONE MARSEILLE MARSEILLE 1� MARSEILLE MARSEILLE 1� BELSUNCE BELSUNCE

1 13201500D004/5/6

13 133 1313 13055 13201 13201 01 13201 01 01 13201500E001/2/3/6…

Fig. 5.25 : D�coupage � l’�lot

Page 19: 5 •me PARTIE LES MOYENS DU GEOMARKETING : CARTES ET …

2.4.8. Niveau de la rue : Pour les 411 agglom�rations de plus de 10.000 habitants, soit 3.204 communes, descartes d�taill�es existent qui recensent toutes les rues, avec, suivant la version, les

bornes de voies (num�rospairs et impairs � chaquecarrefour de rue) et lesens de circulation. Cescartes comportent un certain nombre de pointsremarquables (Voir fig. 5.26 : zones industrielles,h�pitaux, b�timentsadministratifs, parkings,gares, a�roports, voiesferr�es, zones b�ties, parcs, parkings…).Ces cartes sont �dit�espar des organismes ou

soci�t�s sp�cialis�s comme l’IGN (Base G�oroute pour les agglom�rations de plus de10.000 h.), G�osignal, Navtech, T�l� Atlas, ADDE.L’offre �volue rapidement et tend � une meilleure r�partition des r�les entre l’IGN, organisme public, � qui il est demand� d’assurer la couverture la plus large possible

du territoire et de diffuser toutes les informations de base (Voir les recommandations du rapport Lengagne). Les autres soci�t�s, de droit priv�, ont pass� des accords avec l’IGN pour utiliser les fonds cartographiques et les enrichir avec des donn�es sur les points remarquables (P.O.I.) et des informations d’aide � la navigation.

Un manque important � signaler dans les cartes� la rue concerne les zones industrielles priv�es, les voies qui les composent ne sontalors pas disponibles. (Voir fig. 5.27 la carte de la zone industrielle de Garonor).

2.5. Disponibilit� en cartes vecteur sur la FranceLes �diteurs de cartes � la rue proposent en g�n�ral trois versions : Rues sans lesnum�ros, avec les num�ros (version dite � adress�e �) et enfin, la troisi�me, avec, ensus, les sens de circulation (version dite � orient�e �).Nous utiliserons de pr�f�rence la version adress�e en g�omarketing, en effet certaines

Fig. 5.26 : Carte � la rue

Fig. 5.27 : Carte de Garonor

Page 20: 5 •me PARTIE LES MOYENS DU GEOMARKETING : CARTES ET …

rues (Exemple, la rue de Vaugirard, � Paris) peuvent �tre tr�s longues et l’analystedoit �tre en mesure de positionner une adresse postale avec plus d’exactitude que lebarycentre de la rue. La version la plus compl�te, orient�e, est r�serv�e auxapplications de navigation et de logistique.

L’approche d�veloppement des cartographes et celle des statisticiens sontsensiblement divergentes; les premiers proc�dent par agglom�rations urbaines, ainsi, de toutes petites communes peuvent �tre trait�es � la rue, � cause de leur proximit�d’une grande ville (les cartes ayant � moyen terme un fort d�bouch� en navigationautomobile, il est souhaitable qu’une continuit� du territoire soit assur�e dans leszones les plus urbanis�es); l’INSEE, par contre ne retient comme crit�re ded�coupage que l’importance de la population des zones de r�f�rence.La couverture actuelle du territoire fran�ais (Voir fig. 5.28) en cartes � la rue est plusfaible que dans les autres pays europ�ens et comme indiqu� pr�c�demment, la disponibilit� des zones entre les cartes � la rue, les cartes avec d�coupage IRIS ou �lot n’est pas homog�ne. Le sch�ma ci contre (Voir fig. 5.29) illustre globalement le probl�me de coh�rence rencontr� et confirme, s’il en �tait besoin, tout l’int�r�t de l’analyse de grille.

Globalement, 62,6% de la population est couverte par les cartes � la rue, 58% par les cartes avec d�coupage IRIS et 50,4% par les cartes avec d�coupage �lot.Restent 33000 communes incluant 19,54 millions d’habitants, dont la plus importante est Chinon (8700 h ;) qui ne pourront pas �tre �tudi�es plus finement qu’au niveau communal sur base de la cartographie Iris de l’Insee. Notons toutefois que les �diteurs priv�s (Navteq et T�l� Atlas) ont effectu� un gros effort depuis 2004 et actuellement les cartographies � la rue sont disponibles pour toutes les communes (hors bornes pour les petites communes). Enfin ces m�mes �diteurs ont cal� les d�coupages Iris, ce qui r�pond aux critiques �mises au � 2.4.6. vis-�-vis de la carte Contours Iris.

Fig. 5.29 : R�partition des couvertures Rues, IRIS, Ilots

Page 21: 5 •me PARTIE LES MOYENS DU GEOMARKETING : CARTES ET …

2.6. Unit�s urbaines, agglom�rations

Afin de distinguer les zones urbaines des zones rurales, l’INSEE a d�termin� desr�gles homog�nes qui permettent de r�partir les communes entre ces deux cat�gories.La d�marche de caract�risation des zones urbaines a consist� � identifier les zonesb�ties qui comportent au moins environ deux mille habitants. Les contours de ceszones sont �tablis sur base d’un regroupement des b�timents d’habitation dont lesdistances entre eux sont inf�rieures � 200 m. Les terrains publics interm�diaires nesont pas pris en consid�ration (a�rodromes, cimeti�res, usines, centrescommerciaux… ).Pour regrouper les communes en unit�s urbaines (ou agglom�rations multi-communales), n’ont �t� retenues que les communes de plus de 2.000 habitants dontplus de la moiti� de la population r�side dans la zone b�tie telle que d�finie ci-dessus.L’unit� urbaine peut ne contenir qu’une seule commune, celle ci sera alors appel�e� ville isol�e �.La � ville centre � d�signe la commune qui regroupe 50% ou plus de la population de l’unit� urbaine; les autres communes forment la � banlieue �. A noter qu’il peut exister plusieurs villes centres dans une unit� urbaine si la ville principale n’atteint pas les 50%, on retiendra alors comme autres villes centres celles qui abritent une

population sup�rieure � la moiti� de la ville principale.Sur base du recensement 1999,l’INSEE a identifi� 1.995 unit�surbaines, dont 426 de plus de 10000 habitants.

Les unit�s urbaines peuvents’�tendre sur plusieurs d�partements,r�gions, ou m�me d�border lesfronti�res nationales.La carte des agglom�rations telleque fournie par l’IGN ne retient pourcontours que ceux des zones b�tieset ne co�ncide donc pas avec leslimites communales, comme ent�moigne la carte de l’agglom�rationde Lille (Voir fig. 5.30). Les

contours des unit�s urbaines sont par contre cal�s sur les limites communales.Les unit�s urbaines sont cod�es sur 5 caract�res (2 pour le d�partement, 1 pour la tranche et 2 pour le n� d’ordre. Une unit� � cheval sur plusieurs d�partements est cod�e 00 sur les 2 premiers caract�res.

Fig. 5.30 : Agglom�ration de Lille

Page 22: 5 •me PARTIE LES MOYENS DU GEOMARKETING : CARTES ET …

2.7. Aires urbainesUn nouveau concept de d�coupage (ZAU) �labor� sur un crit�re d’emploi (>5.000) et un crit�re d’attraction domicile-travail consiste � r�partir les communes en 4 cat�gories :

- communes des p�les urbains- communes des couronnes p�riurbaines- communes multipolaris�es- communes de l’espace � dominante rurale

Les trois premi�res cat�gories constituent l’espace � dominante urbaine qui pratiquement regroupe les � de la population.Il existe 354 p�les urbains (unit� urbaine offrant 5.000 emplois ou plus) , la couronne p�riurbaine comprend les communes dont au moins 40% des actifs r�sidents travaillent dans l’aire urbaine. Les communes multipolaris�es sont partag�es entre l’influence de plusieurs p�les urbains.L’aire urbaine (ou Espace urbain), union des 3 cat�gories urbaines est un ensemble d’un seul tenant et sans enclave, dont les contours sont form�s par des limites communales.

2.8. Zones d’emploi et bassins de vieLes zones d’emploi sont des regroupements de communes � l’int�rieur desquelles s’�tablissent les �changes d’offre et de demande d’emploi. Les 348 zones d’emploi actuelles ont �t� �tablies � partir des d�placements domicile-travail.Les bassins de vie sont des regroupements de communes �tablis par l’Insee et laDatar sur base des donn�es du recensement, de l’Inventaire communal, des flux d’emploi… et qui d�crivent 1.916 zones (� territoires v�cus �).

2.9. Le cadastreCr�� � l’�poque napol�onienne dans un but fiscal, le cadastre est utilis� essentiellement par les collectivit�s locales, certaines administrations (Imp�ts…), les entreprises sp�cialis�es dans les am�nagements. La parcelle cadastrale est �galement primordiale pour les m�nages propri�taires d’un terrain (Voir fig. 5.31).Le plan cadastral comporte les voies, les limites de parcelles et les limites de b�ti, ainsi que des informations sur le type de culture, les coordonn�es du propri�taire… Le cadastre est supervis� par la Direction G�n�rale des Imp�ts,

Fig. 5.31 : Extrait du cadastre

Page 23: 5 •me PARTIE LES MOYENS DU GEOMARKETING : CARTES ET …

pour laquelle il est l’outil principal de l’�tablissement de l’assiette de la taxation fonci�re. En g�omarketing, l’utilisation du cadastre est rare, sinon en phase finale de choix de l’implantation d’un site et en cas d’indisponibilit� de carte � la rue.L’int�r�t du plan cadastral r�side toutefois dans sa grande �chelle (du 1:500 au 1:2.500) et son exhaustivit�, puisqu’il couvre la totalit� du territoire fran�ais (il comporte 550.000 feuilles qui recensent 100 millions de parcelles) et. il apporte donc une r�ponse pour les zones peu urbanis�es. Sous sa forme actuelle, le cadastre n’est pas utilisable pratiquement en g�omarketing, en effet, � peine 16% du territoire existe sous format vecteur et le solde ne sera totalement num�ris� (en raster essentiellement) qu’en fin 2007 au plus t�t. Par ailleurs, les feuilles (pour des raisons de projection) ne sont pas raccordables ensemble, la DGI devrait confier � l’IGN le soin de la remise en g�om�trie de l’ensemble.Autre avantage du plan cadastral, son co�t : il semble, d’apr�s les derni�res orientations affich�es par le minist�re des finances que le cadastre soit consid�r� comme donn�e publique gratuite, au moins pour les particuliers et �ventuellement (?) pour les entreprises utilisatrices ou les interm�diaires cr�ateurs de valeur ajout�e. D�s 2001, il est pr�vu que les donn�es cadastrales disponibles commencent � �tre mises � disposition du public sur Internet (en format image, bien �videmment).La n�cessit� pour la France de disposer d’un syst�me cartographique coh�rent, � grande �chelle et mis � jour en permanence (Rapport Lengagne)1 permet d’esp�rer, d’ici quelques ann�es, avoir acc�s � un r�f�rentiel g�ographique d�taill� et exhaustif dans des conditions �conomiques raisonnables. La base de ce r�f�rentiel serait leproduit IGN appel� BDTopo (carte de pr�cision m�trique au 1 :25.000). Actuellement la couverture territoriale n’est en France que de 30%, alors qu’en Grande Bretagne, l’Ordnance Survey a d�j� num�ris� l’ensemble de son territoire � une �chelle �quivalente.En fait le principal reproche fait g�n�ralement � l’IGN est que si la couverture g�n�rale est faible, les informations contenues dans ces cartes � grande �chelle sont pl�thoriques et les rendent d’usage difficile. Les nouvelles orientations propos�es parle rapport Lengagne voudraient que l’IGN recentre ses efforts sur une plus grande exhaustivit� g�ographique des donn�es publiques fondamentales et abandonne � des soci�t�s ou organismes sp�cialis�s le soin d’apporter des enrichissements en informations sp�cifiques � valeur ajout�e.

1 Rapport parlementaire de Guy Lengagne, D�put� maire de Boulogne sur mer, effectu� dans le cadre d’une lettre de mission du Premier Ministre et remis en septembre 1999, intitul� � Les perspectives d'�volution de l'information g�ographique et les cons�quences pour l'IGN �

Page 24: 5 •me PARTIE LES MOYENS DU GEOMARKETING : CARTES ET …

Chapitre II

II. Les donn�es statistiques et les fichiers

Nous avons vu que l’analyste en g�omarketing ne devait pas n�cessairement �tre uncartographe; par contre, il devra poss�der de solides bases en marketing, en gestion dedonn�es et en m�thodes de traitements statistiques.Les donn�es peuvent �tre class�es en deux grandes cat�gories : les donn�es issues delistes de clients ou de prospects, fichiers internes � l’entreprise ou achet�s � dessoci�t�s sp�cialis�es en fichiers d’adresses et les donn�es statistiques fournies par lesorganismes nationaux sp�cialis�s (INSEE en France), les chambres de commerce, les administrations ou les organismes professionnels (LSA pour la Grande Distribution,par exemple). Nous assimilerons, dans l’expos� qui suit, les r�sultats d’enqu�tes et sondages aux statistiques.

1. Les fichiers

L’analyste devra avant tout qualifier les donn�es des fichiers qu’il devra utiliser, leurexactitude, leur exhaustivit�, leur homog�n�it� et leur degr� de pr�cision; leg�omarketing va permettre de faire � parler � ces donn�es, tout comme les outils dedata mining. Afin de parvenir � un r�sultat coh�rent qui puisse �tre comment� avecpertinence, il est indispensable de conna�tre parfaitement l’�tat et la signification desmat�riaux utilis�s; n’oublions pas que le r�sultat cartographi� de l’analyse p�sera defa�on tr�s lourde dans la prise de d�cision sur un projet.Les fichiers disponibles dans une entreprise peuvent provenir de sources diverses, dedirections vari�es qui utilisent souvent des moyens informatiques h�t�rog�nes; lesdonn�es des diff�rentes bases marketing, commerciales, comptables ou encorefinanci�res sont rarement comparables et ne sont qu’exceptionnellementconsolidables au sein d’une base unique, � moins que la gestion ne repose sur dessyst�mes dits ERP de gestion int�gr�e ou sur un data wharehouse (approche d�j� trait�e en deuxi�me partie, chapitre IV.1).Il sera n�cessaire d’analyser en premier lieu le niveau d’exactitude attach� auxdonn�es disponibles (Ex : facturation des trois derniers mois d’un client, par opposition � la d�claration d’intention d’achat d’un prospect lors d’une enqu�tet�l�phonique).L’exhaustivit� est importante, nous citerons le cas v�cu chez un grand op�rateur T�l�coms dans lequel le responsable des �tudes avait � omis � des potentiels deconsommations t�l�phoniques aussi importants que ceux de l’A�rospatiale � Toulouseou que ceux de Renault � Boulogne Billancourt. Toutefois, ce probl�me d’exhaustivit� peut �tre r�solu � condition de disposer d’�chantillons repr�sentatifs devolume suffisant pour atteindre l’intervalle de confiance minimum requis par l’�tude;

Page 25: 5 •me PARTIE LES MOYENS DU GEOMARKETING : CARTES ET …

de la m�me fa�on, le degr� de pr�cision doit �tre le plus �lev� possible, mais en casde contraintes particuli�res, les notions d’intervalle de confiance et de probabilit�devront �tre r�percut�es sur le r�sultat final.L’homog�n�it� des s�ries de donn�es sera par contre capitale, afin de pouvoireffectuer des op�rations de comparaison (p�n�trations de march�, analyses der�gression…), homog�n�it� dans le temps, aussi bien que dans l’espace.Aussi surprenant que cela paraisse, ces pr�cautions sont rarement appliqu�es; tropsouvent, par paresse intellectuelle ou par manque de budget, sont utilis�es desdonn�es partielles, incontr�l�es ou approximatives.A titre anecdotique, une tr�s grande entreprise a r�cemment abandonn� un mod�le deconsommation dont les r�sultats consolid�s �taient trop �loign�s des estimations demarch�, sans que la validit� des donn�es n’ait �t� questionn�e : le mod�le calculait unpotentiel de consommation d’entreprises au centime pr�s � partir du code NAFd’activit� et des tranches d’effectifs INSEE. Sachant que les informations d’effectifssalari�s fournis par le fichier SIRET sont d�claratives et restitu�es en classes 0/1-2/3-5/6-9/10-19/20-49/50-99/100-199… il est �vident que la marge d’erreur ne peut �treque tr�s importante (la consommation d’une entreprise de 50 employ�s et celle d’uneentreprise de 99 employ�s, appartenant � la m�me classe, sont en r�alit� dans uneproportion de 1 � presque 2 si leur activit� est identique); il faut �galement savoir quepr�s d’un tiers des sites d’entreprises sont renseign�s dans le fichier SIRET � 0, quel’effectif salari� (hors chef d’entreprise, qui n’est pas d�compt� dans l’effectif salari�)soit effectivement nul ou qu’il ne soit pas disponible (en principe un effectif inconnu doit �tre cod� NN).A cela s’ajoutait le fait que le fichier de r�f�rence n’�tait compos� que d’environ600.000 �tablissements sur l’ensemble du territoire fran�ais, alors qu’on en d�nombreplus de 4 millions en activit�, et que la construction de la base avait �t� effectu�e defa�on totalement anarchique � partir de fichiers d’origines diverses, plus ou moins d�-dupliqu�s et en l’absence de toute consid�ration de quotas de taille ou d’activit�.Autre pi�ge classique des fichiers, les NPAI (N’habite Plus � l’Adresse Indiqu�e),constituent la hantise permanente des professionnels des fichiers ; en moyenne, pr�sde 10% des particuliers d�m�nagent chaque ann�e et 12% des entreprisesd�m�nagent, disparaissent ou apparaissent. La mise � jour fr�quente des adresses estdonc indispensable lorsque les donn�es trait�es sont directement relatives � unepersonne, � un m�nage ou � une entreprise (donn�es bancaires, par exemple).En ce qui concerne l’adresse et si l’on veut obtenir de bons scores de g�ocodage, il estindispensable que les champs soient correctement structur�s, au moins, si possible, aux normes postales; en effet un nombre non n�gligeable d’informations contenuesdans une adresse postale ne sont pas utilis�es au codage (Lieux dits, immeuble,escalier…) et perturbent la performance de l’outil.

Outre ces pr�cautions pratiques et m�thodologiques � priori �l�mentaires, mais dontl’exp�rience montre bien qu’il n’est pas inutile de les rappeler, il sera indispensable,lorsqu’on travaille sur des fichiers, d’appliquer des m�thodes rigoureuses detraitement et de renseigner une documentation qui permette de conna�tre avec

Page 26: 5 •me PARTIE LES MOYENS DU GEOMARKETING : CARTES ET …

pr�cision la signification d’un r�sultat et de recenser les niveaux de transformationappliqu�s aux donn�es.

2. Les statistiques

Des statistiques sont publi�es par divers organismes professionnels; nous les distinguerons des fichiers, dans la mesure ou ces derniers sont nominatifs, alors queles premi�res sont anonymes et agr�g�es � des niveaux consid�r�s comme suffisantspar la CNIL (Commission Nationale Informatique et Libert�s) pour prot�ger la viepriv�e des personnes (sous r�serve des anomalies signal�es au chapitre pr�c�dent, paragraphe 2.4.6.).Une des principales sources de statistiques provient, en France, du recensementeffectu� en principe tous les 7/8 ans et dont le dernier a eu lieu en Mars 1999. A noterque des mises � jour par sondage sont effectu�es entre deux recensements.Les r�sultats qui int�ressent le g�omarketing sont publi�s sur support informatique �quatre niveaux principaux :- Niveau des � territoires � (r�gions, d�partements, zones d’emploi, unit�s urbaines) : 800 indicateurs.- Niveau de la commune, 3 produits : R�f�rences (100 chiffres cl�s), Profils (800 indicateurs) et Analyses (12.000 indicateurs). Les donn�es concernent les individus,les m�nages, les familles, l’emploi, le logement…A ce m�me niveau est �galement disponible l’inventaire communal 1998, qui recensed’une part les commerces et �quipements disponibles dans une commune, et d’autrepart les communes dans lesquelles se rendent les utilisateurs qui ne disposent pas deces �quipements dans leur commune de r�sidence. Ces donn�es permettent ded�terminer des zones d’attraction en milieu interurbain. Par ailleurs, des donn�es Mobilit�s (domicile-travail, r�sidences 90-99, domicile-�tudes) permettent d’analyser les flux.- Niveau de l’IRIS (Voir le chapitre pr�c�dent sur les cartes) : jusqu’� 10.000 donn�essont disponibles sur l’individu, le m�nage, la famille, le logement. A noter quechaque � donn�e � ou � indicateur � correspond � un r�sultat (Ex : les r�sultats destranches quinquennales d’�ge des femmes correspondent � 20 donn�es). Si la tailled’une commune est trop petite pour qu’elle soit divisible en 2 IRIS de 1.800 habitants, la donn�e IRIS correspondante fournie sera celle de la commune. Parailleurs, la plupart des donn�es ne sont pas crois�es sauf sur la composition desfamilles ou m�nages (Ex: m�nages compos�s de 1 homme actif de moins de 40 ans etde 1 femme inactive avec 2 enfants). Pour pouvoir croiser les donn�es, il faut recourir aux � R�sultats d�tail � qui pr�sentent une ligne de r�sultats par questionnaire trait�. Pour les particuliers, les r�sultats d�tail sont �videmment anonymes et fournis agglom�r�s par 50.000 1 et peuvent donc, selon la densit� de la zone �tudi�e

1 Regroupement identique pour les donn�es sensibles (nationalit�s et immigration)

Page 27: 5 •me PARTIE LES MOYENS DU GEOMARKETING : CARTES ET …

correspondre � au moins une quinzaine d’IRIS. Pour les logements, ces donn�es (20 crit�res) d�crivent chaque logement et sont agglom�r�es � l’IRIS.Les donn�es � l’IRIS 2000 (recensement 1999) ont �t� mises � disposition progressivement entre mai et fin 2001 ; sous la d�nomination R�f�rences sont propos�s 100 chiffres cl�s, sous Profils 700 indicateurs et sous Analyses 10.000 indicateurs. 1.838 communes �tant d�coup�es en 16.000 IRIS, la base Analysescontient plus de 500 millions de � cases � de donn�es.- Niveau de l’�lot : La protection de la vie priv�e fait que tr�s peu de donn�es sontpubli�es � ce niveau (15, dont 5 tranches d’�ge par sexe, 4 types d’occupation delogement et le nombre d’habitants des r�sidences principales); seules les collectivit�s locales et territoriales sont autoris�es � acc�der aux autres r�sultats du recensement. Le nombre d’habitants � l’�lot est variable, en moyenne 600 � 700. Comme d�j� signal�, les donn�es �lots ne sont pas disponibles pour toutes les zones couvertes �l’IRIS : ne sont d�coup�es en 220.000 �lots que les communes de plus de 10.000 h et les communes des agglom�rations de plus de 50.000 h. Ces restrictions font que nous pr�f�rerons travailler sur la base de l’IRIS 2000. En outre l’Insee, ayany adopt� le R.I.L., ne maintient plus le fichier Replic depuis fin 2003.Outre les donn�es sur les particuliers, l’INSEE propose �galement des donn�es sur les entreprises: Soit le fichier SIRENE complet, soit les notices anonymes du fichierSIRENE; ces derni�res sont en fait le fichier des �tablissements dont sont retranch�sles codes SIRET et les noms des entreprises, l’adresse est fournie soit � l’�lot, soit aucode Rivoli (code des voies �tabli par le Minist�re des Finances dans le cadre du fichier FANTOIR). Les informations fournies concernent les effectifs, l’activit�, ladate de cr�ation, la cat�gorie juridique, �ventuellement les tranches de chiffred’affaires total et � l’export…La base SIRENE en � diffusion standard � comprend pr�s de 4,5 millions de sitesd’entreprises, les � unit�s singuli�res � (14 cat�gories, depuis les loueurs de fonds et syndicats de copropri�taires jusqu’aux unit�s sans activit�) repr�sentent un suppl�ment de pr�s de 2 millions d’enregistrements. Le fichier SIRENE est mis � jour mensuellement ; toutefois comme il est g�r� sur une base juridique (enregistrements, radiations…) des d�calages historiques non n�gligeables peuvent �tre constat�s avec la vie r�elle de l’entreprise. Toutefois ceci ne nuit que tr�s relativement � l’int�r�t de ces donn�es lorsqu’on travaille en B. to B. ; rappelons que la France est un des rares pays en Europe � disposer d’une base de ce type et de cette qualit�.

R�partition des donn�es INSEE COMMUNE IRIS 2000 ILOT ADRESSEpar niveau g�ographique Taille 0 � 800,000 h 1,800 � 5,000 h 600-700 h

DONNEES INDICATEURS 800 sur 7 th�mes 700 sur 50 crit�res 15

PARTICULIERS RESULTATS INDIVIDUS Tous les r�sultats du recensement agglom�r�s en zones de 50,000 h (1 ligne par questionnaire)

DETAIL HABITAT Tous les r�sultats du recensement agglom�r�s � l'IRIS(1 ligne par immeuble)

ENTREPRISES Notices anonymes

Fichier SIRENE

Page 28: 5 •me PARTIE LES MOYENS DU GEOMARKETING : CARTES ET …

Le recensement 1999 est le dernier de l’histoire en France. Les proc�dures actuelles sont remplac�es par une � estimation continue organis�e � � partir de fin 2001.Le principe consiste donc � ne plus effectuer une op�ration exhaustive tous les 7 � 9 ans, mais � proc�der par sondages continus dans les conditions suivantes :- Dans les communes de moins de 10.000 habitants (au nombre de 35.700, avec 29,8 M. habitants) : une commune sur cinq fait l’objet d’une enqu�te exhaustive chaque ann�e, ce qui permet de recenser toutes les communes et tous les habitants au bout de 5 ans. - Dans les communes de plus de 10.000 habitants (au nombre de 870, avec 28,5 M. habitants) : 1/5 du territoire de chaque commune est s�lectionn� chaque ann�e au niveau de l’immeuble (et non plus de l’�lot) dont on interroge 40% des habitants, ce qui permet de recenser 40% de la population au bout de 5 ans.En outre des ajustements statistiques doivent �tre effectu�s annuellement sur les fichiers de la S�curit� Sociale et ceux des Imp�ts (taxe d’habitation).L’avantage principal de cette d�marche consiste en la mise � jour annuelle des donn�es et en un lissage des op�rations de recensement. Toutefois la m�thodologie pose quelques probl�mes sur les points suivants :- In�galit� de traitement entre les grandes et les petites communes qui font partie de la m�me zone intercommunale.- Risques de doubles comptes li�s aux flux de migration dans la mesure o� les op�rations se d�roulent pendant toute l’ann�e scolaire.

3. De l’usage des fichiers et des statistiques

Suivant les objectifs � atteindre, nous ferons appel � des fichiers, � des statistiques, ouaux deux conjointement. Si les donn�es disponibles sont exhaustives, totalit� desclients et des prospects correspondant � la cible, ce qui est en g�n�ral le cas en�Business to Business� , nous pourrons nous limiter � utiliser des fichiers.Par contre, dans le cadre des produits de grande distribution, o� l’importance duconsommateur final est pr�pond�rante, il sera �galement n�cessaire de recourir auxstatistiques ou aux donn�es issues de sondages et d’enqu�tes. Exemple : le fabricantd’�quipements pour laboratoires, par opposition au producteur de cr�mes glac�es.Ainsi, lorsqu’on effectue des �tudes ou que l’on pr�pare des op�rations deprospection grand public, il est n�cessaire d’utiliser simultan�ment des statistiques etdes fichiers. Il n’existe pas de fichier des particuliers absolument exhaustif; le fichierde la Poste ne concerne que les m�nages et pas les individus, de m�me, l’annuaire dut�l�phone ne met pas � disposition les abonn�s inscrits en liste rouge. L’annuaire(actuellement plus de 20 millions d’adresses), est en passe de devenir le fichier le plusimportant en quantit� dont on puisse disposer dans la mesure o�, dans le cadre de lad�r�glementation des T�l�coms, les directives de la Communaut� Europ�enne

Page 29: 5 •me PARTIE LES MOYENS DU GEOMARKETING : CARTES ET …

pr�voient qu’un annuaire universel contenant les clients (fixes et mobiles) de tous lesop�rateurs devra �tre publi�.Les autres fichiers disponibles sont caract�ristiques de comportements et recouvrentdes populations plus ou moins sp�cifiques, clients de la V.P.C, abonn�s � desmagazines financiers, �tudiants, actionnaires… m�me les fichiers de consommateurs(� M�ga bases � Axciom) qui comprennent des informations d�taill�es sur leshabitudes ou projets d’achats ne regroupent � que � 4 � 5 millions de m�nages et pr�sentent, outre l’aspect d�claratif, l’inconv�nient que les personnes qui r�pondent � ces questionnaires pr�sentent une typologie particuli�re par rapport � celles qui n’y r�pondent jamais par principe (en particulier, sous repr�sentation des personnes �g�es).Lors de l’acquisition ou de la location d’un fichier, nous ne manquerons pas de nous interroger sur la fa�on dont il est constitu�, mis � jour et sur ce qu’il contientr�ellement. Est ce un fichier d�claratif (quelles sont les dates d’acquisition ?) ou unfichier � factuel � (abonn�s � une revue, par exemple : anciennet� de l’abonnementinitial ?)…

A noter, enfin, le probl�me des donn�es publiques. La France est probablement un des pays dans lesquels il existe proportionnellement le plus grand nombre de fichiers de bonne qualit� d�tenus par l’administration, mais o� leur acc�s est le plus difficile, m�me lorsqu’il s’agit d’informations non confidentielles. Par exemple, chaque lendemain d’�lection tous les journaux publient les r�sultats d�taill�s par circonscription avec les noms des candidats, leurs r�sultats, leur appartenance politique ; hors cette p�riode br�ve, l’acc�s aux donn�es rel�ve du parcours du combattant : le Minist�re de l’int�rieur refuse de communiquer les d�coupages �lectoraux et renvoie sur les pr�fectures et les divers d�crets publi�s au journal officiel ; seul le site web de l’Assembl�e Nationale fournit les d�coupages sp�cifiques aux �lections l�gislatives. Quant aux donn�es sur les �lus, elles deviennent curieusement confidentielles du jour au lendemain, car s’il est autoris� de d�tenir le fichier d’une cat�gorie particuli�re d’�lus, la CNIL interdit que l’�tiquette sous laquelle la personne s’est officiellement pr�sent�e soit mentionn�e dans un fichier informatique, la d�tention de l’information n’�tant autoris�e que sous forme papier.A tous les niveaux de l’information administrative r�gne le m�me herm�tisme, les grandes administrations, Education Nationale, Sant�, les organismes d�centralis�s (syndicats communaux, d�partementaux en tout genre, SIVOM, SIVU...) ne publient pas d’annuaires � jour et ne d�voilent qu’avec la plus grande r�ticence leurs budgets, leurs effectifs … selon des m�thodes qui interdisent en g�n�ral toute consolidation.

Page 30: 5 •me PARTIE LES MOYENS DU GEOMARKETING : CARTES ET …

Chapitre III

III. Le g�ocodage

Les donn�es utilis�es en g�omarketing comportent toujours deux volets : lalocalisation ou g�or�f�rencement et la description (nom, appartenance, valeurs…) Ilest possible d’effectuer des analyses g�omarketing sur n’importe quelle donn�e �condition qu’elle puisse �tre localis�e dans l’espace. Cette localisation se fait soit parrattachement � un objet de la carte (population d’un IRIS, revenu d’une commune…)soit par d�termination des coordonn�es (X,Y) du support de la donn�e (en principe une adresse g�ographique).les coordonn�es X,Y encore utilis�es en France dans lesyst�me de projection Lambert II �tendu correspondentau nombre de m�tres calcul�s dans un rep�re orthonorm� qui contiendrait la totalit� du territoire m�tropolitainfran�ais (tout en tenant compte du fait que le point origine est l’Observatoire de Paris dont l’ordonn�e est de 2.200.000 m (Voir fig. 5.32). Les normes europ�ennes en cours de mise en place sont, elles, fond�es sur le syst�me � EUREF � , correspondant � la projection WGS84. Le nouveau syst�me de r�f�rence fran�ais est nomm� � RGF93 �. Les coordonn�es g�ographiques seront d�finies en degr�s avec pour origine le m�ridien de Greenwich. Une projection unique Lambert 93 couvrira l'ensemble du territoire national.

En tout �tat de cause, le point rep�re de la localisation sera toujours la valeur descoordonn�es (X,Y) d’une adresse ou des contours d’un objet (IRIS, commune…). Les objets peuvent �galement �tre rep�r�s par la position de leur barycentre (ou centro�deg�ographique). Le g�ocodage, dans ce dernier cas, est r�alis� par l’interm�diaire ducode de l’objet concern� (Secteur postal, commune, IRIS, �lot).La nature ou la description des donn�es � g�ocoder peut �tre tr�s vari�e, nous citerons au hasard : le nombre de logements de 3 pi�ces dans un IRIS, la vitesse de circulationsur une portion d’axe routier, un relev� de pollution � un endroit donn�, le nombred’employ�s travaillant sur un site d’entreprise, le revenu moyen des contribuablesd’une commune, le chiffre d’affaires r�alis� avec des clients...

Fig. 5.32 : Syst�me de projection Lambert II �tendu

Page 31: 5 •me PARTIE LES MOYENS DU GEOMARKETING : CARTES ET …

Le g�ocodage, �galement appel� g�or�f�rencement, est un processus qui consiste �affecter ses coordonn�es propres (X, Y) � un point dans l’espace : adresse postale (n�16, rue des Peupliers � Nanterre) ou g�ographique (angle de la rue des Peupliers et duBd Cl�menceau ou centro�de d’un objet de la carte).La localisation d’une donn�e peut �tre faite au centro�de d’une commune ou d’unerue ou, de fa�on encore plus pr�cise, au num�ro dans une rue. Pour ce faire, deslogiciels sp�cialis�s (g�ocodeurs) analysent l’adresse fournie et la comparent avec lesinformations contenues dans un r�f�rentiel contenant des donn�es issues principalement de la carte vecteur (1).

1. G�ocodage au num�ro dans la rue

Une fois la commune, puis la voie trouv�es en utilisant des algorithmes decomparaison orthographique et phon�tique, le logiciel calcule la position exacte parinterpolation lin�aire entre les coordonn�es des deux bornes (num�ros des b�timentsaux intersections de voies) quiencadrent l’adresse. L’exactitude dela position est parfois entach�ed’erreur par la pr�sence entre lesdeux bornes d’une parcellebeaucoup plus grande que sesvoisines (parc ou b�timentadministratif, par exemple Voir fig. 5.33).

En g�omarketing l’approximation due � l’interpolation lin�aire (en moyenne + ou –20 m.) ne pose pas r�ellement probl�me ; par contre, un op�rateur t�l�coms en boucle locale radio devra, en phase d’�tude d’implantation technique des antennes, obtenir un positionnement beaucoup plus pr�cis, puisque la transmission des ondes ne peut se faire qu’entre deux antennes visibles l’une de l’autre. Outre la marge d’erreur signal�e, il peut exister �galement une distance non n�gligeable entre l’entr�e de l’immeuble sur la voie et la position r�elle du b�ti. La seule solution possible dans ce cas est d’avoir recours � la rectification des positions sur le plan cadastral ou au positionnement sur site en utilisant la technique du GPS (Voir plus loin).En outre, il n’est possible d’obtenir un r�sultat de codage satisfaisant que si toutes lesbornes de voies sont effectivement disponibles dans la carte ; il arrive parfois que desbornes manquent; il faudra donc que le g�ocodeur qualifie le degr� d’approximationretenu dans la production du r�sultat (ex: face au n� pair voisin si les n� impairs

(1) Il est �galement conseill� de ne pas se limiter au r�f�rentiel de la carte, et d’effectuer un premier traitement surle r�f�rentiel des rues publi� par la Direction G�n�rale des Imp�ts, appel� fichier FANTOIR, ou encore le r�f�rentiel Hexavia de La Poste, afin de contr�ler avec certitude l ’existence d ’une voie et son type (all�e, avenue, place...) dans une commune donn�e et d’extraire le code de la voie.

Fig. 5.33 : Incertitude de l’interpolation lin�aire

Page 32: 5 •me PARTIE LES MOYENS DU GEOMARKETING : CARTES ET …

manquent, barycentre de la rue si l’on ne dispose que des bornes de d�but de voie, oude fin de voie...).Un g�ocodage au num�ro dans la rue pratiqu� de fa�on s�rieuse devra effectuer leslocalisations suivantes et en rapporter le r�sultat individuel sur chaque adresse trait�e:- Position correcte : l’adresse a pu �tre positionn�e soit sur une borne de voie, soit parinterpolation lin�aire entre deux bornes existantes,- Intersection correcte : le num�ro n’est pas disponible dans l’adresse qui indiquecomme position l’�tat d’intersection et les noms des deux voies concern�es,- Position correcte sur un lieu (objet surfacique) sans num�ro (Place, parvis, tour...),- Position approxim�e : l’interpolation lin�aire a �t� effectu�e sur les bornes extr�mesde la voie (les bornes interm�diaires �tant manquantes) ou sur les bornes de l’autrec�t� de la rue (les bornes paires manquent, l’affectation se fera en face du num�roimpair interpol� voisin), ou enfin sur les bornes de 2 tron�ons (une borne manquant sur l’un d’eux).- Position estim�e : le num�ro de l’adresse exc�de le minimum ou le maximum desbornes indiqu�es dans la carte, la position sera alors sur le minimum ou le maximum,- Position au barycentre de la voie : l’adresse ne comporte pas de num�ro ou lesbornes sont absentes de la carte,- Voie non trouv�e : la voie et sa d�signation (avenue, rue, impasse…) n’ont pas �t�trouv�es dans la carte. Il importe de lier la d�signation et le nom de la voie, car defa�on courante nous pouvons trouver dans une m�me commune des voies qui portentle m�me nom, avec une d�signation diff�rente et qui ne sont pas toujours voisines.

Le logiciel de g�ocodage doit int�grer les particularismes de la langue du pays dontles adresses sont trait�es ; tous les essais de g�ocodage effectu�s en France avec desoutils �trangers, et inversement, se soldent par des r�sultats tr�s d�cevants ; en effetles d�signations compl�tes ou abr�g�es des types de voies sont diff�rentes et lesalgorithmes int�grent des r�gles d’analyse sp�cifiques � chaque langue (caract�ressp�ciaux, mots de liaison, phon�tique…).En outre, l’adresse � g�ocoder devra, en d�pit de l’efficacit� des algorithmes derecherche, �tre normalis�e. Une op�ration de restructuration pr�alablement aug�ocodage sera toujours productive en terme de r�sultat final; au pire dans certainscas, lorsqu’on dispose du num�ro de t�l�phone, il sera n�cessaire d’effectuer uneextraction d’adresse par la m�thode de l’annuaire invers�. En effet, dans la pratique, il est fr�quent que les adresses utilis�es couramment par les habitants de villes moyennes, en particulier dans le sud de la France, ne fassent r�f�rence qu’aux noms des r�sidences, HLM ou lieu dits et omettent le nom et le num�ro de la voie ; les cartes de leur c�t� poss�dent les donn�es sur les voies, mais sont en g�n�ral tr�s incompl�tes en ce qui concerne les r�sidences.Signalons �galement le risque pris par les outils qui effectuent le g�ocodage sur le type de voie et le seul mot directeur ; par exemple la rue du Moulin et la rue Jean Moulin ont le m�me mot directeur : � Moulin �. Il est important d’effectuer le

Page 33: 5 •me PARTIE LES MOYENS DU GEOMARKETING : CARTES ET …

rapprochement de l’adresse et du r�f�rentiel en plusieurs �tapes, d’abord sur le type de voie (rue) et le � toponyme � (du Moulin ou Jean Moulin), ensuite sur le toponyme moins les articles (du) et enfin sur le mot directeur ainsi que sur les version phon�tis�es du mot directeur.En fait, la difficult� du rapprochement n’est pas seulement li�e aux fautes d’orthographe (qui sont l�gion dans les fichiers) mais aussi au mode de d�signation d’un lieu que seul le pr�pos� local de La Poste saura interpr�ter (et, encore, sachant que pr�s de 2% des objets ou lettres trait�s par la poste, soit environ 500 millions ne peuvent parvenir � destination chaque ann�e).Si nous comparons sur une commune donn�e les diff�rents r�f�rentiels disponibles (Fantoir de la DGI, Hexavia de La Poste, G�oRoute de l’IGN) avec les adresses telles que les r�sidents les communiquent dans l’annuaire du t�l�phone, nous constatons, surtout en zones semi urbaines 25 � 30% de cas de non concordance. Un bon r�f�rentiel de g�ocodage devrait �tre constitu� de toutes les fa�ons usuelles possibles de d�signer un lieu, en incluant �galement les d�signations en langues r�gionales. En fait, l’annuaire est une excellente source pour constituer un tel r�f�rentiel car les compl�ments d’adresse communiqu�s par certains abonn�s permettent de faire le lien entre un lieu dit, une r�sidence, un lotissement… et une voie. Par exemple, dans la commune de Fontaine sous pr�aux (76273) nous constatons l’existence des d�signations de voies suivantes :

CARTE FANTOIR HEXAVIA ANNUAIRE

LOT LA RENARDIERE

LOT LA RENARDIERE LA RENARDIERE LA RENARDIERE

LA RENARDIERE RTE VAL

ISNEAUVILLE

LOT LA RENARDIERE

RTE ISNEAUVILLE

RESID RENARDIERE RTE VAL ISNEAUVILLE

RTE D'ISNEAUVILLE

RTE D ISNEAUVILLE

ROUTE DU VAL D ISNEAUVILLE

R VAL D'ISNEAUVILLE

RTE VAL ISNEAUVILLE RTE ISNEAUVILLE

RTE DE RONCHEROLLES

RTE DE RONCHEROLLES

COTE DE RONCHEROLLES

RTE RONCHEROLLES

RLE AUX CAILLOUX

RUE AUX CAILLOUX

RUETTE AUX CAILLOUX RLE CAILLOUX RUETTE AUX

CAILLOUX

CHE DE LA ROBINETTE

CHEMIN DE LA ROBINETTE CHE ROBINETTE IMP ROBINETTE

CHE ROBINETTE RTE

RONCHEROLLES

Nous sommes en mesure de rattacher le lotissement/r�sidence La Renardi�re � la route (du val) d’Isnauville et le chemin/impasse de la Robinette (qui n’existe pas dans la carte) � la route de Roncherolles. Egalement nous pouvons affirmer que la voie � aux cailloux � peut porter les d�signations � Rue, Ruelle ou Ruette �

Toutes ces difficult�s s’expliquent car, dans le domaine de l’adresse, la France est en retard sur les grands pays europ�ens ou sur l’Am�rique du Nord ; en effet son syst�me est peu pr�cis (code postal qui inclut une ou plusieurs communes) et ne repose pas sur une r�f�rence nationale. Les administrations (Direction G�n�rale des Imp�ts, La Poste, l’INSEE…) et les grandes entreprises (EDF, GDF, France t�l�com…) ont �t� amen�es � cr�er leurs propres syst�mes de codification permettant de localiser des lieux pr�cis.

Page 34: 5 •me PARTIE LES MOYENS DU GEOMARKETING : CARTES ET …

Dans la pratique, les communes ont toutes comp�tences pour nommer les voies et attribuer les num�ros dans ces derni�res ; les voies priv�es, m�me ouvertes � la circulation sont nomm�es par leurs propri�taires (Voir le probl�me d�j� signal� des zones industrielles priv�es) les voies d�partementales et nationales sont du ressort de l’administration. Quand au sous adressage, chaque propri�taire est libre de son libell� (B�timent, escalier, niveau…), toutefois tous les locaux sont pr�cis�ment identifi�s par un code dans le fichier des propri�t�s b�ties de la Direction G�n�rale des Imp�ts, ainsi que dans le fichier du recensement INSEE. Seule une norme Afnor codifie le libell� de l’adresse (6 lignes d’au plus 36 caract�res chacune). Une des cons�quences imm�diates de cette situation est que les prestations de livraison � domicile sont tr�s on�reuses et que m�me les services de secours (SAMU, pompiers…) rencontrent de grandes difficult�s � localiser l’emplacement pr�cis de leurs interventions.La complexit� du probl�me est r�v�l�e par les quelques faits suivants :- Il existe environ 200 types de voies qui ont �t� normalis�s (Abbaye, Aire, All�e, Anse, Ancien chemin, Ancienne route, Arcade, Autoroute, Avenue...)- Le fichier Fantoir comprend 1 million de voies (adressage lin�aire) et 6 millions de lieux dits (adressage surfacique), mais n’inclut aucune donn�e de num�rotation. En outre, il existe plus d’un million de voies qui n’ont pas de toponyme.- La poste g�re 18 millions de points d’adressage.- Le fichier Correspondances adresses de l’INSEE (voies, bornes, affectation aux �lots) n’est disponible que pour les communes de plus de 10.000 h, soit 1061 communes - Aucun fichier exhaustif n’est g�or�f�renc�.- Un b�timent peut poss�der plusieurs adresses.- Les donn�es peuvent varier (changements de noms de voies, de num�ros, de limites communales) et aucun fichier ne g�re d’historique g�n�ralis�.- 10% des locaux �chappent au recensement des propri�t�s b�ties par la DGI dont le fichier comprend 41 millions d’unit�s.- Les quelques �changes d’informations r�alis�s entre la DGI, La Poste et l’INSEE se font sous forme de documents papier…- Aucune r�gle de gestion n’est impos�e ni m�me recommand�e aux communes pour d�finir leur voirie, ainsi, un objet unique (une rue) peut �tre partag�e en tron�ons discontinus s�par�s par des places, des voies peuvent porter plusieurs toponymes (nom d’usage, noms r�gionaux) et une commune peut inclure plus d’une voie avec un toponyme identique.- La num�rotation est souvent d�ficiente, en particulier en zones rurales ou nouvellement urbanis�es dans lesquelles la pratique d’utilisation du lieu dit ou du nom de l’immeuble a une tendance f�cheuse � se d�velopper. De nombreuses exceptions existent au principe de la num�rotation des c�t�s pairs/impairs, ainsi Place Vend�me � Paris les num�ros se suivent tout autour de la place qui ne comporte pas de c�t� pair et de c�t� impair.

Page 35: 5 •me PARTIE LES MOYENS DU GEOMARKETING : CARTES ET …

La cr�ation d’un r�f�rentiel national de gestion des adresses qui fait partie des recommandations du rapport Lengagne est en projet. Le codage sp�cifique des zones habit�es, habitables ou non habit�es n�cessiterait la mise en place d’environ 18 millions de codes g�o r�f�renc�s. L’importance de la t�che, la d�termination d’un organisme gestionnaire et les aspects de protection de la personne freinent consid�rablement l’avancement des travaux dans ce domaine. L’int�r�t du r�f�rentiel g�or�f�renc� d�borde le cadre des �tudes en tout genre et trouve une application pratique dans les besoins de localisation en navigation embarqu�e (par exemple pour effectuer des livraisons � domicile) ou en positionnement simple (par exemple obtenir par transfert de donn�es sur t�l�phone mobile la carte renseign�e de l’endroit o� l’on se trouve).A noter enfin le projet BD ADRESSES de l’IGN pr�vu pour 2006 : r�f�rentiel g�ocod� de tout le b�ti ; entre temps l’INSEE pr�voit mettre en place le RIL(R�pertoire d’Immeubles Localis�s) pour faciliter le recensement dans les communes de plus de 10.000 h. Ces bases permettraient d’�viter d’extraire le r�f�rentiel des donn�es cartographiques et seraient plus pr�cis que la m�thode d’interpolation lin�aire, mais ne r�soudraient pas le probl�me de la comparaison et de la mise en concordance entre l’adresse retenue par l’INSEE dans le r�f�rentiel et celle qui est � coder ; les algorithmes de traitement de l’adresse resteront indispensables.

2. G�ocodage au territoire administratif

Lorsqu’une donn�e est li�e � un territoire dont la position est connue par les coordonn�es des vecteurs qui le limitent, il est ais� de calculer la position du barycentre et de lui affecter les valeurs concern�es. L’affectation peut ainsi �tre faite � la commune, au canton, au code postal, au d�partement.… sans oublier, toutefois, que la forme de certains cantons ou IRIS, en particulier, est telle que le barycentre math�matique peut se situer hors du territoire. Il est alors envisageable d’utiliser,

lorsqu’on en dispose, la carte des zones b�ties. La carte de la r�gion de Voiron, ci-contre, montre les deux approches (barycentre de la commune en bleu et des zones b�ties enorange – Voir fig. 5.34). Si ces derni�res sontth�oriquement plus int�ressantes eng�omarketing, permettant de mieux localiserles ph�nom�nes socio-�conomiques, leurd�faut est de se trouver parfois positionn�esquasiment � cheval sur deux communes. Les cartes r�centes fournissent �galement pour les zones interurbaines les positions d’un grand nombre de lieux dits, il est donc int�ressant d’utiliser ces donn�es pour

Fig. 5.34 : Barycentres de la commune et de la zone b�tie

Page 36: 5 •me PARTIE LES MOYENS DU GEOMARKETING : CARTES ET …

localiser avec plus de pr�cision les adresses qui contiennent l’information lieu dit ; par contre, les adresses de la m�me commune pour lesquelles aucune correspondance n’aura �t� trouv�e sur base du lieu dit, devront �tre g�ocod�es au barycentre de la zone b�tie en ORANGE et non pas au barycentre de la commune dans son ensemble (Voir fig. 5.35). A noter que pour effectuer un g�ocodage � la commune � partir d’une adresse postale (code postal et nom de la commune), il est indispensable d’effectuer pr�alablement une recherche du code INSEE commune car il est fr�quent, m�me dans des fichiers de qualit�, de rencontrer soit des fautes d’orthographe dans les noms des villes, soit des erreurs de codes postaux. En outre les adresses comportent fr�quemment de faux noms de communes, ainsi, � Paris La D�fense � n’est pas une commune, mais un territoire th�oriquement d�limit� par la zone de gestion de l’EPAD, mal d�fini par les r�sidents et � cheval sur 3 communes (Nanterre, Courbevoie et Suresnes) ; il importe donc de conna�tre l’affectation des tours et immeubles � chacune des communes. Le code Cedex, s’il est indiqu�, peut �galement �tre utilis� car La Poste met � disposition le fichier des rattachements de codes Cedex aux communes.Si ces pr�cautions sont respect�es, un g�ocodage � la commune doit �tre r�alis� � 100%.Les g�ocodages � l’IRIS et � l’�lot rel�vent de la probl�matique du codage � la rue, car il faut affecter l’adresse � g�ocoder � un segment de voie dont le r�f�rentiel indique qu’il appartient � tel IRIS ou � tel �lot. Rappelons toutefois que le r�f�rentiel � correspondances adresses � de l’INSEE qui permet de coder � l’IRIS ne comprend que 1061 communes (50% de la population),alors que 1838 communes (61% de la population) sont d�coup�es en IRIS . A titre d’exemple, la commune la plus importante que l’on ne peut pas coder � l’IRIS est Pornic (11.900 h. r�partis dans 4 IRIS.Par cons�quent il est n�cessaire, si l’on dispose des cartes � la rue sur l’ensemble du territoire (agglom�rations > 10000 h.), de proc�der en deux temps, d’abord g�ocoder au num�ro dans la rue les adresses des communes disponibles dans la cartographie, puis affecter le code de l’IRIS dans lequel se trouve le couple X,Y trouv� (calcul de base en g�om�trie). De cette fa�on il sera possible de g�ocoder les adresses de 1490 communes (57% de la population), soit un gain de 429 communes et de 14% en population).

Fig. 5.35 : Lieux dits et zones b�ties

Page 37: 5 •me PARTIE LES MOYENS DU GEOMARKETING : CARTES ET …

Quand aux 353 communes restantes (4% de la population), il sera impossible de proc�der � une affectation � l’IRIS, sauf � travailler sur cartes raster ou papier et traiter chaque enregistrement manuellement, op�ration tr�s lourde, difficile � justifier sur le plan �conomique. Certains �diteurs de cartes � la rue ont r�cemment commenc� � �tendre leur couverture aux agglom�rations > 5000 h., ce qui permettra de faire encore un peu reculer les limites au codage des IRIS

Pratique du g�ocodage

La puissance d’un logiciel de g�ocodage rel�ve avant tout de la richesse du r�f�rentiel utilis� et de la qualit� des outils de rapprochement de l’adresse � traiter et du r�f�rentiel.Les algorithmes de comparaison sont compos�s de moyens de reconnaissance diversqui vont de l’association de caract�res jusqu’aux m�thodes de phon�tisationsophistiqu�es; ceci implique qu’un logiciel de g�ocodage n’est performant que pourla langue dans laquelle il a �t� con�u. La technique du g�ocodage ne rel�ve pas du tout de la cartographie ou de la g�ographie, mais du traitement de donn�esEn France, les scores obtenus par de bons g�ocodeurs con�us pour les adressesfran�aises peuvent atteindre 95 � 97% sur la r�gion parisienne, mais plafonnent �85% sur Marseille ou Nice, � cause de la moins bonne qualit� moyenne des fichiersadresses qu’aux absences d’information dans la carte (bornes manquantes, ruesnouvelles ou qui ont chang� de nom). Il se trouve par exemple qu’� Bordeaux il existe 60 voies homonymes, cons�quence de l’int�gration de l’ancienne commune de Cauderan.Pour effectuer un g�ocodage, il est indispensable d’utiliser les donn�es des cartesvecteur, la carte raster, ne comportant aucune information de type fichier qui permetted’identifier les objets de la carte et leurs coordonn�es X,Y. L’am�lioration du codage par usage de plans cadastraux raster dont nous avons parl� en d�but de chapitre ne peut �tre r�alis�e qu’en repositionnement manuel d’adresses d�j� trait�es par codage automatique. Dans la pratique et sauf � avoir la n�cessit� de coder, soit de tr�s gros volumes de donn�es (plusieurs millions), soit des quantit�s faibles, mais avec une fr�quence �lev�e (en logistique, par exemple) il est recommand� de confier p�riodiquement l’op�ration � des prestataires sp�cialis�es dans le traitement de l’adresse.

Le g�ocodage doit �tre d’autant plus pr�cis (au num�ro dans la rue) que la densit�d’informations est forte, soit en g�omarketing, les agglom�rations de plus de 10.000h. La repr�sentation finale est rarement faite au num�ro dans la rue, mais il estessentiel que l’agglom�ration des donn�es, soit effectu�e aux bonnes cellules deregroupement.

Page 38: 5 •me PARTIE LES MOYENS DU GEOMARKETING : CARTES ET …

Le g�or�f�rencement peut �galement �tre r�alis� en utilisant des instruments depositionnement par rapport � des �metteurs terrestres ou satellites (GPS/ GlobalPositioning System), dont la pr�cision varie de moins d’un m�tre � quelques dizainesde m�tres. Originellement utilis� par le D�partement de la D�fense des Etats Unis. etutilisant 24 satellites, une m�thode de d�gradation du signal (Selective availibility) estimpos�e aux utilisateurs civils afin de r�duire la pr�cision disponible pour cesderniers. Les pays europ�ens mettent en place le syst�me Galileo dont la pr�cision sera de 4 m�tres. Le co�t des syst�mes est li� au degr� de pr�cision qu’ils offrent.L’inconv�nient majeur consiste � devoir se rendre sur le terrain pour effectuer lesrelev�s, ce qui implique des investissements tr�s �lev�s; toutefois cette solution resteparfois la seule lorsque les cartes vecteur de la zone ne sont pas disponibles.