le crm analytique les outils d'analyse olap et le data mining

23
Faculté des Sciences économiques et sociales Université de Fribourg Le CRM analytique Les outils d’analyse OLAP et le Data Mining Dans le cadre du séminaire « Customer Relationship Management » Professeur Dr. Andreas Meier Assistant Darius Zumstein Rédigé et présenté par Géraldine Graf Case postale 11 1610 Oron-la-Ville [email protected] Julien Stern Edouard Payot 8 1005 Lausanne [email protected] Fribourg, le 26 avril 2008

Upload: voliem

Post on 05-Jan-2017

237 views

Category:

Documents


2 download

TRANSCRIPT

Page 1: Le CRM analytique Les outils d'analyse OLAP et le Data Mining

Faculté des Sciences économiques et sociales Université de Fribourg

Le CRM analytique Les outils d’analyse OLAP et le Data Mining

Dans le cadre du séminaire « Customer Relationship Management »

Professeur Dr. Andreas Meier Assistant Darius Zumstein

Rédigé et présenté par

Géraldine Graf Case postale 11 1610 Oron-la-Ville [email protected]

Julien Stern Edouard Payot 8 1005 Lausanne [email protected]

Fribourg, le 26 avril 2008

Page 2: Le CRM analytique Les outils d'analyse OLAP et le Data Mining

2

TABLE DES MATIÈRES

Introduction 1.1 Définition du CRM

1.1 Le CRM : une culture d’entreprise 1.2 Les trois phases du CRM

2. Les trois dimensions du Customer Relationship Management

2.1 Le CRM opérationnel 2.2 Le CRM collaboratif 2.3 Le CRM analytique

3. Le data warehouse, une définition

3.1 Le data warehouse à la croisée des trois CRM 3.2 Le stockage des données dans l’entrepôt de données

4. Des systèmes d’information OLTP au data warehouse

4.1 L’analyse des données : le data warehouse et les outils OLAP 4.2 Le cube OLAP, Drill Down – Roll Up et Slicing 4.3 Exemples d’application des outils d’analyse OLAP

5. Définition du data mining

5.1 Les facteurs de succès du data mining 5.2 La préparation des données 5.3 Les tâches effectuées par le data mining

5.3.1 La description 5.3.2 L’estimation 5.3.3 La segmentation 5.3.4 La classification 5.3.5 La prévision 5.3.6 L’association

6. La Poste et le CRM

6.1 La fin annoncée d’un monopole 6.2 L’importance de l’émotion dans la relation client 6.3 La qualité et la mise à jour constante des données 6.4 Siebel et le CRM analytique, un exemple concret

Conclusion Bibliographie

Page 3: Le CRM analytique Les outils d'analyse OLAP et le Data Mining

3

Introduction Ce travail porte sur le Customer Relationship Management (CRM), soit la gestion de la relation client. Nous avons abordé ce concept en nous focalisant sur sa dimension analytique, orientation justifiée par le choix de notre sujet de séminaire, à savoir les outils d’analyse OLAP et le data mining. Comme nous le verrons par la suite, le CRM analytique repose en grande partie sur l’informatique. Que ce soit au niveau de la production des données, de leur stockage ou enfin de l’analyse, utile en outre à l’optimisation des processus et à la prise de décision, l’informatique est omniprésente. En tant qu’étudiants en gestion d’entreprise, nous avons donc choisi de laisser parfois de côté certains aspects particulièrement techniques. Ceci étant, ce travail espère offrir une vision la plus large possible des principaux enjeux liés au CRM analytique en particulier, ainsi qu’à la gestion de la relation client en général. Notre travail se divise en six parties. Après une brève introduction présentant le CRM de manière générale, nous présentons les trois dimensions, que l’on retrouve régulièrement citées dans la littérature pour le définir. La partie suivante définit le concept de data warehouse, en français l’entrepôt de données, qui joue un rôle primordial dans le processus d’analyse. Les parties quatre et cinq traitent respectivement des outils OLAP et du data mining. Nous terminons avec un exemple concret de l'application du CRM au sein d’une entreprise, en l’occurrence « La Poste ». La conclusion sera enfin l’occasion d’apporter un regard critique sur notre travail, sur l’application du CRM analytique dans la réalité ainsi que sur la définition voire la promotion de la gestion de la relation client dans les livres comme sur Internet.

Page 4: Le CRM analytique Les outils d'analyse OLAP et le Data Mining

4

1. Définition du CRM De nos jours, l’évolution des technologies, la mondialisation des marchés et le raccourcissement du cycle de vie des produits rendent la concurrence toujours plus rude. Il devient très difficile pour une entreprise de conserver sa part de marché en se basant uniquement sur les prix et les produits. Le fort déclin de la publicité de masse illustre cette difficulté à gagner et à conserver des parts de marché en se focalisant uniquement sur le produit. Dès les années 80, les techniques de marketing de masse n’apportant guère de résultats positifs pour les entreprises, elles cèdent leurs places à un marketing direct, orienté vers le client, qu’il faut comprendre, satisfaire et avec qui il faut communiquer « directement » afin d’optimiser le succès futur de l’entreprise. Le CRM s’inscrit clairement dans cette évolution et représente, d’une certaine manière, le dernier marketing direct. Afin de construire une relation avec le client dans le but d’aboutir à une fidélité de ce dernier, les entreprises s’orientent donc actuellement et de plus en plus vers la gestion de la relation client. Le CRM est un processus qui consiste à gagner, à conserver, à élargir et à fidéliser une clientèle. Sa stratégie est de placer le client au centre des préoccupations de l’entreprise en instaurant un dialogue, une relation de confiance et un respect mutuel avec les clients. La communication bidirectionnelle ainsi que la circulation de l’information sont des données primordiales pour élaborer une stratégie CRM. Il est effectivement indispensable pour l’entreprise de comprendre ce que veut le client, ce dernier étant placé au centre des préoccupations. Les connaissances que l’entreprise se doit d’avoir du marché sur lequel elle se trouve ainsi que l’acquisition des informations récoltées sur le client à chaque contact avec celui-ci, vont permettre à l’entreprise, pour autant qu’elles soient utilisées à bon escient, d’optimiser la satisfaction de sa clientèle. Comme nous le verrons plus tard dans le travail, la technologie revêt un rôle essentiel dans le CRM. Elle va permettre d’extraire des connaissances à partir de données stockées et gérées dans un entrepôt de données, puis analysées grâce aux outils OLAP et au data mining. 1.1 Le CRM : une culture d’entreprise Le succès du CRM nécessite un engagement réel qui ne concerne pas seulement un département de vente ou de marketing mais nécessite l’engagement de l’ensemble du personnel concerné. La culture d’entreprise est ainsi un facteur de réussite déterminant dans la gestion de la relation client. L’entreprise se doit ainsi d’évoluer dans une atmosphère et un climat favorable afin que le client se sente en confiance, à l’aise et apprécié. Le développement de la culture d’entreprise passe par le bien être et la motivation des employés. L’identification de l’employé envers son entreprise amène celui-ci à rester fidèle à son employeur. Ceci étant, l’employé pourra construire une relation à long terme et personnelle avec le client, ce qui conduira à la compréhension des

Page 5: Le CRM analytique Les outils d'analyse OLAP et le Data Mining

5

besoins du client par l’employé. Si la communication entre les différents départements de l’entreprise est réalisée, l’employé va se transformer en vecteur de communication et va ainsi permettre à l’entreprise entière de comprendre les besoins de la clientèle. 1.2 Les trois phases du CRM Dans « La gestion de la relation client », Stanley Brown divise la stratégie CRM en trois phases qu’il nous paraît important de citer. En effet, elles résument à elles seules les enjeux et fondements du Customer Relationship Management :

- La conquête permanente de nouveaux clients. - La fidélisation de ces derniers. - La gestion stratégique du service client : l’entreprise doit identifier ses clients

les plus prometteurs et ainsi, tout en conservant un service de bonne qualité à l’ensemble de ses clients, leurs offrir des services de qualité encore plus élevés.

Le concept de fidélisation est central. Son but est l’optimisation de la relation client et il représente la clé de l’augmentation des recettes au sein d’une entreprise. A l’instar de son importance dans le CRM, il sera en outre le fil conducteur de notre travail. Pour ce faire, l’entreprise devra faire évoluer sa relation avec le client comme une relation amoureuse, en construisant progressivement les valeurs de loyauté et de confiance et ce, afin de se démarquer de ses concurrents. En se montrant à l’écoute, l’entreprise va faire évoluer ces valeurs afin d’installer une alliance entre les deux parties. Les intérêts des clients étant compris, il sera alors possible pour l’entreprise d’adresser des messages ainsi que des services ciblés au client, services pouvant être des avantages offerts par l’entreprise. Dès lors que le client devient un réel partisan de l’entreprise, la fidélité est établie et ce dernier va véhiculer une image positive de l’entreprise en la recommandant à d’autres personnes. 2. Les trois dimensions du Customer Relationship Management Au cours de notre recherche, nous avons fréquemment retrouvé le CRM divisé en trois domaines d’activité interdépendants : le CRM opérationnel, le CRM collaboratif et le CRM analytique. La collaboration de ces trois parties a pour finalité de réaliser l’objectif ultime de la stratégie CRM de l’entreprise, c’est-à-dire le développement et l’optimisation de la relation client. Le tableau ci-dessous montre de manière schématique les trois éléments du CRM et leur interdépendance.

Page 6: Le CRM analytique Les outils d'analyse OLAP et le Data Mining

6

Schéma 1: extrait de l’article « The designing of CRM based on Data Warehouse »1 Notre travail se focalisera essentiellement sur l’analytique (à droite dans le schéma) et spécifiquement à la fonction du data warehouse (ou entrepôt de données), des outils d’analyse OLAP et du data mining. Cependant, afin de mieux comprendre le CRM dans son ensemble et de bien se représenter le rôle et la participation de chacun des ses éléments dans le fonctionnement optimal du tout, il est nécessaire de définir ce que l’on entend par CRM opérationnel et collaboratif. 2.1 Le CRM opérationnel Le CRM opérationnel peut être défini comme l’automatisation et l’amélioration constante des processus de vente, de marketing et de service client. Celles-ci sont rendues possibles grâce à l’analyse des données qui sont produites lors des différentes opérations, analyse qui par effet « boomerang » permet d’apporter des améliorations à ces mêmes processus. Par exemple, le public cible d’une action marketing sera défini plus précisément ou encore le canal de distribution d’un produit sera adapté selon les préférences de chaque client. 2.2 Le CRM collaboratif Le CRM collaboratif fait référence aux moyens de communication au travers desquels l’entreprise entre directement en contact avec le client. On pense notamment au call center, à Internet ou encore à la correspondance par emails. Un des objectifs du CRM collaboratif est de donner une image de l’entreprise positive et uniforme au client et d’établir une relation de confiance avec lui en proposant un service personnalisé et de qualité. C’est également, dans cette même idée, l’occasion de récolter de très précieuses informations sur le client, qui seront stockées et permettront de mieux cibler ses besoins et ses attentes. Enfin, un des enjeux principaux du CRM collaboratif est d’assurer à chaque employé l’accès à une information la plus complète et la plus récente possible sur son interlocuteur, afin que ce dernier se sente suivi et considéré personnellement. 1 Dans le partie opération, relevons les abréviations suivantes: SFA pour Sales Force automation, MA pour Marketing automation, CSS pour Client Support Service.

Page 7: Le CRM analytique Les outils d'analyse OLAP et le Data Mining

7

2.3 Le CRM analytique Le rôle du CRM analytique est la véritable clé de voûte du système. Nous l’aborderons plus dans les détails par la suite mais en résumé, il consiste à stocker et à analyser la très vaste quantité de données générées en bonne partie par le CRM opérationnel et collaboratif. A partir de ces données, les différents outils d’analyse se chargent d’extraire des connaissances qui servent de support à la prise de décision et permettent d’améliorer notamment les processus du CRM opérationnel et collaboratif. 3. Le data warehouse, une définition Lorsque l’on pense CRM, parler de data warehouse est incontournable. Il permet le stockage et l’analyse de données, et est à la base du partage de l’information et de la création des connaissances indispensables à la compréhension des clients et à la prévision de leurs comportements. Avant d’aborder ses activités, donner une définition d’un entrepôt de données nous donnera des éléments de compréhension utiles pour la suite. Celle-ci comporte quatre points principaux sur lesquels nous allons nous attarder dans ce chapitre. « A Data warehouse is a subject oriented, integrated, non-volatile, and time variant collection of data in support of management’s decisions » (Inmon, 1996). « L’entrepôt de données est « orienté sujet », c’est-à-dire organisé autour des thèmes majeurs qui touchent au métier de l’entreprise » (Grenier, C. et Moine, C., 2003). Les données sont à l’origine regroupées par processus fonctionnels, alors qu’ici elles sont structurées par thème. Ces données se doivent donc d’être intégrées à l’entrepôt de données. Elles sont de fait mises en forme et réunies à partir de systèmes hétérogènes et de sources externes dans une seule et même base de données. Cette phase du processus est la plus complexes du data warehousing. Troisièmement, l’entrepôt de données stocke des données « non-volatiles », ce qui veut dire qu’elles ne sont pas mises à jour, ni modifiables. Elles sont comme photographiées, seule leur lecture est possible ce qui n’est pas le cas des données contenues dans les systèmes d’information opérationnels. Enfin, dans la continuité, les données sont simplement ajoutées les unes après les autres au sein de l’entrepôt de manière chronologique. Chaque donnée est ainsi associée à une date à laquelle elle a été créée.

Page 8: Le CRM analytique Les outils d'analyse OLAP et le Data Mining

8

3.1 Le data warehouse à la croisée des trois CRM Avant d’aller plus en avant dans le CRM analytique, dans la définition et l’usage des outils de recherche OLAP et du Data mining, il est important de parler du rôle fondamental que tient le data warehouse au sein du CRM.

Schéma 3 : extrait de l’article « Customer Analytics Making the Difference in CRM : Customer

Analytics Amplify the value of integrated CRM Solutions »

A l’image du tableau ci-dessus, parler de data warehouse ou d’entrepôt de données s’inscrit dans un concept plus général qui est celui de l’intégration de systèmes d’information hétérogènes. Le data warehouse fait référence en l’occurrence, à l’intégration par les données qui sont partagées par des systèmes autonomes. En observant le schéma ci-dessus, on peut constater que l’entrepôt de données fait littéralement office de pivot entre chacun des éléments du CRM. Prenons un exemple. Que l’on parle de l’analyste, du chef de produit, du marqueteur ou encore du collaborateur du centre d’appels, chacun a accès, grâce à l’entrepôt de données, à la même source de données et aux mêmes informations. L’analyste utilise ses outils d’analyse pour trouver dans le « Customer Data Warehouse » les résultats de ses requêtes et des nouvelles connaissances qui aideront les managers ou les ingénieurs dans leurs décisions comme dans l’optimisation des différents processus opérationnels de l’entreprise. Le chef de produit focalisera son attention sur les ventes de son produit, par région, par période et ce, souvent par l’intermédiaire d’un data mart2. A l’aide de ces même data marts, le marqueteur a la possibilité de voir l’efficacité ou non d’une campagne de publicité et de la réajuster si besoin est. Et finalement, le collaborateur du centre d’appels aura accès à l’information la plus complète possible sur chacun des clients avec qui il est amené à communiquer grâce au « Operational Data Stores »3. 2 Un data mart est une partie du data warehouse. Il permet de faire des requêtes sur une base de données plus petite qui regroupe les données qui correspondent aux besoins de l’utilisateur. Le responsable marketing, le chef de vente disposent ainsi chacun d’un extrait du data warehouse spécifique à leur domaine d’activité. Les données y sont moins nombreuses et permettent des analyses plus rapides et ciblées. 3 Un « Operational Data Stores » est comme un intermédiaire entre l’utilisateur et l’entrepôt de données. Il est remis à jour tout au long des opérations commerciales et permet des requêtes simples sur une petite quantité de

Page 9: Le CRM analytique Les outils d'analyse OLAP et le Data Mining

9

3.2 Le stockage des données dans l’entrepôt de données Comme on l’a vu ci-dessus, le CRM analytique a pour fonction de permettre le stockage et l’analyse des données générées notamment par les opérations de marketing, de vente, le service client ainsi que les informations récoltées sur le client lors de contacts téléphoniques, électroniques ou encore grâce à des questionnaires. Comme on peut le voir dans le tableau ci-dessous, l’étape qui précède l’analyse est celle qui consiste à extraire les données de là où elle se trouve et de les stocker dans un entrepôt de données ou un data warehouse. Cette phase du processus est cruciale et comporte certaines difficultés et des risques qu’il est important d’énoncer ici.

Schéma 2 : extrait de l’article « The designing of CRM based on Data Warehouse » On peut constater tout d’abord, que les données que l’on va intégrer au data warehouse ne proviennent pas seulement des CRM opérationnel et collaboratif. En effet, il existe deux autres sources qui viennent compléter l’entrepôt de données et permettre d’affiner la qualité des résultats du travail d’analyse. Il s’agit des données internes à l’entreprise contenues dans les progiciels de gestion intégrée (ERP), celles produites par le Supply Chain Management et enfin celles qui proviennent que des sources externes. La diversité des sources desquels vont être extraites les données vers le data warehouse implique une première difficulté technologique. Effectivement, il s’agit ici d’intégrer ou de regrouper des données de nature différente, provenant de sources et de systèmes d’information distincts les uns des autres. Cette tâche est réalisée par un logiciel middleware appelé ici ETL4. Comme son nom l’indique, ce logiciel primordial permet d’extraire des données de sources multiples, de les transférer et de les charger dans l’entrepôt de données. Un autre aspect à ne pas minimiser dans cette étape du processus est le choix des données que l’on va choisir d’intégrer à l’entrepôt de données. En effet, il s’agit ici de définir préalablement les besoins des utilisateurs afin d’y répondre le plus données comme définir l’état d’une commande. C’est l’équivalent de la mémoire à court terme au contraire de l’entrepôt de données qui stockent des données qui peuvent entre cinq et dix ans. 4 Extraction-transfer-Load

Page 10: Le CRM analytique Les outils d'analyse OLAP et le Data Mining

10

précisément possible mais également pour éviter que l’entrepôt de données soit « une prison de données »5 , dans laquelle on ne puisse finalement pas accéder à ce que l’on recherche. 4. Des systèmes d’information OLTP au data warehouse Comme nous l’avons vu, le data warehousing est un élément fondamental du CRM analytique puisqu’il permet d’extraire et de stocker les données dans un seul endroit afin d’y être analysées et d’en tirer des connaissances qui serviront de support à la prise de décisions et à l’amélioration des processus au sein de l’entreprise. La distinction qui fait l’objet de ce chapitre entre les systèmes OLTP, soit Online Transactional Processing, et OLAP ou Online Analytical Processing a été à plusieurs reprises abordées plus haut. Nous avons cependant délibérément choisis d’attendre avant d’évoquer plus spécifiquement ces deux concepts. En effet, bien qu’il eut été possible de les énoncer dans la partie sur le data warehousing, il nous a semblé plus simple de ne pas tout mélanger et d’en faire un chapitre à part entière. L’abréviation OLTP fait référence aux systèmes d’information qui facilitent et gèrent les transactions opérationnelles de l’entreprise. Comme nous l’avons vu précédemment, ce sont justement ces derniers qui produisent de manière indépendante les uns des autres, les données que la tâche du data warehousing va réunir dans une seule et même base de données afin d’y être analysées grâce aux outils OLAP et au data mining. En résumé, « l’information qu’il [le data warehouse] contient provient, pour la majeure partie, de systèmes opérationnels configurés en systèmes transactionnels ou OLTP, conçus à l’origine pour traiter et enregistrer un grand nombre de petites transactions. La structure des bases de données OLTP vise au traitement rapide de telles transactions, ce qui réduit autant que possible le délai de réaction d’un système opérationnel. L’entrepôt de données, quant à lui, consiste en un ou plusieurs systèmes aptes non seulement à répondre rapidement à des questions demandant un important volume de données mais aussi à stocker ces dernières de manière efficace » (Ed Peelen, 2006). 4.1 L’analyse des données : le data warehouse et les outils OLAP Nous l’avons vu précédemment, les systèmes OLTP s’occupent de gérer les processus opérationnels au sein de l’entreprise à l’inverse du data warehouse qui sert à stocker les données et des outils OLAP qui sont destinés à leur analyse. N’ayant pas les connaissances de l’informaticien de gestion, nous avons choisis concernant les outils d’analyse OLAP, de nous arrêter à la présentation du cube OLAP6. Ce concept est effectivement souvent utilisé pour représenter les possibilités que les outils d’analyse offrent à l’utilisateur. 5Tiré de l’article scientifique « Building a Data Warehouse step by step », p. 2 6 Nous n’aborderons notamment pas les différentes modèles OLAP, à savoir MOLAP, ROLAP, HOLAP et DOLAP, bien trop techniques et compliqués à comprendre pour nous.

Page 11: Le CRM analytique Les outils d'analyse OLAP et le Data Mining

11

Avant de poursuivre dans le chapitre suivant sur les usages et le potentiel du cube OLAP, citons encore l’extrait d’un article qui explique la relation qui lie le data warehouse et les outils OLAP. « Les applications OLAP sont intimement associées aux entrepôts de données - c'est-à-dire les bases qui, au sein d'une plate-forme de business intelligence7, se chargent de consolider (par le biais d'outils d'intégration de données notamment) l'ensemble des informations métier d'une activité, en vue d'en permettre ensuite l'analyse. En fait, un datawarehouse se résume en une architecture trois tiers :

- Une base relationnelle qui stocke et structure les contenus, - La couche d'analyse OLAP en tant que telle (ou serveur OLAP), - Les interfaces client de reporting » (Antoine Crochet-Damais, 2008).

4.2 Le cube OLAP, Drill Down – Roll Up et Slicing Comme nous l’avons évoqué plus haut, le concept OLAP fait référence à une méthode d’analyse qui peut être représentée par un cube. Comme nous pouvons le voir dans le schéma ci-dessous, le cube s’organise autour de deux concepts fondamentaux, le fait et les dimensions. Le fait, en principe numérique, est l’information que l’on veut mesurer puis analyser alors que les dimensions (par exemple la période de temps, la zone géographique ou la gamme de produits), constituées d’une hiérarchie d’attributs, représentent les axes à partir desquels le fait est calculé.

Schéma extrait du cours intitulé « Systèmes d’information de l’entreprise », dispensé par le Dr. Stefan

Huesemann à l’Université de Fribourg au semestre d’automne 2007-2008.

Un des grands avantages d’une telle organisation des données est la flexibilité et la facilité avec lequel l’utilisateur peut adapter ses requêtes selon ses besoins. Le schéma ci-dessus, constitué du chiffre d’affaire pour le fait et du temps, du lieu et du produit pour les dimensions (elles peuvent être plus nombreuses), suggère 7 La Business Intelligence, en français informatique décisionnelle, désigne l’ensemble des technologies qui permettent de collecter les données d’une entreprise et de les analyser dans le but de servir de support à la prise de décisions et à l’élaboration de stratégies.

Page 12: Le CRM analytique Les outils d'analyse OLAP et le Data Mining

12

intuitivement les vastes possibilités offertes par un tel dispositif. A l’instar de l’image de droite qui montre comment on peut savoir le nombre de vidéo vendue en 2001 à Bern, les alternatives d’un tel modèle sont en réalité aussi nombreuses qu’il y a d’utilisateurs et de besoins spécifiques. Voyons pour illustrer cela les deux schémas suivants :

Schéma extrait du cours intitulé « Systèmes d’information de l’entreprise », dispensé par le Dr. Stefan

Huesemann à l’Université de Fribourg au semestre d’automne 2007-2008.

Le premier schéma décrit une fonction extrêmement intéressante qui permet de répondre de manière très flexible aux différentes questions que l’utilisateur peut se poser. En effet, à l’aide des dimensions, elles-mêmes constituées d’une hiérarchie d’attributs, il est possible de savoir combien de vidéos ont été vendues par jour, par mois ou encore par année en ajustant simplement la dimension en fonction des besoins. De la même manière, en centrant sa requête sur la dimension « lieu », on pourra déterminer combien de vidéos furent vendues dans un canton, dans une ville ou encore pour chaque magasin. Le second dessin, quant à lui, démontre lui aussi la richesse et la flexibilité qu’offrent un tel outil d’analyse. En effet, on constate que l’on peut également littéralement « couper le cube en tranches ». Le directeur financier cherchera à savoir combien de produits ont été vendus dans le monde pour une période précise. Le directeur régional des ventes quant à lui, cherchera à connaître le chiffre d’affaire total pour la zone dont il est responsable. Enfin, le chef de produit, s’intéressant à un produit spécifique, cherchera à connaître le nombre total des ventes dans le monde sans préciser une période particulière. 4.3 Exemples d’application des outils d’analyse OLAP Pour avoir une vision plus pragmatique de l’utilité des outils OLAP, exposons trois cas pratiques dans lesquels ils sont mis à contribution et à quoi ils peuvent concrètement servir. Pour ce faire, nous nous inspirerons en grande partie de l’article OLAP applications disponible gratuitement sur le site www.olapreport.com.

Page 13: Le CRM analytique Les outils d'analyse OLAP et le Data Mining

13

Le marketing de base de données est l’application des outils d’analyse OLAP, souvent combinés aux technologies de data mining, qui est la plus directement liée à la gestion de la relation client. En effet, il permet par exemple au professionnel de déterminer les meilleurs clients et de fidéliser ces derniers en leur proposant des offres promotionnelles. A l’inverse, l’utilisateur peut en profiter pour identifier « les mauvais clients » ou encore certains profils de clients auxquels une offre ne correspond pas, afin soit de réajuster celle-ci soit de l’abandonner. L’analyse des ventes est une autre des fonctions essentielles des outils OLAP. Ces derniers peuvent effectivement apporter des connaissances profitables pour les entreprises, en particulier dans l’industrie des biens de consommation et des services financiers ainsi que dans le commerce de détails. Le seul fait d’évoquer quelques-unes des questions auxquelles ces outils sont en mesure d’apporter une réponse décrit tout l’intérêt de ces derniers :

- Est-on en mesure d’atteindre nos objectifs de ventes par produit et par région dans une période donnée ?

- L’évolution des ventes d’un nouveau produit est-elle identique partout ? - Est-ce que les actions de promotions ont un effet sur les ventes ? - Etc.

L’analyse des « clic » de l’internaute sur un site Internet peut également être d’une très grande utilité, en particulier pour les entreprises consacrées au e-business. Pratiquement, les outils OLAP rendent possible par exemple la récolte de données démographiques, parfois personnelles, sur le client, l’identification du chemin par lequel il est arrivé sur le site de l’entreprise ou encore le calcul du nombre de « clics » que celui-ci a dû faire pour trouver sur le site Internet ce qu’il est venu y chercher. 5. Définition du data mining Le data mining signifie littéralement « fouille de données » ou « forage de données ». Ce procédé, basé sur une série d’algorithmes8 ou modèles de data mining que nous n’allons pas aborder dans ce travail, permet d’extraire des informations à partir de données, informations qui, grâce à l’analyse, se convertissent en connaissances. « Le data mining est l’analyse d’un ensemble d’observations qui a pour but de trouver des relations insoupçonnées et résumer les données d’une nouvelle manière, de façon qu’elles soient plus compréhensibles et utiles pour leurs détenteurs » (David Hand, 2001). Autrement dit, il consiste à analyser des informations collectées dans des entrepôts de données afin d’y détecter des relations qu’il serait a priori impossible d’identifier sans cet outil. C’est un élément essentiel dans la relation client et de système d’aide à la décision. Partant de là, on comprend mieux pourquoi le data mining est annoncé comme étant « un des développements technologiques les plus révolutionnaires des dix 8 Par exemple : les arbres de décisions, les réseaux de neurones, les réseaux de Kohonen ou encore les algorithmes de la méthode de classification hiérarchique. Voir les chapitres 5, 6, 7, 8 et 9 de « Des données à la Connaissance, une introduction au Data mining » de Daniel T. Larose.

Page 14: Le CRM analytique Les outils d'analyse OLAP et le Data Mining

14

prochaines décennies » selon le magasine en ligne ZDNET News. (Rachel Konrad, février 2001). En effet, cette technologie est perçue comme étant réellement indispensable de nos jours à l’analyse de la quantité toujours plus vaste d’informations produites par tous les systèmes d’information de l’entreprise. Enfin, comme nous l’avons dit, en tant que processus, il est pertinent de souligner ici que le data mining ne se réfère pas seulement à des outils et à une technologie informatique très développée. Effectivement, il faut également relever le rôle fondamental de l’humain dont l’implication se doit d’être totale dans chaque phase du processus. Il est erroné de penser que le data mining est une entité qui fonctionne de manière autonome. 5.1 Les facteurs de succès du data mining Lorsque nous passons à la caisse d’un supermarché, il est difficile de ne pas entendre les « bip, bip » des scanners lisant les codes barres sur les produits. Mais à quoi servent ces données enregistrées ? Chacune d’entre elles, c’est-à-dire chaque « bip » représente une nouvelle « observation », une nouvelle information concernant nos habitudes d’achat. Toutes ces informations sont collectées et stockées dans des bases de données destinées à l’analyse et vont permettre ensuite à l’entreprise d’identifier, par exemple, les mauvais clients ou alors, au contraire, de lancer une campagne de fidélisation en offrant des produits à ses meilleurs clients. A l’image des scanners des caisses qui enregistrent quotidiennement des milliers et des milliers de transactions, l’augmentation de la production de données représente un des facteurs déterminants de la montée en puissance du data mining. D’autres causes alimentent ce phénomène, comme par exemple, « la pression concurrentielle pour accroître la part de marché dans un marché mondialisé, le développement de logiciels de data mining prêts à l’emploi, l’énorme croissance de la puissance informatique et de la capacité de stockage » et, enfin, « le stockage des informations dans les entrepôts de données qui permettent à toute l’entreprise d’accéder à une base de données fiable ». (« Des données à la connaissance », 2005)

5.2 La préparation des données

Il est très important, avant toute opération de data mining, de procéder à un nettoyage des données se trouvant dans le data warehouse. Celles-ci ont besoin d’être préparées et transformées afin d’être exploitables pour le data mining.

En effet, les data warehouse contiennent très souvent des données incomplètes qui peuvent être :

- des champs obsolètes ou redondants - des valeurs aberrantes, - Des données manquantes, - Des valeurs dénuées de sens pour la logique,

Page 15: Le CRM analytique Les outils d'analyse OLAP et le Data Mining

15

- Des données sous une forme non adaptée au modèle de data mining.

Il est ainsi très important et même capital de minimiser les déchets afin d’optimiser au maximum le travail de data mining.

Ce travail de nettoyage est énorme et il représente à lui tout seul 60% du temps de travail lors du processus de data mining. (Selon Daorian Pyle dans son livre Data Preparation for Data Mining). 5.3 Les tâches effectuées par le data mining Après avoir défini ce qu’est le data mining, il convient de présenter les tâches que celui-ci peut effectuer. Ces dernières sont au nombre de six, chacune d’entre elles revêt une fonction spécifique pour l’analyse et est réalisée grâce à des algorithmes différents. Bien qu’on retrouve ces six alternatives dans toute la littérature sur le sujet, nous nous sommes à nouveau inspiré pour ce chapitre du livre « Des données à la connaissance » de Daniel T. Larose. 5.3.1. La description L’importance de cette tâche est de permettre à l’analyste d’interpréter les résultats d’un modèle de data mining, soit d’un algorithme, de manière la plus transparente et efficace possible. « Ainsi, les résultats du modèle de data mining doivent décrire des caractéristiques claires qui puissent amener à une interprétation et à une explication intuitive. Certaines méthodes de data mining sont plus adaptées que d’autres pour une interprétation transparente » (Daniel T. Larose, 2005) 5.3.2 L’estimation La variable cible9 est numérique. L’estimation permet par exemple d’estimer la somme d’argent qu’un couple va dépenser pour des produits solaires cet été ou encore d’estimer le nombre de buts que va marquer l’équipe de Suisse lors de l’Euro. On pourra également estimer le revenu d’une famille en fonction de divers critères (profession, catégorie de voiture...). L’intérêt principal de cette tâche est de pouvoir ordonner les résultats afin d’avoir la possibilité de retenir seulement les meilleurs valeurs, technique qui sera surtout utilisée en marketing dans le but de pouvoir proposer des offres aux meilleurs clients potentiels de l’entreprise.

9 On peut définir ici la variable cible comme étant celle que l’on cherche, à l’aide des modèles de data mining, à expliquer ou prédire la valeur.

Page 16: Le CRM analytique Les outils d'analyse OLAP et le Data Mining

16

5.3.3 La segmentation Ici, la variable cible n’est pas numérique, mais catégorielle, comme par exemple le revenu, qui peut être divisé en trois catégories : faible revenu, revenu moyen et revenu élevé. « La segmentation consiste à répartir les clients en groupes homogènes, qu’il convient ensuite d’aborder par des moyens spécifiques et adaptés aux caractéristiques et attentes de chaque groupe. Les membres d’un même groupe réagissent de la même manière aux stimuli marketing. Ils ont en commun un mode de communication, des comportements d’achat et/ou des besoins spécifiques » (Ed Peelen, 2006). 5.3.4 La classification La classification est différente de la segmentation en ce sens qu’il n’y a pas de variable cible pour segmenter. La classification va s’intéresser au regroupement de données ou d’observations en groupes d’objets similaires. En d’autres termes, elle va segmenter l’ensemble des données afin de former des sous-groupes homogènes. Ceux-ci s’appellent des clusters, à savoir des classes, qui sont des groupes dans lesquels les données sont similaires entre elles et, par définition différente des autres groupes. 5.3.5 La prévision Les résultats de la prévision portent, comme son nom l’indique, sur le futur, ce qui la différencie de l’estimation. Pour le reste, elle est similaire à ces deux tâches expliquées précédemment. La prévision permet par exemple de prévoir quels vont être les gagnants du championnat de basket-ball en tenant compte de la comparaison des résultats de chaque équipe ou encore de prévoir quel va être la taux de décroissance des décès sur la route l’année suivante en prenant compte de l’augmentation des limitations de vitesse et des mesures de réprimande plus strictes adoptées par la police en ce qui concerne l’alcool au volant. 5.3.6 L’association Cette fonction du data mining permet de découvrir quelles variables vont ensemble, quelles sont les règles qui vont permettre de quantifier les relations entre deux ou plusieurs variables. Par exemple, si l’on s’intéresse à 500 clients qui viennent faire leurs courses au supermarché le vendredi soir et que l’on constate que sur ces 500 clients, 100 achètent des fruits et que sur ce nombre, 30 achètent du lait, ainsi, la règle d’association est « si l’on achète des fruits, alors on achète du lait », avec une mesure de support de 100/500 = 20% et un seuil de confiance de 30/100 = 33%.

Page 17: Le CRM analytique Les outils d'analyse OLAP et le Data Mining

17

6. La Poste et le CRM Dans le cadre de ce travail de séminaire, il était demandé de réaliser une étude de terrain en collaboration avec une entreprise afin d’aborder la question de la gestion de la relation client de façon plus pragmatique. Pour ce faire, nous avons choisi de nous adresser à La Poste. Ce choix s’est fait relativement par hasard. En effet, en faisant quelques recherches sur Internet, nous sommes « tombés » sur plusieurs documents très intéressants et détaillés sur le marketing direct en général et le CRM en particulier. Après avoir lu les différents dossiers mis à disposition par la Poste sur leur site10, nous avons décidé d’écrire un mail à la société en demandant s’il serait possible d’obtenir un entretien avec la personne responsable du CRM au sein de l’entreprise. Très rapidement, Monsieur Peter Kohler, responsable de la gestion de la relation client au sein de la Poste, nous a répondu et proposé de nous rencontrer. Il est intéressant de relever que ce n’était pas la première fois que Monsieur Kohler présentait à des étudiants l’intérêt de la Poste pour le CRM. Son enthousiasme et notre intérêt pour le sujet nous ont mené dans un entretien réalisé en allemand de près de 3 heures. Monsieur Kohler nous a exposé la stratégie CRM de la Poste à l’aide d’une présentation PowerPoint, destinée a priori aux clients plutôt qu’à des étudiants. Pendant celle-ci, nous avons retenu plusieurs points importants sur lesquels nous allons revenir ici. 6.1 La fin annoncée d’un monopole Depuis le premier janvier 2004, PosteColis, c’est-à-dire l’envoi de paquets, évolue dans un environnement ouvert à la concurrence. En avril 2006, la limite du monopole pour les lettres est passée à cent grammes et va être baissée à cinquante grammes dès avril 2009. Nous constatons de ce fait que le monopole, détenu jusque –là par la Poste s’estompe petit à petit et qu’il va céder sa place à une ouverture totale du marché suisse des télécommunications en 2012. C’est dans cet environnement qu’est né l’intérêt de la Poste pour la gestion de la relation client et pour la solution CRM Siebel11. Sans entrer dans une définition des enjeux d’une telle libéralisation (cela pourrait faire l’objet d’un travail de séminaire à part entière), il est essentiel de comprendre que la Poste se doit, dans cette situation, de réorganiser en conséquence sa stratégie, son organisation et son offre, afin de faire face à la croissance exponentielle de la concurrence. Il s’agit désormais de considérer le client comme une ressource sans laquelle l’entreprise ne peut pas survivre. C’est dans ce contexte que le concept de la gestion de la relation client a pris toute son importance pour la Poste et qu’elle va devenir capitale au vu de la libéralisation du marché.

10 http://www.postmail.ch/fr/index_pm/pm-geschaeftskunden/pm-directpoint/pm-dm-wissen/pm-dm-publikationen/pm-directexpert.htm 11 Siebel est leader mondial sur le marché des solutions de CRM.

Page 18: Le CRM analytique Les outils d'analyse OLAP et le Data Mining

18

A l’image d’un des « slides » de la présentation de Monsieur Kohler, La Poste ne peut donc plus se contenter d’être un simple livreur de courrier. Avec les concurrents allemands ou français contre lesquels la Poste suisse ne pourra à terme pas lutter, Monsieur Kohler nous a expliqué que la nouvelle stratégie est dans un futur proche de se positionner sur des marchés de niche, en proposant des services personnalisés, de qualité supérieure. Du simple livreur, le but est de devenir un conseiller stratégique, qui anticipe les besoins de ses clients et leur propose des solutions adaptées, un partenaire disponible et compétent sur lequel le client pourra compter en tout temps. 6.2 L’importance de l’émotion dans la relation client L’aspect que nous allons aborder dans cette partie, sur lequel Monsieur Kohler s’est beaucoup attardé et qui nous a particulièrement marqué est l’importance donnée à la dimension sentimentale dans la gestion de la relation client. En effet, que ce soit le simple individu qui se rend à la Poste faire ses paiements ou l’entreprise, comme Nestlé, qui représente une manne financière primordiale, la Poste, par l’intermédiaire de notre interlocuteur, montre attacher beaucoup d’importance au développement d’une relation qui ne se limite pas seulement aux simples transactions mais qui, en plus, les « emballent dans un paquet » de sympathie et de confiance. A l’image de sa publicité institutionnelle réalisée pour l’année 2008, la Poste se positionne donc comme une entreprise proche et à l’écoute de ses clients et de ses besoins, comme en témoigne le slogan : « nous avons la Poste dans le sang ». Dans cette même idée, Monsieur Kohler nous a révélé les résultats d’une recherche, pas encore publiée, effectuée auprès de ses clients commerciaux, qui démontre que pour plus de 60% d’entre eux, l’avenir du CRM est dans le face-à-face et non, comme on pourrait le penser, dans l’informatique. 6.3 La qualité et la mise à jour constante des données

Page 19: Le CRM analytique Les outils d'analyse OLAP et le Data Mining

19

Un des points sur lesquels Monsieur Kohler a également beaucoup insisté sur l’investissement énorme que requièrent la récolte et surtout la mise à jour des données. Sans parler des conséquences que peuvent avoir des données incomplètes ou fausses dans le travail d’analyse par exemple, évoquer seulement la tâche énorme qui découle du seul fait d’avoir la bonne adresse de chaque client, qu’il soit privé ou commercial, donne une bonne idée de son ampleur. Si l’on s’intéresse aux clients privés dans un premier temps, nous avons été très surpris d’apprendre que 20% d’entre eux changent d’adresse chaque année. Sur 9.4 millions de clients (une personne peut avoir plusieurs adresses), l’investissement en temps et en argent que représente la mise à jour d’environ 1.9 millions d’adresses par année est considérable. Quant à la clientèle privée, et plus particulièrement les 500 « Top Kunden », qu’il s’agit de « soigner » tout particulièrement, il est également fondamental que toutes les adresses, ainsi que les personnes de référence soient correctes. En effet, si l’on prend l’exemple de Nestlé qui possède au moins 50 adresses rien qu’à Vevey, nous imaginons facilement le labeur lié au fait d’avoir, pour chaque département, l’adresse juste et surtout le nom de la bonne personne de contact. 6.4 Siebel et le CRM analytique, un exemple concret Pour des raisons de manque de temps et de connaissances sur les solutions CRM telles que Siebel, mais aussi à cause des limites liées à notre maîtrise relative de la langue allemande, nous ne nous sommes pas attardé avec Monsieur Kohler sur le fonctionnement et toutes les possibilités offertes par la solution CRM de la Poste. Nous avons cependant récoltés quelques informations pertinentes que nous allons évoquer ci-dessous. La Poste a décidé de travailler avec le software Siebel sous sa forme standard. C’était effectivement une décision stratégique que de ne pas investir plus que le prix du software, et de ne pas se lancer dans un processus de programmation qui aurait coûté encore bien plus de temps et d’argent. En s’intéressant plus particulièrement aux fonctions analytiques de ce software (basé sur un moteur OLAP et une architecture data mart), nous avons appris que, sous sa forme standard, il propose pas moins de 48 modèles d’analyse permettant notamment d’effectuer des segmentation de clientèle ou encore toute une série de mesures très pertinentes, dont nous allons présenter deux exemples. Avant cela, ajoutons encore que la Poste ne fait pas recours aux outils de data mining. Elle limite effectivement son travail d’analyse au potentiel de son système CRM. Le premier exemple est la découverte que plus de 80% du chiffre d’affaire est dû à seulement 500 clients (« Top Kunden »). La conséquence de cette observation fût immédiate. En effet, conscient de l’importance que représentaient ces 500 clients, la Poste a décidé de créer des équipes destinées exclusivement à la gestion de la relation avec ces clients privilégiés dont la perte d’un seul peut se révéler dangereuse pour l’entreprise dans sa globalité.

Page 20: Le CRM analytique Les outils d'analyse OLAP et le Data Mining

20

La seconde illustration de l’utilité d’un pareil système d’analyse pour la Poste s’est révélée en apprenant que seulement trois produits réalisaient 44% du chiffre d’affaire total et que 10 produits étaient garants du 83%. Ces connaissances ont eu pour effet d’augmenter d’une part la promotion de ces produits « phares », et d’autre part, d’en développer de nouveaux pour tenter de réduire les risques en diversifiant le portefeuille d’activité de l’entreprise.

Page 21: Le CRM analytique Les outils d'analyse OLAP et le Data Mining

21

Conclusion L’objectif de ce travail était de définir le CRM analytique et de comprendre ses enjeux en nous focalisant sur les outils d’analyse OLAP et le data mining. Nous avons réalisé au long de ce travail que le Customer Relationship Management est bien plus qu’une théorie sur la fidélisation du client. En effet, à l’instar du rôle fondamental qu’y joue l’informatique, le CRM est extrêmement complexe et difficile à définir. Malgré les difficultés rencontrées, nous sommes toutefois parvenu à décrire les principes fondamentaux de la gestion de la relation client en partant du sujet que nous avions choisi au départ. Nous avons défini le CRM et montré son importance de manière générale. Nous avons ensuite présenté les notions indispensables à la compréhension de la partie analytique du CRM pour enfin aboutir à un exemple concret dans le but de confronter la théorie à la pratique. Bien que nous ayons atteints la plupart de nos objectifs, nous avions le sentiment qu’à force de faire des recherches et de réfléchir sur le CRM, celui-ci nous paraissait toujours plus flou, vaste et difficile à saisir. En effet, les multiples manières d’aborder le CRM nous ont en quelques sortes empêchées d’en avoir une vision globale. Outre sa dimension informatique, son intérêt stratégique ou encore sa place dans l’évolution du marketing en général, c’est la culture d’entreprise que nous retenons comme étant l’élément central de la gestion de la relation client. Que ce soit au niveau de la communication à l’interne ou vers l’extérieur, le CRM est avant tout une philosophie qui doit permettre idéalement de redéfinir l’ensemble des processus et des valeurs de l’entreprise. Sans revenir sur le contenu de notre travail, nous tenons finalement à évoquer deux questions importantes qui apparaissent dans la littérature et qui nous ont hantées tout au long de nos recherches : le CRM analytique, défini comme étant fondamental en théorie, l’est-il réellement dans la pratique ? Est-ce que le CRM n’est-il pas un simple phénomène de mode promu par les sociétés désireuses de vendre leur solution informatique ?

Page 22: Le CRM analytique Les outils d'analyse OLAP et le Data Mining

22

Bibliographie Ed Peelen, Frédéric Jallat, Éric Stevens et Pierre Volle : Gestion de la relation client, 2ème édition, Pearson Education Benelux, Gap, 2006. Grenier, C. et Moine, C. : Construire le système d’information de l’entreprise, Editions Foucher, Paris, 2003. Line Lasserre et Bernard Legrand : CRM, les attentes des clients, Village Mondial Press, Paris, 2002. Pierre Morgat : Fidélisez vos clients, Stratégies, outils et GRC, Édition d’Organisation, Paris, 2000. Jean-Marc Lehu : La fidélisation client, Édition d’Organisation, Paris, 1999. Amrit Tiwana : Gestion des connaissances, Applications CRM et e-business, CampusPress, Paris, 2001. Daniel T.Larose, Des données à la connaissance, une introduction au data mining, Editions Vuibert Informatique, Paris, 2005. Stanley Brown, Customer Relationship Management, La gestion de la relation client, Pearson Education France, 2006. Pierre Mayor, CRM, Etude des besoins du segment de la clientèle d’affaires, The iimt University Press, Fribourg/Suisse, 2003. Articles scientifiques tiré d’internet Dominique Crié : De l’extraction des connaissances au Knowledge Management, Revue française de gestion 2003/5, n°145, p.59-79. Disponible :http://www.cairn.info/article_p.php?ID_ARTICLE=RFG_146_0059, accédé le 7 avril 2008. Jean-Fabrice Lebraty : Les systèmes décisionnels. Disponible : http://www.gestion-sic.net/documents/SAD.pdf, accédé le 7 avril 2008. Jiayi Yao, Yuying Zhang: The Designing of CRM Based on Data Warehouse. Disponible : http://www.china-review.org/news/manage/image/12-The%20Designing%20of%20ACRM%20Based%20on.pdf, accédé le 7 avril 2008. Michael J. Schroeck : Customer Analytics Making the Difference in CRM : Customer Analytics Amplify the value of integrated CRM Solutions. Disponible : http://www.dmreview.com/issues/20010901/3955-1.html, accédé le 8 avril 2008. Prof. Manole Velicanu, Ph. D. et Gh. Matei, Ph.D : Building a Data Warehouse step by step. Disponible : http://papers.ssrn.com/sol3/papers.cfm?abstract_id=1028461, accédé le 7 avril 2008.

Page 23: Le CRM analytique Les outils d'analyse OLAP et le Data Mining

23

Mihaela Muntean, Claudiu Brandas : Business Intelligence Support Systems and Infrastructure. Disponible : http://papers.ssrn.com/sol3/papers.cfm?abstract_id=1082465, accédé le 7 avril 2008. Eric Goldman : Data Mining and Attention Consumption. Disponible : http://papers.ssrn.com/sol3/papers.cfm?abstract_id=685241, accédé le 7 avril 2008. Gerrit H. van Bruggen and Berend Wierenga : When are CRM Systems Successful ? The Perspective of the User and of the Organization. Disponible : http://papers.ssrn.com/sol3/papers.cfm?abstract_id=828168, accédé le 7 avril 2008. René Lefébure, Gilles Venturi : Gestion de la relation client, édition 2005. Disponible : http://www.softcomputing.com/documents/pdf_generaux/gestion-relation-client-c13.pdf, accédé le 7 avril 2008. The OLAP Report : OLAP applications. Disponible : http://www.olapreport.com/Applications.htm, accédé le 13 avril 2008. Antoine Crochet-Damais, JDNet : OLAP pour Online Analytical Processing. Disponible : http://www.journaldunet.com/solutions/0301/030108_olap.shtml, accédé le 15 avril 2008. Georges El Helou et Charbel Abou Khalil : Data mining, Techniques d’extraction des connaissances. Disponible : http://www.lri.fr/~mdr/DataMining.Doc, accédé le 12 avril 2008. Stéphane Tufféry : Datamining et statistique décisionnelle, L’intelligence dans les bases de données, édition TECHNIP, 2005. Disponible : http://books.google.ch/books?isbn=2710808676, accédé le 12 avril 2008.