le datamining dans le business décisionnel

Upload: izelarab

Post on 30-May-2018

218 views

Category:

Documents


0 download

TRANSCRIPT

  • 8/14/2019 Le Datamining dans le business dcisionnel

    1/24

  • 8/14/2019 Le Datamining dans le business dcisionnel

    2/24

    Parmi les axes danalyses, on retrouve rgulirement le client, le centre de profit, les produits,

    ou le temps auxquels sont associs tout un ensemble de paramtres associs.

    Le DataMining prend une ampleur relle et stratgique par rapport un ensemble de facteurs

    convergents et notamment :

    1. Les progrs technologiques

    spectaculaires dans le domaine du DataMining, proprement dit.

    2. Linstallation de plus en plus rpandue

    des DataWarehouse ainsi que laugmentation exponentielle du nombre de

    donnes. De fait, on trouve dans le DataWarehouse de plus en plus de donnes

    aussi bien externes quinternes.

    3. Les volutions technologiques du

    hardware et du software soutiennent lorientation des possibilits danalyses

    performantes sur des volumes de donnes de plus en plus importantes.

    4. La maturit technologique et

    commerciale des outils OLAP (On-line Analytical Process) qui automatisent

    les reportings et facilite lanalyse des donnes multidimensionnelles.

    5. La gnralisation des besoins

    dintelligence mtier pour les diffrents niveaux dutilisateurs.

    6. Le besoin de rapprocher des sources de

    donnes htrognes nombreuses pour analyser une problmatique de

    lentreprise.

    De plus, il y a de toute vidence un effet marketing dans le dveloppement des outils du

    DataMining, mais il est associ un effet tangible qui est une synthse :

    de la chronologiedes concepts dcisionnels, cest--dire, il fallait que lacollecte des donnes soit matrise, que laccs aux donnes soit facilit et enfin que le DataWarehouse se positionnepour que le DataMining commence simposer.

    de lvolution technologique et des cots qui font quon peut envisager de mettre en place aujourdhui un projetDataMining un cot intressant.

    de laspect OLAP, la base multidimensionnelle qui a permis lutilisateur de se familiariser dans lexploration etlutilisation des donnes dcisionnelles sous un format multidimensionnel.

    de la maturit des algorithmes de DataMining qui ont acquis une fiabilit et une diversit qui justifient une rellevaleur ajoute par rapport aux anciennes mthodes statistiques.

    En rsum, la prsence concrte du DataMining actuellement est due la conjonction dune

    maturit technologie, dune prsence des systmes stabiliss qui rpondent une maturit et

    une curiosit de la part des utilisateurs.

    2/ Qu'est ce que le DataMining ?

  • 8/14/2019 Le Datamining dans le business dcisionnel

    3/24

    Le DataMining dans son sens le plus large veut dire la recherche des liens schmatiques

    dans une base dinformations volumineuse ou complexe dans le but de les transformer en

    connaissance.

    Ce que lon dsigne comme outils du DataMining dans cette tude sera plus prcisment des

    outils automatiss du DataMining, cest--dire, la dcouverte de la connaissance en utilisantune combinaison des techniques inspires des statistiques traditionnelles, de lintelligence

    artificielle et des graphiques.

    Le DataMining sassimile ainsi une recherche perptuelle des schmas utiles dans les

    donnes.

    Cette recherche peut tre automatise ou guide manuellement. Linconvnient dun systme

    guid manuellement (OLAP, outils de Reporting & de Query) est que lutilisateur doit crer

    lui-mme les types de schmas utiliser et il se peut que dans la foule, il ne saperoive pas

    ou nglige des schmas moins vidents.

    Le DataMining est une mthode de recherche automatise dans la mesure o mme si

    lutilisateur doit fournir une certaine quantit de donnes au systme, il ne les orchestre pas

    lui-mme pour trouver les schmas exploitables.

    Le DataMining permet de donner un sens aux informations dont dispose lentreprise. Cet outil

    relve essentiellement de la smantique.

    Le DataMining a vu le jour dans les annes 80, quand les professionnels ont commenc se

    soucier des grands volumes de donnes informatiques inutilisables tels quels par les

    entreprises.

    Le DataMining d'alors consistait essentiellement extraire de l'information de gigantesques

    bases de donnes de la manire la plus automatise possible; contrairement aujourd'hui o le

    DataMining consiste l'analyse qui suit l'extraction des donnes. Le dataMining s'est donc

    dissoc du Datawarehouse.

    3/ Les objectifs du DataMining

    Dans un premier temps, les entreprises ont t appeles constituer des bases oprationnelles

    pour permettre de rcuprer des donnes.

    Dans un deuxime temps, les entreprises ont essay de valider ces donnes par des outils de

    pilotage comme lEIS et le DataWarehouse. Elles se sont mises transformer des donnes en

    informations afin de prendre une dcision.

    Cest ainsi quon a pu dcouvrir lmergence du systme dcisionnel.

    A ce stade du processus, lutilisateur est amen donner une "intelligence" linformation,

    par consquent, la problmatique nest plus seulement daccder linformation mais de faire

    en sorte que cette information soit interprte selon des rgles de statistique ou dintelligence

    artificielle pour lui donner toute sa valeur.

    Les principales actions du DataMining sont :

  • 8/14/2019 Le Datamining dans le business dcisionnel

    4/24

    3.1 EXPLIQUER un vnement ou un incidentindiscernable

    Par la consultation des donnes grce des outils de tableaux de bord papier ou lectronique,

    on peut etre en mesure de formuler la question suivante :

    Comment se fait-il que lon perd des clients sur tel segment dans telle rgion ?

    En scrutant les donnes automatiquement loutil de DataMining va essayer de trouver un

    certain nombre dexplications cette question en se basant sur des donnes connectes ou des

    mises en signification de paramtres lis.

    Le DataMining va aider trouver des hypothses dexplications.

    3.2 CONFIRMER : un comportement ou une hypothse

    Par la consultation des donnes grce des outils de tableaux de bord papier ou lectronique,

    on peut tre en mesure de formuler la question suivante :

    Comment se fait-il que nous perdons des clients sur tel segment dans telle rgion ?

    Toujours par la consultation, on essai de trouver un certain nombre dexplications cette

    question en se basant sur des donnes connectes ou des mises en signification de paramtreslis.

    En appliquant des mthodes statistiques ou dintelligence artificielle, le DataMining va

    aider valider les hypothses dexplications que nous avons dcouvertes.

    3.3 EXPLORER : les donnes pour dcouvrir un lien"inconnu" jusqu l.

    Il ny a pas dide sur une hypothse ou sur un fait prcis. Par consquent, on demande au

    systme de proposer des associations ou des corrlations qui pourraient aider dcouvrir des

    vnements marquants puis dcouvrir des lments dexplication.

    Il serait certainement exagr de croire quun tat de technologie puisse remplacer la

    rflexion; par contre, linformatique dcisionnelle par le biais du DataMining peut tout fait

    suggrer des associations et des corrlations entre les donnes afin didentifier des hypothses

    et faire des propositions mais il reste toujours lhomme-utilisateur de les vrifier et de les

    valider dfinitivement.

  • 8/14/2019 Le Datamining dans le business dcisionnel

    5/24

    LE SCHEMA DU

    DATAMINING

    La connaissance peut se dfinir comme une information enrichie dun contexte et dun savoir

    faire.

    Les donnes :les donnes sont des donnes brutes provenant des bases de donnes diffrentes comme celles de lacomptabilit, des ventes, dachats ou autres.

    Les informations :

    X a un revenu suprieur 200KF

    X & Y vivent dans les banlieues A & B

    La connaissance :

    si S a un ordinateur, S est

    abonn la revue J

    le produit B est achet par des gens qui achtent

    les produits E

  • 8/14/2019 Le Datamining dans le business dcisionnel

    6/24

    La dcision :

  • 8/14/2019 Le Datamining dans le business dcisionnel

    7/24

    Bien videmment, lhomognit de la problmatique permet de mieux segmenter le

    rfrentiel et dobtenir un systme plus performant.

    Pour cela, le DataMining va se baser sur la typologie de la question voque et dans cette

    perspective, fournir larchitecte du systme des lments pour son analyse de la structure de

    la base de donnes. Le rle de larchitecte du systme consiste alors intgrer les hypothsesafin de proposer le modle de donnes le plus performant en terme de rduction de volumes et

    de temps daccs aux donnes.

    Aprs ce premier niveau de manipulation (par exemple une segmentation gographique

    ralise partir dune notion dadresse), On constitue un DataWarehouse et on est en mesure

    de raliser des agrgats plus sophistiqus et plus cibls lintrieur d environnements

    relationnels ou multidimensionnels.

    Ainsi, seront constitus les datamarts qui peuvent tre de type OLAP si la base

    multidimensionnelle permet de faciliter la manipulation des agrgats et des modles

    constitus.

    De fait, dans lutilisation du terme DataMining cohabitent deux concepts qui ne se situent

    pas au mme niveau de la chane du systme dinformations. Dans le schma du

    DataWarehouse, lun se trouve trs en amont et lautre se trouve trs en aval.

    Dans sa version oriente utilisateur final, le deuxime concept, le DataMining va permettre de

    travailler des donnes prsentes dans lenvironnement relationnel aussi bien que

    multidimensionnel de type OLAP.

    A ce niveau, les informations sont passes par le filtre du DataWarehouse et ont pu tre

    enrichies ou orientes lors de leur passage dans les datamarts.

    Le travail de loutil DataMining est ainsi facilit ou orient par ce premier niveau de

    qualification.

    En fait, il est aussi intressant daller chercher des hypothses ou dexpliquer des phnomnes

    sur des donnes agrges que de poser des questions sur des donnes plus brutes du

    DataWarehouse.

    Dans le schma de linformatique dcisionnelle, les diffrentes technologies cohabitent en

    remplissant une segmentation de fonction. Le DataMining, simpose aujourdhui comme undes segments stratgiques dans le schma dcisionnel dans la catgorie des outils qui

    apportent une valeur ajoute linformation.

    5/ Les differents modules

    Le DataMining utilise la technique de la modlisation pour faire des dcouvertes ou des

    prvisions.

    La modlisation comme son nom lindique est le fait de crer un modle partir des situationsconnues dans le but de lappliquer des situations inconnues. Par consquent, le processus de

    la cration dun modle partir du balayage et du filtrage des donnes est une tapeprimordiale.

  • 8/14/2019 Le Datamining dans le business dcisionnel

    8/24

    Selon le domaine dapplication, loutil DataMining est en mesure de proposer une technique

    diffrente correspondant des algorithmes et une mthode dapproche des donnes adquates.

    Ainsi, le DataMining va rpondre des problmatiques de :

    5.1 Segmentation

    La segmentation permet de fragmenter la base de donnes en segments ayant descaractristiques similaires.

    Il sagit ici de dfinir des caractristiques prototypes qui ont des comportements homognes.

    5.2 Classification

    Ce module est caractristique du DataMining amont. Il se propose de caractriser des groupes

    de populations homognes en rapprochant des paramtres possds par chacun des membres.

    Ainsi, la classification permet de dvelopper des profils de groupe partir des critres des

    enregistrements.

    5.3 Prvision

    La prvision permet de mesurer linfluence d'un paramtre prsent dans une population sur

    lensemble des autres paramtres de cette population.

  • 8/14/2019 Le Datamining dans le business dcisionnel

    9/24

    Ce module partant des informations agrges se situerait plutt sur la partie aval du schma

    dcisionnel.

    5.4 Association

    Lassociation permet danalyser la prsence simultane de valeur de paramtres sur un mme

    critre ou sur deux paramtres diffrents.

    A lintrieur dun mme critre qui peut avoir plusieurs occurrences pour un membre donn

    ou entre deux paramtres, cela peut permettre de constater des liens entre des valeurs

    possibles (rappel : critre = paramtre).

    5.5Modle Squentiel

    Le modle squentiel induit des dcouvertes lies laxe temporel.

    Il permet de trouver des modles de comportement qui prsupposent des enchanements

    systmatiques qui suivront sur une priode de temps.

    5.6 Exemple

    Pour concrtiser les notions dcrites par ces modules, on peut effectuer un exemple simplifi

    dune population qualifier par rapport un acte dachat d'une voiture haut de gamme dans

    les six mois venir.

    Les membres de cette population ont des revenus quil conviendra de segmenter pour obtenir

    une nomenclature significative et pertinente, cest dire ni trop dilue (trop de segments) ni

    trop rduite (pas assez de dtail).

    On obtient ainsi des tranches de revenus et lon va devoir connecter cet lment avec dautres

    lments intressants par rapport la cible recherche.

    Aprs avoir segment les paramtres, afin de prciser la population type par rapport

    lobjectif recherch, on classifie les membres de la population pour dterminer une classe de

    membre ayant par exemple un type de revenus donn, une voiture moyenne ou haut de

    gamme, propritaire de leur logement, ayant une carte de crdit "premier", etc...

    Lensemble des critres choisis permet de caractriser une population homogne sur laquelle

    on a pu vrifier certains liens entre paramtres. Par exemple, une prvision de probabilit

    dachat de vhicule neuf dcrot selon la rcence de la date dachat du logement.

    On va donc affiner notre population en la limitant aux personnes ayant acquis leur logementprincipal depuis plus de trois ans.

  • 8/14/2019 Le Datamining dans le business dcisionnel

    10/24

    Par ailleurs, toujours avec la volont daffiner, on remarque grce loutil que lachat de

    prestation dhtellerie haut de gamme tait associ souvent lachat de voiture haut de

    gamme.

    Ainsi on peut rajouter ce critre la dfinition de la population et rduire ainsi le primtre

    des personnes potentielles.

    Enfin, en analysant les modles squentiels de comportements dachat de voitures, on peut

    remarqu grce loutil, une tendance racheter un vhicule neuf de gamme suprieure tous

    les deux ans environ ou un achat de vhicule neuf ou doccasion de gamme identique au bout

    de trois quatre ans environ.

    On peut ainsi se concentrer sur les possesseurs de vhicules depuis deux trois ans maximum.

    6/ La methodologie

    6.1Mthodologie dexploitation

    La mthodologie de mise en uvre du DataMining peut tre dfinie en quatre phases

    principales.

    6.1.1Pr-tude thmatique

    Avant de slectionner les donnes il est primordial de dfinir les typologies dobjectifs et le

    cadre mthodologique dans lequel la dmarche DataMining peut amener une valeur ajoute.

    Au mme titre, il conviendra de commencer une phase de sensibilisation et dimplication desgroupes dutilisateurs potentiels et notamment parmi ceux de la direction gnrale.

    Ayant dfini les diffrents cadres de projet susceptible de correspondre, il convient par la suite

    de dterminer les sources et les types de donnes disponibles. Ces donnes internes ou externe

    lentreprise , doivent converger vers une zone de stockage de type datawarehouse, mme

    de garantir lhomognit, la qualit, lunicit, la lablisation, de linformation

    Il est indispensable de rendre les donnes recueillies le plus homogne possible afin dviter

    la prolifration des dfinitions pour un seul terme ainsi que la surcharge dinformations

    inutiles.

    Par exemple, la notion de client est typiquement difficile dfinir quand elle implique

    diffrents services de lentreprise.

    A la fin de cette tape lentreprise obtient un ensemble de projets sappuyant chacun sur une

    base de donnes structure, volumineuses mais identifie.

    6.1.2Analyse de la structure des donnes

    Lobjectif de cette phase est doptimiser la structure de la base de donne.

  • 8/14/2019 Le Datamining dans le business dcisionnel

    11/24

    Il est possible de rduire le volume

    dinformations en diminuant dune

    faon pertinente les attributs

    concernant ces informations et en

    nettoyant la base de donnes.

    Ce travail en profondeur sur les

    informations reprsente un passage

    oblig. Il implique des comptences

    "mtier" et des comptences

    "DataMining" qui seront

    dterminantes pour la qualit des

    donnes. La qualit de lanalyse

    dpend de la qualit des donnes.

    6.1.3Choix dun outil

    Il est ncessaire de bien connatre les objectifs et la nature des analyses attendues afin de

    dterminer larchitecture technique et les plates-formes outils impliques dans le processus de

    DataMining.

    Il est galement primordial de dterminer les profils des utilisateurs concerns afin de

    comprendre leur capacit apprhender un outil ou une technologie plutt quune autre.

    Il existe actuellement sur le march franais un certain nombre doutils de DataMining. Les

    principaux sont cits dans les fiches dditeurs se trouvant la fin de cet ouvrage.

    Certains outils de DataMining sont englobs dans dautres outils dcisionnels tels que des

    requteurs ou des EIS.

    Ainsi dans le choix de loutil interviendront plusieurs critres tels que :

    la technologie

    les types dutilisateurs

    les sources de donnes

    les typologies danalyse

    le mtier

    ....

    6.1.4Mise en uvre de loutil choisi

    La mthodologie dexploitation de loutil DataMining peut se dfinir en huit tapes comme

    dcrit ci dessous :

  • 8/14/2019 Le Datamining dans le business dcisionnel

    12/24

    Lune des caractristiques principales de la mthodologie du DataMining sappuie surle fait quelle est itrative et quelle permet de rcuprer les informations obtenues afin de les intgrer dans le systmedcisionnel de lentreprise.

    7/ Les techniques

    Derrire la terminologie du DataMining se positionnent des outils bass sur des techniques

    diffrentes.

    Dcouverte de rgles

    Arbres de dcision

    Signal Processing

    Fractales

    Rseaux neuronaux

    Hybride

    7.1Dcouverte de rglesValider ou proposer un schma de fonctionnement des donnes partir de rgles connues ou inconnues.

    Cette technique consiste demander au systme daller chercher dans les donnes une

    validation dune rgle connue ou de dcouvrir lui-mme une rgle. On essais ici de construire

    une logique procdurale dans les donnes.

    7.2Arbres de dcision

    Dterminer les critres significatifs dans un arbre de paramtres selon les poids statistiques

    des valeurs constates.

  • 8/14/2019 Le Datamining dans le business dcisionnel

    13/24

    Cette technique consiste formaliser un arbre qui va procder une analyse critre par

    critre.

    Loutil DataMining va scanner diffrents critres possibles afin dessayer dy retrouver des

    propositions en arbre daprs les poids statistiques qui auront un sens et qui permettront

    ensuite de trouver des liens entre les chemins qui ont une signification par rapport laproblmatique donne.

    7.3Signal Processing

    Filtrer les donnes afin de mettre en vidence des comportements de donnes.

    Cette technique consiste positionner les donnes et les filtrer travers une hypothse pour

    essayer de faire apparatre un lien entre ces donnes.

    7.4Fractales

    Composer des segmentations partir de modles mathmatiques bass sur des regroupements

    irrguliers de donnes.

    7.5Rseaux neuronaux

    Utiliser des technologies dintelligence artificielle afin de dcouvrir par lapprentissage du

    moteur des liens non procduraux.

    Ces deux dernires techniques sappuient sur des algorithmes mathmatiques (Fractales) et

    dintelligence artificielle (Rseaux neuronaux) et tentent travers des mthodes

    dapprentissage de constituer des logiques non procdurales.

    8/ Les outils du DataMining

    Editeur

    Outil

    Technique utilise

    Angoss

    Knowledgeseeker Arbres de dcision

    Business Forecast

    Systems

    Forecast Pro Prvision

    Cross/Z International F-DBMS Fractales

  • 8/14/2019 Le Datamining dans le business dcisionnel

    14/24

    Inc.

    Datamind

    Datamind Dtection de modles,

    prdictions, hybride

    IBM

    Intelligent Miner Prvision

    Information Discovery

    IDIS Dcouverte de rgles

    Integrated Solutions

    Ltd.

    Clmentine Arbres de dcision,

    Rseaux neuronaux

    Isoft

    Alice Arbres de dcision

    MIT GMbH

    Data Engine Signal Processing

    Netral

    Neuro One Rseaux neuronaux

    NeuralWare

    Predict Rseaux neuronaux

    PMSI

    Saxon Rseaux neuronaux

    RIS

    4Thought Rseaux neuronaux

    SAS Institute

    SAS System Statistiques, arbres de

    dcision, rseaux

    neuronaux

    Silicon Graphics

    Mine Set Arbres de dcision,

    dcouverte de rgles

    SLP Infoware

    STATlab Statistiques

    SPSS

    Neural Connection

    SPSS Chaid

    Rseaux neuronaux

    Arbres de dcision

    9/ Les diverses applications

    Depuis lapparition du concept de DataMining, il existe une tendance lassocier

    exclusivement aux domaines du marketing et de la grande distribution.

    Il est certain que le DataMining reprsente un outil "exceptionnel" pour les directionsmarketing, mais de nombreuses autres fonctions de lentreprise peuvent tre concernes.

  • 8/14/2019 Le Datamining dans le business dcisionnel

    15/24

    Afin de mieux comprendre les liens et les corrlations caches quun outil de DataMining

    peut dnicher, voici quelques exemples concrets dinformations provenant de lutilisation de

    cette famille doutils.

    9.1Par fonctionMarketing:

    Comportement des consommateurs : dcouverte de comportements dachats coupls dans le cadre dune

    politique promotionnelle. Cela a permis un accroissement de la rentabilit des politiques promotionnelles dune chanede magasins.

    Marketing direct: augmentation du taux de retour des mailings (75 80%) grce un meilleur ciblage des envois.

    Fidlisation de la clientle : une banque a trouv des relations et des comportements inconnus jusqualors en

    vrifiant lactivit des comptes clients. Cela lui a permis de dfinir une nouvelle cible marketing et de la fidliser pardes moyens plus appropris son comportement.

    Segmentation de clientle : dcouverte dune niche de petite taille dont le revenu est trs lev, inconnue par le

    service marketing.

    Optimisation dun rseau dagence grce la dcouverte des couples cible/produit et produit/march.

    Ressources humaines:

    Politique dacceptation et de rejet des candidatures

    Politique dvolution des carrires

    Ventes:

    Prvision des ventes

    Dcouverte de cycles de ventes

    Qualit:

    Analyse de satisfaction des clients

    Typologie des clients

    Dtection des fraudes

    Pricing:

    Dtermination des prix par rapport des catgories et des comportements dachat.

  • 8/14/2019 Le Datamining dans le business dcisionnel

    16/24

    etc... :

    Analyse financire, Gestion des stocks, Logistique, etc..

    9.2 Par Secteur

    Les secteurs dactivit dans lesquels le DataMining est dj prsent sont de plus en plus

    nombreux.

    Aprs la grande distribution aux Etats-Unis, cible historique, le DataMining est apparu dans

    dautres secteurs tels que :

    Transport : pour rduire lover-booking qui cotait trs cher aux entreprises.

    Sant

    Assurance

    Tlcommunications

    Gouvernement : Trsor amricain.

    Banque : American Express - pour rduire le nombre de rsiliations des cartes

    de crdit.

    Electronique : pour cibler les garanties des appareils.

    Automobile : pour dterminer le niveau de fabrication qui provoque le plus de pannes.

    Electricit

    9.3Par Utilisateur

    Aujourdhui le DataMining est utilis par des personnes ayant un profil et des exigences bien

    particulires. Nous les avons classs en quatre groupes distincts :

    Lutilisateur final = est lutilisateur qui ne connat pas la technologie duDataMining et ne veut surtout pas y tre confront. Il est en gnral protg par des crans "presse-boutons". Ildemande loutil de DataMining de lui apporter des solutions ses problmes particuliers.

    Le statisticien = est lutilisateur qui est passionn par la technique et souhaite y treconfront. Il demande loutil de DataMining dtre "puissant" et riche en fonctionnalits.

    Le business analyste = est lutilisateur le plus hybride car il connat un peula technique et trs bien son mtier. Il demande loutil de DataMining dtre facile utiliser tout en lui laissantquelques choix technologiques.

    Le scientifique = est lutilisateur le plus difficile satisfaire car il a toujours une longueurdavance par rapport la technique. Cest le scientifique qui permet aux outils de DataMining dvoluer.

    10/ Fiches diteurs

  • 8/14/2019 Le Datamining dans le business dcisionnel

    17/24

    Les diteurs cits sont les principaux acteurs du DataMining prsents sur le march franais.

    Ce mmoire est un aspect volutif par rapport aux diteurs.

    En effet, le march du DataMining est en pleine croissance et de nombreux acteurs du march

    amricain vont sans doute arriver en France.

    Par consquent, il ne sera pas possible de pouvoir tous les cits.

    10.1 ANGOSS

    IDENTITE SOCIETE :

    ANGOSS SOFTWARE

    66, rueEscudier

    92100 Boulogne

    PRINCIPAUX OUTILS DE LEDITEUR :

    - Knowledge seecker

    10.2 DATA MIND

    IDENTITE SOCIETE :

    DATAMIND France S.A.

    31, rue du Pontjkh

    92200 Neuilly-Sur-Seine

    PRINCIPAUX OUTILS DE LEDITEUR :

    - DataMind Professional Edition (version monoposte Windows)

    - DataMind Data Cruncher TM (version serveur Unix, NT)

    DOMAINES DAPPLICATION :

    - Marketing

    - Commercial

    - Production/Qualit

    - Ressources Humaines

  • 8/14/2019 Le Datamining dans le business dcisionnel

    18/24

    - Contrle de gestion

    - SAV

    TECHNOLOGIES ASSOCIEES :

    Extraction faite partir des bases relationnelles, des bases multidimensionnelles et des

    fichiers plats.

    10.3 HOLISTIC

    IDENTITE SOCIETE :

    HOLISTIC FRANCE

    31, bld de la Paix

    78200 Saint-Germain-en-Laye

    PRINCIPAUX OUTILS DE LEDITEUR :

    - Holos

    10.4 IBM

    IDENTITE SOCIETE :

    IBM FRANCE

    Tour Descartes - La Dfense 5

    2, avenue Gambetta

    Courbevoie

    Hauts de Seine.

    PRINCIPAUX OUTILS DE LEDITEUR :

    - Intelligent Miner (S/390, RS/600, AS/400)

    DOMAINES DAPPLICATION :

    - Marketing- Vente

    TECHNOLOGIES ASSOCIEES :

    Extraction faite partir des bases relationnelles et des fichiers plat.

  • 8/14/2019 Le Datamining dans le business dcisionnel

    19/24

    10.5 ISOFT

    IDENTITE SOCIETE :

    ISOFT SA / ALICE SA

    Chemin de Moulon

    91190 Gif-sur-Yvette

    PRINCIPAUX OUTILS DE LEDITEUR :

    - ALICE (Version standard & Windows 3.11, Windows 95/NT)- AC2 (Windows 16 et 32 bits, Unix)

    DOMAINES DAPPLICATION :

    - Marketing commercial

    - Marketing direct

    - Finance (Analyse et risque)

    - Etude et sondage

    - Ressources humaines

    - Etude clinique (sant)

    TECHNOLOGIES ASSOCIEES :

    Extraction faite partir des bases relationnelles, des bases multidimensionnelles et des tableurs.

    10.6 PILOT

    IDENTITE SOCIETE :

    PILOT SOFTWARE

    101-109, rue Jean Jaurs

    92300 Levallois-Perret

    PRINCIPAUX OUTILS DE LEDITEUR :

    - Pilot discovery server

    DOMAINES DAPPLICATION :

    - Marketing

  • 8/14/2019 Le Datamining dans le business dcisionnel

    20/24

    TECHNOLOGIES ASSOCIEES :

    Extraction faite partir des bases relationnelles

    10.7 SAS Institute

    IDENTITE SOCIETE :

    SAS INSTITUTE

    BP 5

    77166 Evry Gregy

    DOMAINES DAPPLICATION :

    - Marketing

    - Marketing direct

    - Scoring

    - Analyse comportementale

    - Ressources humaines

    - Etude clinique (sant)

    TECHNOLOGIES ASSOCIEES :

    Extraction faite partir des bases relationnelles, des bases multidimensionnelle SAS, des fichiers plat, des feuilles decalcul et des progiciels.

    10.8 Silicon Graphics

    IDENTITE SOCIETE :

    SILICON GRAPHICS

    21, rue Albert Calmette

    78350 Jouy-en-Josas

    PRINCIPAUX OUTILS DE LEDITEUR :

    - Logiciel MINESET

    TECHNOLOGIES ASSOCIEES :

  • 8/14/2019 Le Datamining dans le business dcisionnel

    21/24

    Extraction faite partir des bases relationnelles

    10.9 SLP INFOWARE

    IDENTITE SOCIETE :

    SLP Infoware

    51, rue Ledru Rollin

    94853 Ivry-sur-Seine Cedex

    PRINCIPAUX OUTILS DE LEDITEUR :

    - STATlab : Analyse exploratoire

    - DATAboard : Gnrateur de tableaux de bord et de rapports- DATAMAN : Datamart multidimensionnelle

    DOMAINES DAPPLICATION :

    - Marketing

    - Commercial

    - Qualit de service

    - Ressources humaines

    - Contrle de gestion

    - Etudes

    TECHNOLOGIES ASSOCIEES :

    Extraction des donnes faites partir des bases relationnelles, des tableurs, des fichiers statistiques et des progiciels.

    11/ Glossaire

    11.1 Agents intelligents.Les agents intelligents sont des programmes d'exploration de rseaux dans le but d'analyser et d'en extraire de l'information.On peut les diviser en deux groupes principaux :

    Les agents de recherche dinformation peuvent apporter des lments de rponse la question pose par unutilisateur, dans un langage plus ou moins proche du langage naturel, en explorant rapidement des volumesimportants dinformations et en triant celles qui ont un rapport avec la question de lutilisateur. Citons lexemple de laquestion suivante laquelle ils peuvent apporter une aide prcieuse : "Quelles sont les agences de la rgion Ouest ola vente de placements financiers est suprieure la moyenne franaise ?"

    Les agents de traitement peuvent tre programms par lutilisateur ou ladministrateur pour effectuer intervallesrguliers des tches de recherche, de mise jour de bases, dextraction ou de traitement. Par exemple : lelancement durant la nuit de requtes personnalises pour chaque responsable dagence bancaire, lalimentation duncube multidimensionnel de ces donnes et ldition dun tableau de bord quotidien sur limprimante de lutilisateur.

  • 8/14/2019 Le Datamining dans le business dcisionnel

    22/24

    11.2 Base de donnes

    La base de donnes o sont stockes les informations extraites des bases de production est le

    composant principal du DataWarehouse.

    On peut y retrouver des diffrents fichiers concernant les clients ainsi que des " tiquettes" quiindiquent les liens entre les diverses donnes -client/article ou client/facture, par exemple.

    La cration de ces nombreux index ncessite un volume de stockage important, par

    consquent, une base de donnes DataWarehouse ou "entrept de donnes" peut atteindre des

    tailles considrables, savoir, plusieurs Gigaoctets ou mme des Teraoctets de donnes .

    Les bases de donnes peuvent tre de diffrentes types :

    - hirarchiques.

    - relationnelles (stockage des donnes sous forme de tables).

    - multimdia (stockage non seulement des donnes mais aussi des images et des sons).

    - orientes objets.

    -multidimensionnelles (stockage/rangement des donnes en plusieurs "dimensions" que

    l'utilisateur peut croiser sa convenance pour rpondre la question pose).

    11.3 Base de donnes mutlidimensionnelles

    Une base de donnes multidimensionnelle est une base dont les donnes sont stockes de

    manire optimiser le croisement entre les donnes.

    La base multidimensionnelle est reprsente par un cube en 3D bien quelle ne soit pas limite

    aux trois dimensions. En effet, elle peut grer jusqu quinze ou vingt dimensions la fois.

    Seul inconvnient, laugmentation des dimensions fait accrotre galement le nombre des

    croisements entre les donnes et ceci ralentit considrablement les temps de rponse.

    11.4 Base de donnes relationnelles

    La base de donnes relationnelle, modle de stockage le plus utilis en informatique, prsente

    une organisation de linformation sous forme de tables.

    11.5 Base de production

    Dans un environnement DataWarehouse, on appelle frquemment bases de production, ou

    encore systmes oprants, les bases de donnes utilises par les applications non

    dcisionnelles de lentreprise.

    Dans cette catgorie, entrent les systmes comptables, les bases de gestion commerciale, les

    systmes de paie, les bases de gestion de production industrielle....

  • 8/14/2019 Le Datamining dans le business dcisionnel

    23/24

    11.6 Business intelligence

    Ce terme, cre par le Gartner Group, regroupe les requteurs, les outils danalyse

    multidimensionnels dont la base est stocke en local, ainsi que certains outils de DataMining -

    des outils de bureautique destins un oprationnel par opposition un informaticien.

    11.7 Data Marts

    Le Datamart est un sous ensemble du DataWarehouse. Il contient les donnes de lentreprise,

    lis un mtier tels que le marketing ou la comptabilit, par exemple.

    Il peut contenir des donnes provenant des divers domaines de lentreprise linverse de la

    base de production. Il maintient le lien avec lentrept de donnes et le dictionnaire,

    permettant ainsi de retrouver lorigine dune information.

    11.8 DataMiningLes outils dits de DataMining, traduisible par "forage des donnes", ou "prospection des donnes", permettent de slectionner, la place de lutilisateur un certain nombre de donnes.

    Les diffrentes techniques utilises dans les outils de DataMining sont les suivantes :- Dcouverte des rgles- Arbres de dcision- Signal Processing- Fractales- Rseaux neuronaux- Hybride

    11.9 DataWareHouse

    Le DataWarehouse ou l entrept de donnes a deux dsignations :

    - la base dans laquelle sont stockes lensemble des informations

    - lensemble du systme dinformation dcisionnel.

    11.10 EISUn EIS (Executive Information System) est un outil qui permet de visualiser des donnes de

    lentreprise sous forme de tableaux de bord prablement conus. A la diffrence dun SIAD, il

    ne permet pas de poser une question qui naurait pas t prvue initialement.

    11.11 Mta-donnes.Les mta-donnes sont les donnes sur les donnes, cest--dire, lensemble des informations qui vont qualifier une donne.

  • 8/14/2019 Le Datamining dans le business dcisionnel

    24/24

    11.12 OLAP

    Le systme OLAP (On-Line Analytical Processing) Processing) est une architecture qui

    privligie lanalyse multidimensionnelle li linformatique dcisionnelle sur le traitement

    transactionnel li aux bases de production.

    La norme OLAP a t dfinie par un chercheur amricain, E.F. Codd.

    Dans linformatique dcisionnelle, lOLAP se situe gnralement au niveau des data marts.

    11.13 OLTP

    Le systme OLTP (On-Line Transaction Processing), galement dfinis par E.F. Codd dans

    les annes 1970 est appliqu dans les bases de production (comptabilit, gestion commerciale,

    gestion de production, gestion bancaire,...).

    Il gre des transactions dtailles (ligne de commande, mouvement bancaire,...).

    11.14 Outils d'alimentation

    Les outils dalimentation figurent en amont dans le schma de linformatique dcisionnelle.

    Ces outils sont utiliss pour rcuprer les donnes des bases de production, systmes oprants,

    les convertir, les transformer et enfin les stocker dans lentrept de donnes. Ils serventgalement grer et mettre jour les mtadonnes.

    Conclusion

    LE FUTUR ... DES OUTILS DECISIONNELS :

    Le DataMining pourrait reprsenter une avance importante dans linformatique dcisionnelle.

    Dans la phase pr-DataMining, les outils dcisionnels servaient principalement accder aux

    donnes ou mettre en place des simulations simples connues et prouves.

    Aujourdhui, avec le DataMining et le DataWarehouse, les outils dcisionnels accdent ltape danalyse des donnes.

    Et demain, de quoi sera fait la phase post-DataMining ?

    Les outils dcisionnels de demain arriveront-ils un tel niveau de sophistication quils

    permettront de prendre des dcisions en donnant aux utilisateurs des "recommandations" en

    temps rel ?

    Dans tout les cas, il restera aux utilisateurs en faire bon usage... et cela n'est certainement

    pas la partie la moins intressante du processus de management.