développement et intégration des techniques de data mining pour une plate-forme de coopération

46
Développement et intégration des techniques de Data Mining pour une plate-forme de coopération Soutenance de projet de fin d'études Équipe de recherche : ECOO – LORIA Responsable de l’équipe : M. Claude Godart Réalisé par : Khaled Gaaloul Encadreurs : M. François Charoy M. Noureddine Ellouze

Upload: arissa

Post on 21-Jan-2016

36 views

Category:

Documents


0 download

DESCRIPTION

Soutenance de projet de fin d'études. Développement et intégration des techniques de Data Mining pour une plate-forme de coopération. Équipe de recherche : ECOO – LORIA Responsable de l’équipe : M. Claude Godart - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Développement et intégration des techniques de Data Mining pour une plate-forme de coopération

Développement et intégration des techniques de Data Mining pour une plate-forme de

coopération

Soutenance de projet de fin d'études

Équipe de recherche : ECOO – LORIA Responsable de l’équipe : M. Claude Godart

Réalisé par : Khaled Gaaloul Encadreurs : M. François Charoy M. Noureddine Ellouze

Page 2: Développement et intégration des techniques de Data Mining pour une plate-forme de coopération

Soutenance PFE Juin 2004 2

Plan• Introduction et problématique

• État de l’art

Présentation de SGW Bonita

Introduction à l’approche Workflow Mining

• Mise en œuvre

Développement de l’outil pour la collecte de traces d’exécution greffé

à Bonita

Développement du Parseur XML pour les statistiques de Workflow

Mining

• Conclusion et perspectives

Page 3: Développement et intégration des techniques de Data Mining pour une plate-forme de coopération

Introduction & Problématique

Page 4: Développement et intégration des techniques de Data Mining pour une plate-forme de coopération

Soutenance PFE Juin 2004 4

• Besoin de coopération

Face à la mondialisation, l’économie a subi une

métamorphose (e.g. fusion de groupe, externalisation de

services, extension d’entreprises, etc.).

Les conséquences étaient le déploiement de nouveaux

concepts et d’outils technologiques pour les entreprises.

La nécessité de mécanismes supportant l’interconnexion et

la coopération des applications.

Introduction & Problématique

État de l’art Mise en oeuvreConclusion et perspectives

Page 5: Développement et intégration des techniques de Data Mining pour une plate-forme de coopération

Soutenance PFE Juin 2004 5

• Procédés d’entreprises et coopération

Département 3

Département 2Département 1

Département 4

Entreprise Mère

Filiale 1 Filiale 2 Filiale 3

Intra entreprise

Inter entreprises

Introduction & Problématique

État de l’art Mise en oeuvreConclusion et perspectives

Page 6: Développement et intégration des techniques de Data Mining pour une plate-forme de coopération

Soutenance PFE Juin 2004 6

• Les Workflows comme outil de coopération (1)

« Outil décisionnel coopératif ayant pour paramètres un

nombre de personne limité devant accomplir en un

temps limité des tâches articulées autour d'une

procédure définie tout en ayant un objectif commun » Workflow Management Consortium 2001.

Domaine d’application : co-ingénierie et/ou co-

conception.

Introduction & Problématique

État de l’art Mise en oeuvreConclusion et perspectives

Page 7: Développement et intégration des techniques de Data Mining pour une plate-forme de coopération

Soutenance PFE Juin 2004 7

• Les Workflows comme outil de coopération (2)

Faciliter la coordination entre les participants à

un projet coopératif.

Gérer des procédés d’entreprise.

Optimiser et automatiser les procédés

d’entreprises.

Introduction & Problématique

État de l’art Mise en oeuvreConclusion et perspectives

Page 8: Développement et intégration des techniques de Data Mining pour une plate-forme de coopération

Soutenance PFE Juin 2004 8

Introduction & Problématique

État de l’art Mise en oeuvreConclusion et perspectives

•Phases du Workflow

Analyse du procédéAnalyse du procédéConception et Conception et Définition du Définition du procédéprocédé

Définition du procédéDéfinition du procédéInstantiation etInstantiation etcontrôle ducontrôle duprocédéprocédé

Service d’exécution du WorkflowService d’exécution du Workflow

Outils et applicationsOutils et applications

Interaction avec les Interaction avec les utilisateurs et les utilisateurs et les applicationsapplications

Page 9: Développement et intégration des techniques de Data Mining pour une plate-forme de coopération

Soutenance PFE Juin 2004 9

• Divergence entre modélisation et implémentation (1)

Constats d’erreurs de conception sur les modèles de workflows

lors de leur exécution.

Le plus souvent les modèles restent loin du souhait de

l’utilisateur : les modèles de workflow manquent d’automatisme et

de performance.

L’approche classique de modélisation attache peu d’importance à

la phase d’exécution.

Introduction & Problématique

État de l’art Mise en oeuvreConclusion et perspectives

Page 10: Développement et intégration des techniques de Data Mining pour une plate-forme de coopération

Soutenance PFE Juin 2004 10

• Divergence entre modélisation et implémentation (2)

Divergence d’interprétation lors de l’exécutions d’une

instance de workflow.

Les connaissances utilisées pour la modélisation et la

conception restent tacites.

Introduction & Problématique

État de l’art Mise en oeuvreConclusion et perspectives

Page 11: Développement et intégration des techniques de Data Mining pour une plate-forme de coopération

Soutenance PFE Juin 2004 11

• Nécessité d’une nouvelle approche pour la modélisation de workflows

Introduction & Problématique

État de l’art Mise en oeuvreConclusion et perspectives

Phase de diagnostique

Phase de diagnostique

Connaissances explicites

Connaissances explicites

Réalisation de modèles de workflows compatibles

et complets

Réalisation de modèles de workflows compatibles

et complets

Page 12: Développement et intégration des techniques de Data Mining pour une plate-forme de coopération

Soutenance PFE Juin 2004 12

État de l’art

Page 13: Développement et intégration des techniques de Data Mining pour une plate-forme de coopération

Soutenance PFE Juin 2004 13

• Les workflows coopératifs

Solution pour des modèles rigides de workflows.

Offre plus de flexibilité et d’interaction.

Possibilité de communication et d’interaction entre les

différentes tâches du procédé du workflow.

Introduction & Problématique

État de l’art Mise en oeuvreConclusion et perspectives

Édition Modification

Edition Revue Modification

Édition Revue

Modification

Procédé

Exécution

(1)

(2) Anticipating

Anticipable

Executing

Revue

Modèle classique

Modèle coopératif

Page 14: Développement et intégration des techniques de Data Mining pour une plate-forme de coopération

Soutenance PFE Juin 2004 14

• Bonita : un workflow coopératif

Bonita est un Système de Gestion de Worflow

coopératif (SGW), conforme aux

caractéristiques de WfMC (Workflow

managemenet Consortium).

Bonita est un SGW conçu pour indiquer,

exécuter, surveiller et coordonner les flux

d’organismes du travail.

L’originalité de Bonita réside dans un moteur

d'exécution qui est basé sur le nouveau modèle

d'anticipation d'activité proposé par l'équipe

ECOO.

Introduction & Problématique

État de l’art Mise en oeuvreConclusion et perspectives

Page 15: Développement et intégration des techniques de Data Mining pour une plate-forme de coopération

Soutenance PFE Juin 2004 15

• Architecture de Bonita (1)

Le composant de modélisation assurent la

modélisation ainsi que la visualisation de

processus de workflow.

Le composant d’exécution est responsable de

la phase d’exécution, il est chargé de La gestion

des données flexibles permettant aux activités

de permuter des données d'une manière

optimum.

Le développement du moteur de workflow est

centré sur la plate-forme J2EE fournissant un

environnement plus flexible et plus portatif pour

des applications réparties.

Introduction & Problématique

État de l’art Mise en oeuvreConclusion et perspectives

Page 16: Développement et intégration des techniques de Data Mining pour une plate-forme de coopération

Soutenance PFE Juin 2004 16

• Architecture de Bonita (2)

Introduction & Problématique

État de l’art Mise en oeuvreConclusion et perspectives

Page 17: Développement et intégration des techniques de Data Mining pour une plate-forme de coopération

Soutenance PFE Juin 2004 17

• Data Mining : fouille de données

Le data mining est le successeur des statistiques.

Son but est de réaliser des «modèles» compacts et

compréhensibles rendant compte des relations liant la

description d'une situation à un résultat.

Ils offrent des techniques pour la construction du dit modèle

de manière automatique.

Introduction & Problématique

État de l’art Mise en oeuvreConclusion et perspectives

Page 18: Développement et intégration des techniques de Data Mining pour une plate-forme de coopération

Soutenance PFE Juin 2004 18

• Data Mining Vs Statistiques

Introduction & Problématique

État de l’art Mise en oeuvreConclusion et perspectives

Page 19: Développement et intégration des techniques de Data Mining pour une plate-forme de coopération

Soutenance PFE Juin 2004 19

• Avantage de Data Mining

Les modèles exprimés par le data mining sont:

Descriptif et explicatif : il éclaire la situation en «vous disant

où regarder ».

Prédictif : obtenir une estimation du résultat à attendre pour un

modèle ayant de nouveaux paramètres.

Les techniques de data mining construisent ces modèles de

manière automatique et en un temps optimum.

Introduction & Problématique

État de l’art Mise en oeuvreConclusion et perspectives

Page 20: Développement et intégration des techniques de Data Mining pour une plate-forme de coopération

Soutenance PFE Juin 2004 20

• L’approche Workflow Mining

L’approche Workflow Mining hérite des techniques

de data mining.

Elle désigne l’ensemble des techniques pour la

découverte de modèles de workflows.

Introduction & Problématique

État de l’art Mise en oeuvreConclusion et perspectives

Page 21: Développement et intégration des techniques de Data Mining pour une plate-forme de coopération

Soutenance PFE Juin 2004 21

Mise en oeuvre

Page 22: Développement et intégration des techniques de Data Mining pour une plate-forme de coopération

Soutenance PFE Juin 2004 22

• Objectifs

Développement et intégration d’un outil de collecte de

traces d’exécution d’une instance de workflow greffé au

SGW Bonita.

Conception d’un parseur XML pour le filtrage et

l’extraction de statistiques nécessaires à l’approche du

workflow mining adoptée.

Introduction & Problématique

État de l’art Mise en oeuvreConclusion et perspectives

Page 23: Développement et intégration des techniques de Data Mining pour une plate-forme de coopération

Soutenance PFE Juin 2004 23

• L’outil de collecte de traces (1)

But : enregistrer dans des fichiers logs de

type XML des évènements qui vont se

produire lors de l’instanciation et de

l’exécution d’un projet workflow au sein de

Bonita.

Source : le service de messagerie JMS

intégré dans Bonita assure un échange

d’informations et de messages relatant à

l’exécution d’un projet workflow.

Introduction & Problématique

État de l’art Mise en oeuvreConclusion et perspectives

Page 24: Développement et intégration des techniques de Data Mining pour une plate-forme de coopération

Soutenance PFE Juin 2004 24

• L’outil de collecte de traces (2)

Exécution d’activités dans un projet workflow

Introduction & Problématique

État de l’art Mise en oeuvreConclusion et perspectives

Page 25: Développement et intégration des techniques de Data Mining pour une plate-forme de coopération

Soutenance PFE Juin 2004 25

• L’outil de collecte de traces (3)

Serveur de messagerie dans Bonita

Introduction & Problématique

État de l’art Mise en oeuvreConclusion et perspectives

Page 26: Développement et intégration des techniques de Data Mining pour une plate-forme de coopération

Soutenance PFE Juin 2004 26

• Conception de l’outil de collecte de traces

L’outil de collecte de trace est un

d’espion greffé à Bonita.

Le développement de cet outil va se

baser sur l’API JMS.

Le mode choisi pour répondre à ces

besoins est le mode

publication/abonnement de JMS.

Introduction & Problématique

État de l’art Mise en oeuvreConclusion et perspectives

Page 27: Développement et intégration des techniques de Data Mining pour une plate-forme de coopération

Soutenance PFE Juin 2004 27

• LogListener : outil de collecte de traces

LogListener va écouter les messages (évènements)

échangés entre Bonita et l’utilisateur connecté.

Les évènements contiennent le nom de l’utilisateur, le

nom du projet, les noms des activités, leurs états, et le

temps d’exécution.

A chaque instanciation de workflow, le LogListener

produit un fichier XML identifié par le nom du projet et

sa date d’accès.

Introduction & Problématique

État de l’art Mise en oeuvreConclusion et perspectives

Page 28: Développement et intégration des techniques de Data Mining pour une plate-forme de coopération

Soutenance PFE Juin 2004 28

• LogListener : L’approche conceptuelle

Utilisation du patron de conception singleton.

Nécessiter de créer un objet qui devra posséder

durant tout le programme une instance unique.

Introduction & Problématique

État de l’art Mise en oeuvreConclusion et perspectives

Page 29: Développement et intégration des techniques de Data Mining pour une plate-forme de coopération

Soutenance PFE Juin 2004 29

Introduction & Problématique

État de l’art Mise en oeuvreConclusion et perspectives

•Déroulement de la collecte de traces

Page 30: Développement et intégration des techniques de Data Mining pour une plate-forme de coopération

Soutenance PFE Juin 2004 30

• Structure d’un fichier XML

Introduction & Problématique

État de l’art Mise en oeuvreConclusion et perspectives

Page 31: Développement et intégration des techniques de Data Mining pour une plate-forme de coopération

Soutenance PFE Juin 2004 31

• Le parseur XML : Définition

Effectuer une analyse lexicale pour chaque fichier XML

généré par l’outil LogListener.

Extraire des données sur les activités, leur nombre

d’occurrence, la liste des activités qui les précèdent et celles

qui les suivent.

Générer des fichiers XML contenant ces

données.

Introduction & Problématique

État de l’art Mise en oeuvreConclusion et perspectives

Page 32: Développement et intégration des techniques de Data Mining pour une plate-forme de coopération

Soutenance PFE Juin 2004 32

• Le parseur XML : Architecture

Introduction & Problématique

État de l’art Mise en oeuvreConclusion et perspectives

Page 33: Développement et intégration des techniques de Data Mining pour une plate-forme de coopération

Soutenance PFE Juin 2004 33

• Le parseur XML : Étapes de réalisation (1)

Étape 1 : Définir une classe « activityStatistic »

dont le rôle est de mettre à jour l’opération de

filtrage du fichier XML grâce aux méthodes

Getters() et Setters() appliquées à ses attributs.

Étape 2 : Définir une classe « ParserXML » pour

le parcours du répertoire des fichiers XML afin

d’extraire les données (nom, occurrence,

activités précédentes, activités suivantes).

Introduction & Problématique

État de l’art Mise en oeuvreConclusion et perspectives

Page 34: Développement et intégration des techniques de Data Mining pour une plate-forme de coopération

Soutenance PFE Juin 2004 34

• Le parseur XML : Étapes de réalisation (2)

Introduction & Problématique

État de l’art Mise en oeuvreConclusion et perspectives

activityStatic+taskName : String+taskOccurence : int+previousActivity : Object+fwActivity : Object

+activityStatic()+getName() : String+setName()+getOccurence() : int+setOccurence+updateOccurence()+getPreviousActivity() : Object+setPreviousActivity()+getFwActivity() : Object+setFwActivity()+result() : String

ParserXML+inputdataDirectory : String+outputData : String+Activity : Object+window : int

+readXMLDirectory()+readXMLFile()

Page 35: Développement et intégration des techniques de Data Mining pour une plate-forme de coopération

Soutenance PFE Juin 2004 35

• Le parseur XML : Étapes de réalisation (3)

3ème étape : l’utilisation de l’outil ANT pour faciliter le

déploiement du parseur XML.

- Définition du fichier build.xml pour faciliter les tâches de

déploiement.

- Définitions des targets du build.xml nécessaires à la

compilation et l’exécution de l’outil du filtrage.

Introduction & Problématique

État de l’art Mise en oeuvreConclusion et perspectives

Page 36: Développement et intégration des techniques de Data Mining pour une plate-forme de coopération

Soutenance PFE Juin 2004 36

• Le parseur XML : Build.xml

Introduction & Problématique

État de l’art Mise en oeuvreConclusion et perspectives

Page 37: Développement et intégration des techniques de Data Mining pour une plate-forme de coopération

Soutenance PFE Juin 2004 37

• Le parseur XML : Déploiement avec ANT

Introduction & Problématique

État de l’art Mise en oeuvreConclusion et perspectives

Page 38: Développement et intégration des techniques de Data Mining pour une plate-forme de coopération

Soutenance PFE Juin 2004 38

• Le parseur XML : Résultats

Introduction & Problématique

État de l’art Mise en oeuvreConclusion et perspectives

Page 39: Développement et intégration des techniques de Data Mining pour une plate-forme de coopération

Soutenance PFE Juin 2004 39

• Démonstration (1)

Introduction & Problématique

État de l’art Mise en oeuvreConclusion et perspectives

Page 40: Développement et intégration des techniques de Data Mining pour une plate-forme de coopération

Soutenance PFE Juin 2004 40

• Démonstration (2)

Introduction & Problématique

État de l’art Mise en oeuvreConclusion et perspectives

Page 41: Développement et intégration des techniques de Data Mining pour une plate-forme de coopération

Soutenance PFE Juin 2004 41

• Démonstration (3)

Introduction & Problématique

État de l’art Mise en oeuvreConclusion et perspectives

Page 42: Développement et intégration des techniques de Data Mining pour une plate-forme de coopération

Soutenance PFE Juin 2004 42

Conclusion et Perspectives

Page 43: Développement et intégration des techniques de Data Mining pour une plate-forme de coopération

Soutenance PFE Juin 2004 43

• Conclusion (1)

La programmation n’est plus une affaire d’alignement de

lignes de codes.

Une analyse minutieuse du problème est primordiale pour

une bonne conception.

Introduction & Problématique

État de l’art Mise en oeuvreConclusion et perspectives

Page 44: Développement et intégration des techniques de Data Mining pour une plate-forme de coopération

Soutenance PFE Juin 2004 44

• Conclusion (2)

Le bilan s’avère positif:

Scientifique:

Découverte de milieu de recherche scientifique.

Mise en application de connaissances théoriques.

Association dans un projet en cours.

Relation étroite avec des projets industriels.

Humain

Introduction & Problématique

État de l’art Mise en oeuvreConclusion et perspectives

Page 45: Développement et intégration des techniques de Data Mining pour une plate-forme de coopération

Soutenance PFE Juin 2004 45

• Perspectives

Une première étape de l'approche du workflow mining.

L’optimisation et le raffinement des statistiques extraites

pour l’approche adoptée.

L’implantation de l'algorithme de découverte de patrons de

workflows utilisant ces données

Introduction & Problématique

État de l’art Mise en oeuvreConclusion et perspectives

Page 46: Développement et intégration des techniques de Data Mining pour une plate-forme de coopération

Soutenance PFE Juin 2004 46

Merci de votre attention.