data mining visuelle & interactif
DESCRIPTION
Une présentation de data mining visuel et interactif et de ses méthodes.TRANSCRIPT
1
DATA MINING VISUEL ET INTERACTIF
Représenté par: Encadré par:BELAID Bilel Mme HAMDAD
BENSOULA Abd Elkader
DAOUD ZAKARIA
DEHIMI Mustapha El Amine
HADDADI ZAKARIA
2
PLAN Introduction DATA Mining
Définition Historique Taches Algorithmes
DATA Mining Visuel Définition Aproche Méthodes
DATA Mining Interactif Définition Objectifs Processus Domaines d’application
Conclusion
3
INTRODUCTION
Le Data Mining est un domaine pluridisciplinaire permettant, à partir d’une très importante quantité de données brutes, d’en extraire des informations cachées, pertinentes et inconnues auparavant en vue d’une utilisation industrielle ou opérationnelle de ce savoir.
Le Data Mining est une découverte de modèles intéressants à partir d’un ensemble de données de grande taille dans le but est d'extraire des données disponibles au sein de toute entreprise les informations exploitables.
4
DATA MINING
Définition
Data Mining : forage de données
Data Mining: ensemble des techniques et méthodes destinées à l’exploration et l’analyse de grandes bases de données informatiques en vue de détecter dans ces données des règles, des Associations, des structures pour en extraire l’essentiel de l’information utile dans l’objectif est l’aide à la décision.
5
DATA MINING
Historique
L’expression « Data Mining » serait apparue pour la première fois dans les années 60.
L’expression « Data Mining » réapparaît dans les années 80.
Le concept apparaît en 1989 sous un premier nom de KDD (Knowledge Discovery in Databases).
En 1991, le concept du Data Mining ou «fouille des données » apparaisse pour la première fois aux États-Unis comme une nouvelle discipline à l’interface de la statistique et des technologies de l’information
6
DATA MINING
Classification:La classification permet de créer des classes d’individus et de prédire si une instance de donnée est membre d’un groupe ou d’une classe prédéfinie. Règles d’association: Les règles associatives sont des règles qui sont extraites d’une base de données transactionnelles et qui décrivent des associations entre certains éléments.
Le Clustering Le Clustering est une méthode statistique d’analyse de données qui a pour but de regrouper un ensemble de données en différents groupes homogènes.Chaque sous-ensemble regroupe des éléments ayant des caractéristiques communes qui correspondent à des critères de proximité.
Taches du DM
7
DataMining
Apprentissage Supervisé
Les arbres de décision
Les réseaux de neurones
Apprentissage non
supervisé
Clustering Règles Associatives
Sequence Mining
CART OC1 SLIQ …
AdaBoost
Learn++ …
C.hiérarchique
K-means EM …
Apriori FP-Growth ECLAT SSDM KDCI …
GSP SPADE …
Algorithmes de DATA Mining
8
DATA MINING VISUEL
Le Data mining visuel est apparu récemment avec le flot sans cesse croissant des données.
L'objectif est de tirer avantage de la combinaison des techniques usuelles du Data mining avec les méthodes de visualisation de l'information.
9
L’APPROCHE DE DATA MINING VISUEL :
Il va s’agir d’une part de représenter les données sous la forme de signes visuels.
Et d’autre part de permettre une interaction, souvent très intuitive Cette approche vise donc à permettre une analyse rapide des données car utilisant les capacités d’interprétation visuelle de l’esprit humain
10
MÉTHODES DE DATA MINING VISUEL :
On peut définir d’une manière générale des méthodes de fouille visuelle de données de la façon suivante :
1. Recueil des données brutes, 2. Normalisation des données,3. Codage des données sous la forme de signes
visuels :Il s’agit de définir comment les données seront représentées visuellement à partir des valeurs prises par les attributs
11
MÉTHODES DE DATA MINING VISUEL :
4. Algorithme de « calcul » de la visualisation :consiste simplement à transcrire les valeurs des attributs en signes visuels
5. Rendu graphique : des méthodes de représentation :
histogramme, plot 2D ou 3D, box plot, représentation multidimensionnelle.6. Interaction entre la visualisation et l’expert du
domaine : explorer les données, vérifier des hypothèses
12
TECHNIQUES DE VISUALISATION Il existe une multitude de techniques de visualisation qui peuvent être
utilisées pour visualiser les données. Les techniques 2D/3D, les histogrammes, les chartes …ex.
Apparition de nouvelles techniques plus sophistiquées et qui donnent des représentations intuitives des données.
13
1-AFFICHAGE GÉOMÉTRIQUE TRANSFORMÉ
Une classe de transformation visuelle.
Transformations intéressantes des ensembles de données multidimensionnelles.
Mappage d’objets a un ensemble de points.
14
COORDONNÉES PARALLÈLES Projection des données vers un espace de 2 dimensions.
(x1, x2, …, xp) -------> (1, x1), (2, x2), …, (P, xp). Un espace de dimension n est représenté par n axes parallèles sur un
plan.
Méthode initialement utilisée pour la détection des collisions d'avions lors du contrôle du trafic aérien.
La recherche d'information lorsque celle-ci est trop volumineuse.
15
COORDONNÉES PARALLÈLES
PK cette méthode?
Il devient aisé de repérer les corrélations possibles entre les différents évènements (groupes de variables).
Combiné avec l’AD pour réduire les problèmes de :
Transparence.
Interactivité.
Simplification de la classification (data clustering).
16
COORDONNÉES PARALLÈLES
17
2-ICONIC DISPLAYS(AFFICHAGE EMBLÉMATIQUES)
Consiste à remplacer le simple point d'un diagramme de dispersion par un dessin relativement complexe.
Les variations des icones et des couleurs permettent de coder les variables.
Peut être très intuitif (bonne courbe d'apprentissage).
18
DATA MINING INTERACTIF
Problématique:Existe-t-il une théorie universellement applicable pour répondre aux besoins de tous les utilisateurs ?
19
DÉFINITION DU DATA MINING INTERACTIF
L’ensemble des modèles interactifs qui sont nécessaires à l’exploration des données afin de permettre aux utilisateurs de définir les objectifs et de s’adapter à des situations d'urgence imprévues.Tout en se concentrant sur les communications adaptatives et efficaces entre les utilisateurs et les systèmes du Data Mining.
20
OBJECTIF DU DATA MINING INTERACTIF :
Intégrer la connaissance des utilisateurs dans le processus du Data Mining.
Fournir aux utilisateurs des informations suffisantes sur le statut et les activités actuelles et historiques.
21
PROCESSUS DU DATA MINING INTERACTIF :
22
DOMAINES D’APPLICATION
La visualisation interactive des données a pénétrée dans de nombreux secteurs.
Web. Santé. Education. Economie. …ex.
Le but est de : Offrir une meilleur représentation de l’information et donc une
meilleur compréhension de phénomène étudié . La prévision.
23
DOMAINES D’APPLICATION
Le web
les différents outils de DAMIV ont pour principale mission suivre l’évolution de web, ses différentes technologie ainsi que le comportement des internautes.
24
DOMAINES D’APPLICATION
Actualités Suivre l’actualité dans n’importe quel pays. Prévoir de futur événements.
25
DOMAINES D’APPLICATION
Economie Données disponibles sont devenues une mine
d’or qu’il s’agit d’exploiter. L’introduction de DAMIV dans ce domaine a donné
lieu à une économie numérique.
26
DOMAINES D’APPLICATION
Sécurité Les données sur la criminalité dans une ville,
moulinées dans un logiciel adapté, donneront une bonne idée des lieux où la police doit allouer le plus de ressources. Et même, le circuit idéal pour effectuer des patrouilles policières.
27
CONCLUSION
La mise en œuvre du data mining visuel et interactif est une nouvelle tendance dans le domaine de l'exploration de données. Il vise à ce que l'homme soit impliqué dans le processus d'extraction de l'ensemble des données afin d'apporter un résultat efficace. L'interaction nécessite des systèmes autonomes et adaptatifs, des utilisateurs actifs. La performance des interactions dépend de la complexité du domaine, le contrôle, et les approches interactives disponibles.
28
MERCI POUR VOTRE ATTENTION