Transcript
Page 1: La data n’a pas besoin d’être « big » pour générer de la valeur

La data n'a pas besoin d'être « big » pour générer de la valeur

Page 2: La data n’a pas besoin d’être « big » pour générer de la valeur

Fabienne AMADORI ISIASOFT

[email protected]

Anne LAURENTLIRMM (UM2 – CNRS)

[email protected]

Page 3: La data n’a pas besoin d’être « big » pour générer de la valeur
Page 4: La data n’a pas besoin d’être « big » pour générer de la valeur

Big Data,l’un des plus grands défis informatiques de la décennie

“Big data: The next frontier for innovation, competition, and productivity” (McKinsey Global Institute).

Page 5: La data n’a pas besoin d’être « big » pour générer de la valeur

L’enjeu du Big Data,Transformer les données en savoir

Page 6: La data n’a pas besoin d’être « big » pour générer de la valeur

Expérimentation

Théorie

Simulation

Données

http://research.microsoft.com/en-us/collaboration/fourthparadigm/

Page 7: La data n’a pas besoin d’être « big » pour générer de la valeur

Les « autres » données,Un gisement de valeurs

“Information has become one of the most valuable assets that organizations have.” (Gartner)

Page 8: La data n’a pas besoin d’être « big » pour générer de la valeur

Dans la suite de cette session…

Tour d’horizon

Approche, étapes clés, arbitrages et écueils à éviter

Tous concernés par le big data

Page 9: La data n’a pas besoin d’être « big » pour générer de la valeur

Data mining

Business Intelligence

Big Data

Data Visualisation

Data Science

Réseaux de neurones

Machine learning

Arbre de décision

Régression linéaire

Régression logistique

c2

Page 10: La data n’a pas besoin d’être « big » pour générer de la valeur

BI Reporting

Qu’est-il arrivé ? Quand? Combien ?

Analyse prédictive

Que va-t-il arriver ? Quel va être

l’impact ?

Optimisation

Quel est le meilleur choix ?

La meilleure action

Cognitif

Intuitif Evolutif

Page 11: La data n’a pas besoin d’être « big » pour générer de la valeur

Data science, Data mining, Exploration de données,….

Page 12: La data n’a pas besoin d’être « big » pour générer de la valeur

Quelle corrélation entre bières et couches pour bébé ?

Page 13: La data n’a pas besoin d’être « big » pour générer de la valeur

Big data« Petite » analyse lexicale

Page 14: La data n’a pas besoin d’être « big » pour générer de la valeur

3V+Valeur

3V : Volume, Variété, Vélocité

3V+Visualisation

3V+ Véracité

3V+ …

Page 15: La data n’a pas besoin d’être « big » pour générer de la valeur

Le calcul intensif Un outil stratégique pour la science, l’industrie …

Page 16: La data n’a pas besoin d’être « big » pour générer de la valeur

http://nirvacana.com/thoughts/becoming-a-data-scientist/

5. Text Mining / NLP

1. Fundamentals

4. Machine Learning

6. Visualization

9. Data Mining

8. Data Ingestion

10. Toolbox

7. BigData

3. Programming2. Statistics

Page 17: La data n’a pas besoin d’être « big » pour générer de la valeur

Exploration des données…Retour d’expérience sur un projet

Page 18: La data n’a pas besoin d’être « big » pour générer de la valeur

Collecter

Consolider et nettoyer les données

Explorer

Découvrir et analyser

Réinjecter la connaissance dans les process

Page 19: La data n’a pas besoin d’être « big » pour générer de la valeur
Page 20: La data n’a pas besoin d’être « big » pour générer de la valeur

Hétérogénéité technique

Hétérogénéité fonctionnelle

Hétérogénéité des déploiements

Véracité des données

Connaissance fonctionnelle….

Consolidation et nettoyage des données

Page 21: La data n’a pas besoin d’être « big » pour générer de la valeur

Hétérogénéité technique

Bases de données Fichiers CSV, log… Progiciels

Web servicesRéseaux sociaux

Page 22: La data n’a pas besoin d’être « big » pour générer de la valeur

Hétérogénéité fonctionnelle

Produit

R&D, prototypage

Design,Packaging, Marketing

ProductionMarketing,Distribution

SAV

Page 23: La data n’a pas besoin d’être « big » pour générer de la valeur

Connaissance fonctionnelle

REGPZCV REGPATI REGUPP ... REGUCI REGGEN

56 20091213 0 4 0,256

33 20090615 1 4 0,358

… … … … … …

42 20081114 1 2 0,199

Page 24: La data n’a pas besoin d’être « big » pour générer de la valeur

Validité des données

Page 25: La data n’a pas besoin d’être « big » pour générer de la valeur

Consolidation et nettoyage des données

SAVR&D,

prototypage

Design,Packaging, Marketing

Production Marketing,Distribution

CharacteristicsFormulation Class

Produit Na+ K+ Cl- Claims

… … … … …

AER234 0,4087429 0,5980998 0,6190223 No

AAI254 0,3202395 0,598452 0,6179289 Yes

AAI256 0,3506248 0,60179 0,6969146 No

AAD472 0,3521515 0,6492974 0,5481292 No

… … … … …

Page 26: La data n’a pas besoin d’être « big » pour générer de la valeur

Hétérogéniété des déploiements

SAV R&D, prototypage

Design,Packaging, Marketing

Production

Marketing,Distribution

2001

2010

20072010

2013

2006

2002Indicateurs qualité

Page 27: La data n’a pas besoin d’être « big » pour générer de la valeur

Neural Network• MultiLayerPerceptron

Decision Tree• C4.5

Bayes Net

InfoGain

ChiSquared

Filtered

SymmetricalUncert

ReliefF

OneR

Ranking strategies Algorithms

De nombreuses stratégies, de nombreux algorithmes…..

Page 28: La data n’a pas besoin d’être « big » pour générer de la valeur

Color

freshness & Smell

Surface Quality

Riboflavin

Choline

Folic acid

Claims

Réseau de Neurones

Page 29: La data n’a pas besoin d’être « big » pour générer de la valeur

Algorithme génétiqueEntrainement des réseaux de neurones

Sélections des meilleurs

réseaux

Héritage par re-

combinaisonsMutation

Nouvelle génération

1ère

génération

Page 30: La data n’a pas besoin d’être « big » pour générer de la valeur

Application spécifique développée en WPF

Page 31: La data n’a pas besoin d’être « big » pour générer de la valeur
Page 32: La data n’a pas besoin d’être « big » pour générer de la valeur

Axes d’améliorations identifiés

Bilan du projet

Freins levés

Démarche à moindre coût

Synergie entre monde de l’entreprise et la recherche

Page 33: La data n’a pas besoin d’être « big » pour générer de la valeur

Enveloppe financière raisonnable

En synthèse

Démarche globale et impact sur l’organisation

Qualité des données

Compétences requises

Page 34: La data n’a pas besoin d’être « big » pour générer de la valeur

Not so Big data : 3V + Vous…Une démarche sur mesure

Page 35: La data n’a pas besoin d’être « big » pour générer de la valeur

Des questions ?

Vous avez d’autres questions ou vous souhaitez prolonger cet échange ISIASOFT Stand 6 bis (espace exposants) www.isiasoft.com


Top Related