bi actuel et future - sas group presentation… · clients de nos formations . ... – au niveau...

32
Cabinet Conseil en Intelligence d’Affaires L'Intégration de données et la Qualité des données dans l'écosystème BI actuel et future

Upload: buianh

Post on 13-Sep-2018

214 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: BI actuel et future - SAS Group Presentation… · Clients de nos formations . ... – Au niveau décisionnel la qualité de données doit être définie selon l’usage qu’un utilisateur

Cabinet Conseil en Intelligence d’Affaires

L'Intégration de données et la Qualité des données dans l'écosystème BI actuel et future

Page 2: BI actuel et future - SAS Group Presentation… · Clients de nos formations . ... – Au niveau décisionnel la qualité de données doit être définie selon l’usage qu’un utilisateur

Nous croyons que

• Les données sont des actifs corporatifs

• Les projets BI peuvent être moins coûteux

• Les approches éprouvées diminuent les

risques

Les GENS font toute

la DIFFÉRENCE

Page 3: BI actuel et future - SAS Group Presentation… · Clients de nos formations . ... – Au niveau décisionnel la qualité de données doit être définie selon l’usage qu’un utilisateur

Notre offre

Conseils stratégiques

Augmentation de ressources

Formation

Intelligence

d’Affaires

Page 4: BI actuel et future - SAS Group Presentation… · Clients de nos formations . ... – Au niveau décisionnel la qualité de données doit être définie selon l’usage qu’un utilisateur

Nos clients

Page 5: BI actuel et future - SAS Group Presentation… · Clients de nos formations . ... – Au niveau décisionnel la qualité de données doit être définie selon l’usage qu’un utilisateur

Clients de nos formations

Page 6: BI actuel et future - SAS Group Presentation… · Clients de nos formations . ... – Au niveau décisionnel la qualité de données doit être définie selon l’usage qu’un utilisateur

Nos partenariats stratégiques

Wayne Eckerson Lawrence Corr Ralph Hughes

Page 7: BI actuel et future - SAS Group Presentation… · Clients de nos formations . ... – Au niveau décisionnel la qualité de données doit être définie selon l’usage qu’un utilisateur

Introduction

• Le BI évolue, implique plus de gens

• Les outils et les architectures changent ce qui

est possible

• Le BI, ce n’est plus seulement les EDs

• L’intégration et la qualité de données sont

matures dans les Eds.

• L’intégration de données à l’extérieur des Eds

Défi

Comment assurer les bonnes pratiques

et la qualité de données en dehors des EDs?

Page 8: BI actuel et future - SAS Group Presentation… · Clients de nos formations . ... – Au niveau décisionnel la qualité de données doit être définie selon l’usage qu’un utilisateur

Définitions

• Intelligence d’affaires:

– L'informatique à l'usage des décideurs et des dirigeants des

entreprises. Elle désigne les moyens, les outils et les méthodes

qui permettent de collecter, consolider, modéliser les données,

d'une entreprise en vue d'offrir une aide à la décision.

(Wikipédia)

• Intégration des données:

– Homogénéiser les données pour leur donner un sens unique

compréhensible par tous les utilisateurs.

• Qualité des données:

– Au niveau décisionnel la qualité de données doit être définie

selon l’usage qu’un utilisateur souhaite faire des données.

Page 9: BI actuel et future - SAS Group Presentation… · Clients de nos formations . ... – Au niveau décisionnel la qualité de données doit être définie selon l’usage qu’un utilisateur

L’EVOLUTION DU BI

Page 10: BI actuel et future - SAS Group Presentation… · Clients de nos formations . ... – Au niveau décisionnel la qualité de données doit être définie selon l’usage qu’un utilisateur

L’évolution des besoins d’affaires

Page 11: BI actuel et future - SAS Group Presentation… · Clients de nos formations . ... – Au niveau décisionnel la qualité de données doit être définie selon l’usage qu’un utilisateur

L’impact de l’évolution sur les données

Aider nos clients à prendre

les meilleures décisions

d’orientation en Intelligence

d’Affaires

Les données c’est le « Nouveau Pétrole » !

Page 12: BI actuel et future - SAS Group Presentation… · Clients de nos formations . ... – Au niveau décisionnel la qualité de données doit être définie selon l’usage qu’un utilisateur

L’ÉVOLUTION DES OUTILS ET DES ARCHITECTURES SUPPORTANT LE BI

Page 13: BI actuel et future - SAS Group Presentation… · Clients de nos formations . ... – Au niveau décisionnel la qualité de données doit être définie selon l’usage qu’un utilisateur

Les 4 grandes catégories de besoins

Top Down BI

Bottom Up BI

Page 14: BI actuel et future - SAS Group Presentation… · Clients de nos formations . ... – Au niveau décisionnel la qualité de données doit être définie selon l’usage qu’un utilisateur

Architecture BI répondant aux besoins

Page 15: BI actuel et future - SAS Group Presentation… · Clients de nos formations . ... – Au niveau décisionnel la qualité de données doit être définie selon l’usage qu’un utilisateur

PLUS DE POSSIBILITÉS MAIS PLUS DE DÉFIS

Page 16: BI actuel et future - SAS Group Presentation… · Clients de nos formations . ... – Au niveau décisionnel la qualité de données doit être définie selon l’usage qu’un utilisateur

Les données requises pour supporter le BI

Page 17: BI actuel et future - SAS Group Presentation… · Clients de nos formations . ... – Au niveau décisionnel la qualité de données doit être définie selon l’usage qu’un utilisateur

COMMENT ASSURER LA QUALITÉ DES LIVRABLES INFORMATIONNELS GLOBALEMENT

Approches et meilleures pratiques en intégration et qualité de données

Page 18: BI actuel et future - SAS Group Presentation… · Clients de nos formations . ... – Au niveau décisionnel la qualité de données doit être définie selon l’usage qu’un utilisateur

L’architecture d’intégration de données

Une approche en trois étapes: première étape:

• La pré-intégration et le profilage

– On cherche à découvrir:

• Les relations entre les données

• Valider le contenu des données

• Identifier certaines problématiques associées à la

qualité

• Tester les hypothèses de départ

On identifie les causes de la

non-qualité des données

Page 19: BI actuel et future - SAS Group Presentation… · Clients de nos formations . ... – Au niveau décisionnel la qualité de données doit être définie selon l’usage qu’un utilisateur

Des outils pour nous aider…

Data Flux : Data Management Studio

Page 20: BI actuel et future - SAS Group Presentation… · Clients de nos formations . ... – Au niveau décisionnel la qualité de données doit être définie selon l’usage qu’un utilisateur

L’architecture d’intégration de données

Deuxième étape:

• La transformation des données

– On effectue les opérations suivantes:

• Harmonisation aux valeurs d’entreprises

• Standardisation des formats de données

• Agrégation

• Traduction

• Normalisation

On élimine les causes de la

non-qualité des données

Page 21: BI actuel et future - SAS Group Presentation… · Clients de nos formations . ... – Au niveau décisionnel la qualité de données doit être définie selon l’usage qu’un utilisateur

L’architecture d’intégration de données

Une approche en trois étapes: troisième étape:

• L’intégration des données.

– On consolide les données:

• Faire le rapprochement

• Faire la comparaison

• Établir les correspondances

La résultante est une vue unifiée

des données d’entreprise

Page 22: BI actuel et future - SAS Group Presentation… · Clients de nos formations . ... – Au niveau décisionnel la qualité de données doit être définie selon l’usage qu’un utilisateur

Décomposer le processus d’intégration

Source: Agile DataWarehousing, Ralph Hughes

Page 23: BI actuel et future - SAS Group Presentation… · Clients de nos formations . ... – Au niveau décisionnel la qualité de données doit être définie selon l’usage qu’un utilisateur

Jouer avec les différents niveaux des sujets à intégrer

Source: Agile DataWarehousing, Ralph Hughes

Page 24: BI actuel et future - SAS Group Presentation… · Clients de nos formations . ... – Au niveau décisionnel la qualité de données doit être définie selon l’usage qu’un utilisateur

Comprendre qu’est ce que la qualité des données

• Pour définir le niveau de qualité requis il faut définir les

dimensions de la qualité des données et leur importance

face à l’analyse que nous réalisons

Page 25: BI actuel et future - SAS Group Presentation… · Clients de nos formations . ... – Au niveau décisionnel la qualité de données doit être définie selon l’usage qu’un utilisateur

Démarche pour déterminer la Qualité de données

• Une fois que les dimensions de la qualité que l’on désire

obtenir sont identifiées on peut créer des indicateurs que

l’on suivra. Exemple de critères:

Page 26: BI actuel et future - SAS Group Presentation… · Clients de nos formations . ... – Au niveau décisionnel la qualité de données doit être définie selon l’usage qu’un utilisateur

Suivre la qualité des données

• Et faire le monitoring en continu

–De façon subjective:

• En recueillant la perception des utilisateurs

–De façon objective:

• Rapport de profilage automatisé

• Tests automatisés

• Certifier les étapes intermédiaires d’intégration

Page 27: BI actuel et future - SAS Group Presentation… · Clients de nos formations . ... – Au niveau décisionnel la qualité de données doit être définie selon l’usage qu’un utilisateur

ÉLÉMENTS ADDITIONNELS QUI SONT SPÉCIFIQUES AUX ENTREPÔTS DE DONNÉES

Approches et meilleures pratiques en intégration et qualité de données

Page 28: BI actuel et future - SAS Group Presentation… · Clients de nos formations . ... – Au niveau décisionnel la qualité de données doit être définie selon l’usage qu’un utilisateur

Bonus !

• 3NF Originallement conçu pour les applications OLTP (Modèle relationnel)

• Les schémas en étoile ont fait leur apparition et ont été perfectionnés dans les années ’80 afin de résoudre l’analyse des données orientées sujets.

• Data Vault est une architecture spécialiement conçue pour les “Enterprise Data Warehouse”.

Une nouvelle Architecture de données pour les entrepôts

de données facilitant l’intégration des données

Page 29: BI actuel et future - SAS Group Presentation… · Clients de nos formations . ... – Au niveau décisionnel la qualité de données doit être définie selon l’usage qu’un utilisateur

Qu’est-ce que le Data Vault

29

Plus qu’un modèle de données

Formé de 4 pilliers

Les pilliers doivent être définis

avant de débuter le

développement pour

maximiser le

succès

Wikipedia:

Page 30: BI actuel et future - SAS Group Presentation… · Clients de nos formations . ... – Au niveau décisionnel la qualité de données doit être définie selon l’usage qu’un utilisateur

DataVault: différent des autres architectures

• Les « Soft » Business Rules vont après l’entrepôt de données. Nous faisons donc une distinction entre les Hard Business Rules et les Soft Business Rules.

• Les données sont interprétées à la consommation

Compliant and Auditable

System of Record !!!

Page 31: BI actuel et future - SAS Group Presentation… · Clients de nos formations . ... – Au niveau décisionnel la qualité de données doit être définie selon l’usage qu’un utilisateur

Conclusion

• Le BI évolue, implique plus de gens

– Casual Users et Power Users

• 4 Grandes catégories de besoins

• L’intégration se produit à l’extérieur des

EDs

Défi

Assurer les bonnes pratiques

et la qualité de données en dehors des Eds.

Page 32: BI actuel et future - SAS Group Presentation… · Clients de nos formations . ... – Au niveau décisionnel la qualité de données doit être définie selon l’usage qu’un utilisateur

Merci Jean-François Pilon

[email protected]