bonnes pratiques pour une gouvernance de données intelligentes
Post on 20-Jun-2022
3 Views
Preview:
TRANSCRIPT
Guide pratique pour établir un programme de gouvernance des données d'entreprise avec automatisation et intelligence
Bonnes pratiques pour une gouvernance de données intelligentes
Livre blanc
À propos d'Informatica
La transformation digitale fait évoluer les attentes : meilleurs services, livraisons plus rapides, à moindre coût. Les données sont la clé de la réussite des entreprises, et ces dernières doivent évoluer pour rester compétitives.
En tant que leader mondial dans la gestion des données Cloud d'entreprise, nous sommes prêts à vous guider de manière intelligente — quels que soient le secteur d'activité, la catégorie ou la niche. Informatica vous permet de prendre une longueur d'avance pour gagner en agilité, concrétiser de nouvelles opportunités de croissance ou même innover. Nous nous concentrons sur les données afin de vous offrir la polyvalence nécessaire pour réussir.
Découvrez nos solutions et libérez tout le potentiel de vos données en vue de la prochaine révolution intelligente.
Introduction ........................................................................................................... 4
Gouvernance de données : un rôle qui évolue rapidement .......................... 4
Qu'est-ce que la gouvernance de données intelligente ? .............................. 7
Qu'est-ce qui ne change pas après la révolution ? .......................................10
Que devons-nous faire différemment ? Mettre en œuvre la gouvernance de données intelligente ........................................................13
Quels sont les avantages de la gouvernance de données intelligente du point de vue de l'entreprise ? ......................................................................16
Conclusion ...........................................................................................................17
Table des matières
3
Introduction
Si vous lisez ce guide, vous avez déjà probablement compris deux points essentiels :
• La compréhension des données, des environnements professionnels et des aspects techniques
est cruciale pour la réussite de votre entreprise.
• Les activités manuelles ne sont pas suffisantes à elles seules pour développer ces
connaissances et les maintenir à jour.
Vous avez également découvert que la connexion des métadonnées métiers et techniques entre
les disciplines est primordiale et que la véritable valeur de la gouvernance de données réside dans
les mesures que vous pouvez prendre en fonction de votre compréhension. Vous allez chercher
à aller au-delà des méthodes traditionnelles de gouvernance de données et commencer à mettre en
pratique l'intelligence, simplement afin d'évoluer au même rythme que les données que vous gérez.
Vos concurrents pensent la même chose.
La gouvernance de données a considérablement évolué au cours des dernières années. Il ne suffit plus
de s'aligner sur la sémantique ou de soutenir la collaboration manuelle et d'encourager le changement
culturel. Se contenter de faire le strict minimum pour se conformer aux exigences réglementaires n'est
plus de mise. Une gouvernance de données intelligente à l'échelle de l'entreprise est indispensable
pour rester compétitif, ce qui signifie faire bien plus que créer un comité de gouvernance chargé
de consigner des définitions.
Ce guide vous aidera à comprendre comment nous sommes arrivés à ce stade et à suivre le chemin
emprunté par la gouvernance de données. Avant, cela faisait référence à un projet de conformité limité.
Aujourd'hui, il s'agit d'un projet incontournable pour chaque entreprise. Ce guide présente les défis
qui vous attendent et explique comment l'automatisation et le Machine Learning peuvent vous aider
à les relever. Bien qu'il prenne en compte les leçons du passé, il se tourne assurément vers l'avenir
et explique de manière détaillée ce que les entreprises doivent faire différemment pour survivre.
Examinons tout cela de plus près.
Gouvernance de données : un rôle qui évolue rapidementQue voulons-nous dire lorsque nous déclarons que le rôle de la gouvernance de données
évolue rapidement ? À bien des égards, la gouvernance de données n'a cessé d'évoluer depuis
sa création. Toutefois, les exigences auxquelles nous faisons face actuellement l'ont contraint
à se métamorphoser à un rythme beaucoup plus rapide. En raison de la quantité importante
des données et de leur généralisation, ainsi que des attentes croissantes en matière de flexibilité
et de délai de commercialisation, votre entreprise ne pourra pas être compétitive si vous ne
disposez pas de capacités de gouvernance de données.
Figure 1 - De l'origine à la révolution de l'intelligence
Origine ExpansionRévolution
de l'intelligence
4
« Les données du XXIe siècle sont comparables au pétrole au XVIII siècle : il s'agit d'un atout précieux dont le potentiel reste à exploiter. À l'instar du pétrole, ceux qui comprennent la valeur fondamentale des données et qui apprennent à l'extraire et à l'utiliser auront d'énormes avantages ».
— Joris Tonders, Yonogo
Origine
Les approches traditionnelles de la gouvernance de données se sont manifestées sous la forme
d'une série de contrôles et de restrictions. Il s'agissait de mesures mises en place principalement
pour bloquer les personnes susceptibles de mal gérer les données et de générer des risques pour leur
entreprise. Des réglementations étaient souvent à l'origine de ces efforts. Celles-ci étaient axées sur
le respect de règles spécifiques en vue d'atténuer les risques, au lieu de générer de la valeur métier.
Cette approche présentait l'inconvénient de ne pas être reliée aux résultats de l'entreprise.
Par conséquent, seules la portée des réglementations et l'activité de l'équipe chargée des
opérations de gouvernance de données pouvaient être mesurées. Les efforts déployés restaient
cloisonnés et ne s'étendaient pas au reste de l'entreprise. Le fonctionnement quotidien de celle-ci
était donc à peine affecté.
Expansion
L'expansion de la portée des réglementations a coïncidé avec une reconnaissance croissante de
l'intérêt des données fiables, ce qui a élargi les points de vue concernant la gouvernance de données
et son utilité. Avec un recentrage sur les intentions et les processus, les réglementations sont
devenues plus vastes et ont commencé à ne plus se limiter à de simples dispositions techniques.
En parallèle, le monde a pris conscience des avantages susceptibles de découler des données si elles
étaient réellement comprises et devenaient une ressource pour les entreprises qui les possèdent.
Le volume d'efforts requis pour régir les données ne pouvait plus être justifié uniquement par
la nécessité d'une conformité réglementaire. Cependant, ce contexte a permis de faire avancer
la question de la valeur des données. « Nous devons investir en faveur de la conformité, faisons
de même pour la transformation digitale ». Pour y arriver, les méthodes ont dû être adaptées :
• Compréhension de l'entreprise : besoin d'impliquer le plus grand nombre de personnes, et non
juste quelques-unes
• Visions connectées : obligation de ne pas se limiter aux données pour obtenir des
contextualisations et tirer des avantages
• Génération de résultats : nécessité d'avoir la volonté de ne pas simplement se restreindre
à l'application des normes de gouvernance
Figure 2 - Gouvernance axée sur la valeur - Le monde a évolué
5
1 Livre blanc IDC, sponsorisé par Seagate, Data Age 2025: The Digitization of the World From Edge to Core, novembre 20182 https://www.nbcnews.com/business/business-news/apple-now-worth-2-trillion-making-it-most-valuable-company-n1237287
Révolution de l'intelligence
Au cours de cette phase d'expansion, il est apparu clairement que les techniques manuelles de
gestion des données ne suffiraient plus. Il était essentiel que la gouvernance de données puisse
évoluer grâce à l'automatisation et accélère ainsi les résultats en optimisant la contribution
humaine. Tout comme les machines ont révolutionné les techniques de fabrication aux XVIIIe
et au XIXe siècle, l'intelligence artificielle et le Machine Learning ont commencé à transformer
notre façon d'envisager la gestion des données au XXIe siècle. Cette période peut être considérée
comme notre révolution de l'intelligence en matière de données.
• Quand ? Maintenant. Les données ont souvent été considérées comme le « nouveau pétrole »
depuis l'avènement d'Internet, celui-ci ayant contribué à leur importance grandissante. Le fait
de reconnaître les données comme une ressource a joué un rôle majeur dans la révolution de
l'intelligence des données. Si vous venez de commencer, vous êtes déjà en retard, et le problème
ne fera que s'aggraver tant que vous ne le maîtriserez pas. Si des données fiables sont notre
meilleur atout et si la sphère de données mondiale atteint 175 zettaoctets d'ici 2025,1 vous allez
devoir agir sans attendre, simplement pour suivre le rythme.
• Qui ? Tout le monde. Il est universellement admis que les sociétés doivent se fonder sur les
données, mais ce sont celles qui sont en avance sur leur temps qui en tirent déjà des bénéfices.
Parmi les 10 entreprises les plus importantes au monde, 7 doivent leur succès aux données. Apple
en est le parfait exemple : en août 2020, la société était la première à atteindre 2 billions de dollars.2
Personne ne peut plus se permettre d'ignorer qu'il est primordial d'être « data-driven » (autrement dit,
axé sur les données).
• Comment ? Aussi vite que possible. Il faudra plus que de la volonté humaine et du dévouement
pour rattraper les entreprises leaders en la matière. Il sera nécessaire d'associer l'objectif visé
à l'intelligence artificielle et au Machine Learning. L'ampleur croissante du phénomène a limité
l'impact du travail manuel. Vous devrez utiliser des techniques d'automatisation juste pour
garder le rythme, à mesure que les données évoluent. Cela ne veut pas dire que les machines
peuvent faire tout le travail. La clé consiste à déterminer jusqu'à quel point les machines peuvent
compléter les activités actuelles de vos salariés et à continuer à repousser cette limite.
Figure 3 - Révolution de l'intelligence
6
« Aujourd'hui, plus de 5 milliards de consommateurs interagissent avec les données chaque jour. D'ici 2025, ils seront 6 milliards, soit 75 % de la population mondiale. En 2025, chaque personne connectée aura au moins une interaction de données toutes les 18 secondes. Bon nombre de ces interactions seront dues aux milliards d'appareils IoT connectés dans le monde entier, ce qui devrait générer plus de 90 Zo de données en 2025. »
— « The Digitization of the
World from Edge to Core »
David Reinsel, John Gantz,
John Rydning1
La révolution de l'intelligence s'accélère grâce à la gestion des données. Et comme tout à l'ère
du digital, elle se produit beaucoup plus rapidement que jamais.
• Automatisation : l'automatisation des activités de gouvernance de données est essentielle aujourd'hui.
Il s'agit d'exécuter, à l'aide de la technologie, des actions manuelles simples de gouvernance de
données. Cela commence par un petit nombre de tâches d'analyse, de profilage, d'indexation, etc.,
puis concerne un volume effectivement illimité.
• Inférence : l'automatisation engendre de grandes quantités d'informations dans nos outils de
gouvernance de données. Si l'automatisation est utile pour gérer de tels volumes, l'inférence
nous aide à en extraire du sens et de la valeur. Il est essentiel de pouvoir établir des liens entre
ces ressources et de fournir une vue cohérente et globale.
• Coordination : à mesure que les capacités de ML et d'IA se développent, les entreprises ont
une meilleure compréhension de leur personnel, tant au niveau de sa contribution que de ses
besoins pour mener à bien ses missions. Il existe une forte tendance à connecter de manière
dynamique des communautés et des données/informations afin d'améliorer les performances,
l'efficacité et la créativité.
• Collaboration : à mesure que l'IA et le ML continuent de se développer, nous allons accroître les
capacités de nos homologues logiciels et la confiance que nous leur accordons au point d'en
faire des collaborateurs importants, tout en assurant l'évolutivité et la coordination.
Qu'est-ce que la gouvernance de données intelligente ?La gouvernance de données intelligente est la seule solution viable concernant la révolution des
données. Elle prend en charge les quantités et les types de données en constante expansion que
les entreprises doivent gérer. La partie intelligence est essentielle, car les méthodes manuelles
de gouvernance de données ne permettent pas de gérer efficacement de tels volumes et types de
données. Cette section du livre blanc examinera trois défis clés pour tout programme de gouvernance
de données et la manière dont la gouvernance de données intelligente peut vous aider à les relever.
Figure 4 - Gouvernance de données intelligente
7
Défi 1 : tâches manuelles
Le premier et le plus urgent des défis que vous allez rencontrer lorsque vous essaierez de contrôler les
données d'une entreprise moderne est l'échelle à laquelle vous devez opérer et la résistance de nombreux
salariés à ce sujet. Traditionnellement, la gouvernance de données est considérée comme une tâche
très manuelle. Elle exige que des personnes de toute l'entreprise se réunissent afin de regrouper leurs
connaissances collectives et leurs idées, bien souvent pour n'en retirer que peu d'avantages.
Certaines sociétés ont plus de 50 millions de dossiers. Il faudrait des ANNÉES simplement
pour compter jusqu'à 50 millions, sans parler de la documentation manuelle des dossiers.
L'automatisation est le seul moyen de gérer des quantités de données aussi importantes.
Solution : automatisation évolutive
Le défi des tâches manuelles est le plus souvent surmonté lorsque les personnes comprennent les
avantages qui découlent de l'initiative de gouvernance de données. Si une partie du travail peut être
automatisée afin que les avantages soient bien supérieurs aux efforts demandés, chacun sera prêt
à participer. Par conséquent, la clé pour relever ce défi n'est pas de demander trop de temps à vos
salariés pour accomplir le travail le plus difficile, mais seulement les tâches qui ne peuvent vraiment
pas être automatisées.
Par exemple, s'il existe un expert sur un système particulier parmi les salariés d'une entreprise,
l'approche traditionnelle de la gouvernance de données impliquerait que celui-ci indique tout ce qu'il
sait sur chaque aspect de ce système afin d'essayer de créer un dictionnaire de données complètes.
Dans le cadre d'une approche basée sur l'intelligence, la machine ferait le gros du travail en premier.
Il existe beaucoup de points communs qui ne se limitent pas à votre entreprise. Par exemple, presque
toutes les sociétés détiennent des données personnelles, des noms, des adresses, des numéros
de téléphone, des informations de carte de crédit. Pourquoi ne pas commencer par demander
à la machine de les identifier pour vous ? Les schémas courants et les types de données récurrents,
ainsi que la mise en correspondance des noms, peuvent fournir un important volume d'informations
avant même qu'un expert n'ait à intervenir. Et lorsque celui-ci prendra part au processus, il ne partira
pas de zéro : il affinera et peaufinera les résultats obtenus. C'est une perspective beaucoup plus
attrayante. Cette approche permet d'économiser des centaines d'heures de travail. De plus, l'expert
est plus susceptible de rester intéressé par le projet de gouvernance de données et de le soutenir.
Défi 2 : complexité
Le deuxième défi majeur de la gouvernance de données est la complexité même du projet, car nous
cherchons à gérer plus de types de données que jamais et à utiliser ces connaissances dans plusieurs
disciplines pour obtenir de nombreux résultats opérationnels. Certaines approches traditionnelles de
la gouvernance de données impliquent la mise en place d'un modèle entièrement ouvert pour consigner
les types de ressources et leurs relations les unes avec les autres. Cela peut sembler intéressant
en théorie, car les personnalisations appliquées vous permettront de consigner tout nouveau type
de données que vous devez prendre en compte. Cependant, des implémentations concrètes nous
ont montré que cette approche génère bien plus de problèmes que de solutions, et qu'elle est
à l'origine d'un niveau de complexité dans la gouvernance de données qui la rend ingérable.
3 https://www.mckinsey.com/business-functions/mckinsey-digital/our-insights/designing-data-governance-that-delivers-value
8
« Lorsque les gens sont enthousiastes et engagés sur la création de valeur à partir des données, ils sont plus susceptibles de contribuer à garantir la qualité et la sécurité des données ».
— McKinsey3
Solution : cohérence
Au lieu d'ajouter sans cesse de nouvelles catégories à un cadre en constante expansion, essayez
d'utiliser une vue d'ensemble plus fiable, en vous appuyant sur les types et les relations afin d'obtenir
la précision dont vous avez besoin sans réinventer la roue en permanence. Les éléments de base
d'une entreprise sont relativement constants, quel que soit le secteur ou le cas d'usage : termes
de glossaires, systèmes, stratégies, processus, etc. Pour obtenir une vue d'ensemble précise
du fonctionnement de votre entreprise, vous devez les décomposer et les connecter entre eux.
Si l'automatisation et l'intelligence sont importantes pour vous, la cohérence doit être
une priorité.
Certains cadres de gouvernance de données disposent de capacités de personnalisation
illimitées, ce qui encourage chaque client à créer ce qui lui convient le mieux. Cependant,
comment peuvent-ils innover et utiliser l'automatisation pour leurs clients alors que les
bases sont différentes dans chaque cas ?
Plus vous conservez de cohérence, plus vous pourrez tirer parti de l'intelligence, de l'automatisation
et du Machine Learning. La complexité de la gestion des données peut facilement devenir écrasante.
Par conséquent, au lieu de créer un type de ressource pour chaque nouvelle idée, recherchez des
points communs parmi les différences.
• Un rapport est-il fondamentalement différent d'un autre ensemble de colonnes ?
• Une catégorie de données personnelles représente-t-elle vraiment plus qu'un domaine de glossaire
regroupant des termes ensemble ?
• Un responsable du traitement des données/sous-traitant est-il vraiment plus qu'une entité
juridique ayant une relation particulière avec les données personnelles dans un processus ?
• Ce qui correspond à un résultat opérationnel dépendant des ressources de données peut-il être
également considéré comme une capacité de ces ressources ?
• Les API sont-elles si différentes des interfaces entre les systèmes qu'elles ne pourraient pas être
considérées comme un type identique ?
Défi 3 : Efforts isolés
Le troisième défi majeur auquel sont confrontés les projets de gouvernance de données aujourd'hui
est leur isolement par rapport au succès général de l'entreprise. Comme nous l'avons vu, au « début »,
la gouvernance des données était plus une question de création d'artefacts que d'ajout de valeur.
Elle était donc perçue comme relevant de la responsabilité d'une équipe particulière, qui était plus
susceptible de vous importuner pour une définition que de vous aider à accomplir votre travail
quotidien. Alors que les besoins en matière de gouvernance ont changé et que la portée de celle-ci
s'est développée de manière considérable, de nombreuses sociétés l'envisagent désormais comme
quelque chose de plus important. Voici des exemples :
• Excellence des données
• Intelligence des données
• Stratégie de données
• Autonomisation par les données
9
Cette évolution doit être plus qu'un simple changement de nom. Des visions connectées et intégrées
issues de différentes disciplines sont nécessaires pour actualiser les objectifs métiers avec lesquels
la gouvernance est associée.
Solution : modèle extensible
Comment lutter contre cette vision de la gouvernance de données ? Changer le nom n'est pas
une mauvaise idée, mais changer l'impact est une meilleure idée. La gouvernance de données
(ou l'excellence des données, l'autonomisation par les données ou tout autre terme que vous souhaitez
employer) doit être axée sur la compréhension de l'activité, au lieu de simplement l'exposer. De plus,
elle doit fournir aux dirigeants des informations fiables. S'ils peuvent faire confiance aux données,
ils peuvent faire confiance à l'analyse et aux décisions prises à l'aide de ces données. L'objectif final
ne doit pas être de mettre à jour des définitions périodiquement, mais d'apporter des changements
réels et de rassembler différentes disciplines afin de permettre à votre entreprise de gérer ses données.
Figure 5 - Gouvernance de données intelligente
Qu'est-ce qui ne change pas après la révolution ?Beaucoup de choses ont changé depuis la révolution de l'intelligence des données. La façon dont
nous procédons et mettons en œuvre les processus est bien sûr affectée, car nous sommes
maintenant en mesure de confier une grande partie du travail routinier aux machines. Cependant,
il y a beaucoup de choses qui sont également restées les mêmes, comme les principes et le cadre
de base sur lesquels nous fondons nos programmes de gouvernance. Examinons ce qui est resté
identique avant de nous pencher sur les différences.
10
Les principes de base de la gouvernance de données sont les mêmes
• Misez sur l'engagement et l'adoption avant tout
Tout programme de gouvernance de données réussit ou échoue en fonction de l'adoption de
ses pratiques par les salariés. Vous pouvez élaborer le plus grand système de documentation
de tous les temps, mais si personne ne l'utilise, il est automatiquement inutile. En outre, tout
ne peut pas être automatisé. Donc si vous ne faites par régulièrement appel à des contributions
manuelles, votre documentation ne restera pas la « meilleure » longtemps. Cela n'a pas changé
avec la révolution intelligente des données, car l'adoption et l'utilisation humaines sont encore
essentielles.
• Voyez les choses en grand, mais commencez modestement
Comme nous l'avons vu, la gouvernance des données est une démarche importante, mais cela
ne signifie pas que vous devez tout faire en même temps. Il est logique de s'attaquer à un projet
ou à un domaine spécifique et de démontrer les avantages pour faire avancer la mission. Cependant,
il est nécessaire de garder vos objectifs finaux à l'esprit même si vous commencez modestement.
Ce n'est pas parce que vous vous concentrez sur un projet particulier au début que les parties
prenantes de celui-ci doivent s'emballer. Si l'objectif final est une solution d'entreprise, il est sage
de rester assez ouvert afin d'attirer des intervenants autres que ceux du groupe concerné.
• Soyez guidé par l'utilisation pratique
Il n'est pas nécessaire de prendre toutes les décisions avant de commencer votre processus de
gouvernance. La paralysie d'analyse peut vous empêcher d'avancer pendant des mois. Si vous
souhaitez vous assurer que les choses sont parfaites avant de « démarrer », vous ne pourrez peut-
être jamais commencer. Permettez aux collaborateurs de dresser un graphique de connaissances
ensemble, afin d'enrichir seulement ce qui a besoin de l'être au lieu de chercher à tout contrôler.
Si quelque chose ne fonctionne pas correctement et que vous l'utilisez, vous en entendrez parler.
Si quelque chose ne marche pas, mais que vous ne l'utilisez pas, quelle importance ? Laissez les
aspects pratiques décider des priorités.
• Favorisez l'ampleur plutôt que la profondeur
Bien que vous n'ayez pas besoin de tout mettre en place le premier jour, il est judicieux d'intégrer une
structure étendue à votre projet. Si vous commencez par exposer les grandes lignes, les personnes
spécialisées dans ces domaines peuvent combler les lacunes, s'il y a lieu. Ainsi, elles peuvent avoir
une structure de base à partir de laquelle développer des points ou sur laquelle collaborer. Il n'est
pas nécessaire d'aller dans les moindres détails dès le départ.
• Ne modélisez pas
La modélisation des données est une activité utile (dans son domaine), mais essayer de créer
un modèle de données strict qui s'adapte parfaitement à tout dans l'ensemble d'une entreprise
est une bataille perdue. Soyez flexible dans vos projets de gouvernance, laissez les personnes
rassembler des informations de manière logique et compréhensible pour 99 % de votre public.
Ne laissez pas des règles strictes entraver les progrès concrets.
La mise en place de changements culturels est toujours essentielle
Comme l'engagement et l'adoption concernant la gouvernance de données représentent toujours
une préoccupation majeure, la mise en place de changements culturels au sein de votre entreprise
reste une activité essentielle. D'une certaine façon, cela devrait être plus facile que jamais avec
la prise en charge de l'automatisation, car il n'est plus nécessaire de demander aux contributeurs
de consigner minutieusement toutes leurs connaissances.
11
À la place, vous leur demandez simplement de compléter ce qui a été découvert par la technologie
avec des informations qui ne figurent dans aucune base de données, à savoir les connaissances liées
à la pratique courante de leur travail. Pour ce faire, vous devez intégrer les pratiques de gouvernance
dans leur quotidien, en favorisant le changement culturel dans l'ensemble de l'entreprise en 3 étapes :
1. Mental : être soutenu
• Identifier les facteurs/obstacles à l'engagement
• Susciter l'intérêt de toutes les personnes concernées
• Proposer des avantages afin de favoriser un changement de comportement
• Relever les défis de manière directe
2. Corps : procéder au changement
• Les petits changements génèrent de grandes modifications
• Répéter les étapes jusqu'à ce que les modifications deviennent la norme
• Commencer simplement ; les activités difficiles peuvent venir plus tard
• Soutenir les projets puis les diriger ; les faire perpétuer
3. Esprit : veiller à la réussite du projet
• Renforcer les convictions lors des moments de fléchissement inévitables
• Communiquer de manière générale pour que les progrès soient visibles
• Mettre en place des encouragements continus concernant le travail quotidien des utilisateurs
• Développer des communautés pour renforcer la résilience
• Examiner et valider à nouveau le projet pour un soutien durable
Les questions sont identiques
25 questions que vous vous posez TOUJOURS à propos de vos données :
Que veulent-elles dire ?
Comment sont-elles structurées ?
Où puis-je les trouver ?
Pourquoi les ai-je ?
Qui en est responsable ?
Comment doivent-elles être utilisées ?
Comment sont-elles utilisées ?
Comment ont-elles été utilisées par le passé ?
Ont-elles été transformées depuis leur
date de création ?
Comment puis-je les modifier/mettre à jour ?
Qui les supervise ?
Sont-elles de bonne qualité ?
Comment sont-elles transférées entre
les sites ?
À quelle partie de l'entreprise sont-elles
associées ?
Quels sont les objectifs finaux qu'elles visent ?
Qui y a accès au sein de l'entreprise ?
Qui y a accès en dehors de l'entreprise ?
Où ont-elles été collectées ?
Sont-elles correctement protégées ?
Leur conservation représente-t-elle un risque
de conformité pour l'entreprise ?
À quelles réglementations sont-elles
soumises ?
Quels sont les processus clés qui
en dépendent ?
Quel serait l'impact en aval de leur
modification ?
Qui devrait être informé avant de les
modifier ?
Leur stockage apporte-t-il des avantages
à mon entreprise ?
12
Comme vous pouvez le constater, les objectifs sont très similaires. Nous cherchons toujours
à développer la compréhension et la confiance dans toute l'entreprise concernant notre paysage de
données, ainsi qu'à gérer la façon dont cela concorde avec notre activité. Le seul changement, c'est
la façon dont nous y parvenons. Il existe de nombreuses techniques automatisées que nous pouvons
utiliser maintenant pour alléger les efforts en matière de gouvernance. L'étape suivante consistera
à déterminer comment les exploiter au mieux, en réduisant le travail des gestionnaires de données
et en optimisant le temps qu'ils doivent consacrer à des missions infiniment plus importantes.
Le cadre de gouvernance est cohérent
La dernière chose à prendre en compte, et qui n'a pas changé, ce sont les éléments de base que
nous utilisons pour contrôler les données en premier lieu. Le fait que notre méthode de collecte
des informations ait évolué dans certains domaines ne signifie pas que les informations que nous
recueillons ne sont pas cohérentes.
Figure 6 - Cadre de gouvernance
Que devons-nous faire différemment ? Mettre en œuvre la gouvernance de données intelligenteMarquage automatisé des métadonnées
Avant : méthode manuelle
• Qui réalisait la tâche ? Experts du système
• Comment ? Navigation dans les bases de données, puis affichage des titres des colonnes
et des données qu'elles contiennent afin de classer le type de données d'une colonne spécifique
• Pourquoi s'agissait-il d'un problème ? Cette classification des données prenait beaucoup de
temps. Les experts ne pouvant interrompre leurs missions quotidiennes, ce travail constituait
une tâche de fond qui durait des années. Il s'agissait aussi d'un travail répétitif très ennuyeux,
susceptible de provoquer le désengagement des experts.
Après : méthode automatisée
• Qui réalise la tâche ? La majeure partie du travail est réalisée par les algorithmes de la technologie,
avec une certaine curation et la contribution spécialisée des experts selon les besoins
• Comment ? Les solutions de gouvernance intelligente utilisent la mise en correspondance
des noms, des règles prédéfinies et des techniques de propagation de similarité pour étiqueter
automatiquement les données analysées en fonction des définitions d'entreprise
• Pourquoi est-ce une réelle transformation ? Une grande partie des mises en correspondance peut
être réalisée en fonction de règles standard sans contribution manuelle. La curation des experts
vient en complément. Cela leur prend une fraction du temps qu'ils auraient passé auparavant
et produit des résultats plus riches.
13
Figure 7 - Mise en correspondance
Application automatisée de la qualité
Avant : méthode manuelle
• Qui réalisait la tâche ? Techniciens chargés de la qualité des données
• Comment ? Création d'une règle pour chaque contrôle QD qui doit être mesuré
• Pourquoi s'agissait-il d'un problème ? Même si une société ne voulait vérifier que 1 000 points
de données, avec 5 règles chacun, cela créait tout de même 5 000 règles. En réalité, ces chiffres
sont BEAUCOUP plus élevés, et l'effort manuel nécessaire est ingérable.
Après : méthode automatisée
• Qui réalise la tâche ? L'entreprise décide de ce qu'elle souhaite mesurer à grande échelle
• Comment ? Les solutions de qualité intelligentes s'appuient sur les données étiquetées mentionnées
ci-dessus pour réaliser les contrôles de qualité appropriés partout où se trouve un concept
de données particulier
• Pourquoi est-ce une réelle transformation ? Si les efforts pour obtenir une qualité de référence
sont moindres, vous pouvez établir des bases étonnantes pour identifier la qualité de vos données.
Ne plus exiger de tâches manuelles dans le cadre de la gouvernance favorise la réussite
des projets, car les parties prenantes retirent d'importants avantages à y participer.
Figure 8 - Suivi des KDE à grande échelle
Trouvé et étiqueté en fonction du nom
de la colonne
Trouvé et étiqueté en fonction du nom
abrégé de la colonne
Trouvé et étiqueté en fonction du tableau XREF
contenant les numéros de téléphone locaux
allemands
Trouvé et étiqueté en fonction
d'expressions régulières :
07948 ; 555 ; 717
Trouvé et étiqueté en fonction
de la similarité avec le champ
étiqueté
Numéro de téléphone
020 7484 7893
+44 7984 239234
01 47 05 49 15
Num. tél.
01398 323 306
(541) 754-3010
0208 675 8223
DEUTSCHE_TE
(541) 763-3540
(541) 754-3010
(541) 783-3333
FIELD 42
(555) 3424324
07948 234 438
(717) 432-4432
divers
020 7484 7893
+44 7984 239234
01 47 05 49 15
14
Automatisation des notifications de modifications
Avant : méthode manuelle
• Qui réalisait la tâche ? Gestionnaires du système (le cas échéant)
• Comment ? Notifications des consommateurs en aval lorsqu'un champ a été ajouté ou modifié
• Pourquoi s'agissait-il d'un problème ? Souvent, les modifications effectuées localement ne donnaient
lieu à aucune mise à jour de la documentation pour les systèmes en aval. Si la documentation était
mise à jour, cela impliquait des mises à jour manuelles pour tous les schémas de traçabilité.
Après : méthode automatisée
• Qui réalise la tâche ? Outils d'analyse intelligents
• Comment ? Les outils d'analyse intelligents ne sont pas exécutés seulement une fois et ne supposent
pas que le paysage des données ne changera pas, ils sont exécutés périodiquement et informent
les parties prenantes concernées des différences entre les analyses
• Pourquoi est-ce une réelle transformation ? Les activités de gouvernance liées à l'ajout ou
à la modification de colonnes peuvent être déclenchées sans intervention manuelle. Ainsi, la vue
d'ensemble de l'état actuel de la traçabilité ne devient pas obsolète/inexacte au fil du temps.
Automatisation du déclenchement des workflows
Avant : méthode manuelle
• Qui réalisait la tâche ? Gestionnaires de données
• Comment ? Surveillance des problèmes de gouvernance de données et signalement manuel
de ces derniers
• Pourquoi s'agissait-il d'un problème ? Les gestionnaires de données devaient examiner
manuellement tous les artéfacts consignés de façon périodique pour s'assurer qu'ils répondaient
aux attentes. Cette situation générait une importante surcharge de travail inutile pour des
avantages limités.
Après : méthode automatisée
• Qui réalise la tâche ? Les outils de gouvernance intelligents déclenchent automatiquement
les workflows selon les besoins.
• Comment ? Vous allez décider quels types de modifications nécessitent ou non un examen
et appliquer l'automatisation à l'avenir.
• Pourquoi est-ce une réelle transformation ? Les gestionnaires de données n'ont plus besoin
de parcourir les artéfacts ni d'avoir des conversations inutiles avec les parties prenantes afin
de savoir si une définition a été modifiée. Les parties prenantes sont désormais habilitées à agir,
ce qui permet d'accroître leur participation en tant que contributeurs, ainsi que de s'assurer que
les validations et les contrôles appropriés sont toujours respectés.
Figure 9 - Rôles
Rôle
s
8 : P
ropr
iéta
ire
des
défin
ition
s
du g
loss
aire
8 : G
estio
nnai
re
du g
loss
aire
Début
Évaluation
ApprobationApprouver ?
Remanier
Communiquer
Implémenter
Rejeté
Approuvé
Fin
X
15
Automatisation du provisionnement des données
Avant : méthode manuelle
• Qui réalisait la tâche ? Techniciens chargés des données
• Comment ? Pour chaque demande d'accès aux données Ad hoc, une ressource technique
devait collecter les données et les fournir au demandeur
• Pourquoi s'agissait-il d'un problème ? La quantité de demandes d'accès aux données a tellement
augmenté ces dernières années que cela est devenu ingérable. Il est également devenu presque
impossible d'appliquer de bonnes pratiques de gouvernance en raison du grand nombre de
demandes Ad hoc.
Après : méthode automatisée
• Qui réalise la tâche ? Propriétaires de données
• Comment ? Ils peuvent choisir de publier leurs meilleures ressources de données à des fins
d'utilisation et d'automatiser le provisionnement de ces données dans de bonnes circonstances
• Pourquoi est-ce une réelle transformation ? Les demandes d'accès aux données peuvent
désormais être centralisées et suivies correctement, tandis que certains éléments de leur
diffusion peuvent être automatisés. En raison des restrictions de sécurité, ce processus n'est
pas approprié dans toutes les situations. Cependant, si les conditions requises sont remplies,
celui-ci peut être géré beaucoup plus facilement, ce qui permet aux Data Scientists de passer
moins de temps à rechercher des données et plus de temps à les utiliser.
Quels sont les avantages de la gouvernance de données intelligente du point de vue de l'entreprise ?Ce livre blanc démontre qu'aucune entreprise ne peut se permettre d'ignorer la nécessité d'avoir une
gouvernance de données intelligente. Nous avons vu comment les méthodes se sont développées
de plus en plus rapidement. Bien que certains principes liés à la gouvernance perdurent, les modalités
pratiques de son utilisation ont fondamentalement changé en raison de son champ d'application
actuel. Cependant, elle ne doit pas être considérée comme une menace ou une obligation, mais plutôt
comme une occasion incroyable de bénéficier d'un nombre considérable d'avantages opérationnels.
Grâce à l'approche évolutive et automatisée de la gouvernance de données, vous pouvez évoluer
au même rythme que les changements qui surviennent au sein de l'entreprise tout en conservant
l'autonomie de celle-ci. Au lieu de vous évertuer à consigner des évènements déjà survenus et de
toujours tenter de rattraper votre retard, l'automatisation Informatica® vous permet d'avoir une vue
d'ensemble de l'état actuel en temps réel, des vues globales de la traçabilité des données aux vues
globales de la qualité des données.
Avec une approche cohérente de la gouvernance de données, vous pouvez toujours innover
et automatiser au fil du temps. Toute entreprise disposant d'un cadre standardisé peut tirer des
enseignements de ses clients et continuer à améliorer ses produits en raison de la cohérence
de la conception et des données recueillies quant à leur utilisation. Informatica peut faire de même,
car nous nous appuyons sur un cadre de gouvernance de données agile et fiable. Nous n'incitons
pas à avoir recours à une personnalisation sans fin, avec laquelle l'automatisation n'est pas possible.
16
© Copyright Informatica LLC 2020. Informatica et le logo Informatica sont des marques commerciales ou des marques déposées d'Informatica LLC aux États-Unis et dans d'autres pays. La liste des marques commerciales d'Informatica est disponible sur le Web, à l'adresse https://www.informatica.com/fr/trademarks.html. Les autres noms de sociétés et de produits sont la propriété de leurs détenteurs respectifs et peuvent avoir fait l'objet d'un dépôt de marque. Les informations contenues dans ce document sont susceptibles d'être modifiées sans préavis. Elles sont fournies « telles quelles », sans aucune garantie d'aucune sorte, expresse ou implicite.
IN09_1120_03993
L'approche extensible de la gouvernance de données vous permet de créer une vue centralisée
commune de vos paysages des données, opérationnels et technologiques, qui peut ensuite être
approfondie si nécessaire. La plate-forme d'Informatica va bien au-delà des préoccupations de
gouvernance. Elle vous permet de comprendre ce que vous avez découvert, d'agir en conséquence
et de prendre des mesures concrètes (de l'amélioration de la qualité et de la confidentialité de vos
données à leur maîtrise) pour qu'en fin de compte, vous puissiez toujours vous fier à vos données.
ConclusionLa gouvernance de données intelligente n'est pas quelque chose que vous pouvez réaliser tout seul.
Il s'agit de rassembler un grand nombre de capacités et de véritablement comprendre comment
celles-ci fonctionnent ensemble. Pour atteindre le niveau d'automatisation et de connectivité évoqué
ici, vous devez envisager plus qu'une solution ponctuelle. La gouvernance de données dépend du
catalogage, de la qualité et de la confidentialité des données. Bien qu'aucun produit ne puisse résoudre
tous ces problèmes pour vous, il existe une plate-forme capable d'aider les équipes de votre entreprise
(de la direction à la production, en passant par le service marketing) et de leur donner des moyens
d'action en vue d'améliorer la productivité, les performances et l'utilisation efficace des données.
Informatica France Tour CB 21, 16 Place de l'Iris, 92040 Paris La Défense Cedex Tél : +33 01 42 04 89 00 Numéro gratuit aux États-Unis : 1.800.653.3871
top related