la gouvernance des donnees - big data paris 2020 · en charge de la gouvernance des données...
TRANSCRIPT
LA GOUVERNANCE DES DONNEES AU SERVICE DE L’AMBITION DATA COMPANY SNCFLE CAS PRATIQUE DE SNCF
Julien IRISDirecteur Mission Data
En charge de la Gouvernance des données
Direction Data & IoT SNCF
e.SNCF
Pourquoi c’est importantUn enjeu vital pour l’attractivité des transports durables
Data + SNCF
CONNECTEURDES TRANSPORTS PUBLICS
CONNECTEUR D’UNE INDUSTRIE DE MASS TRANSIT
210
projets Big Data74
flux de données103
Téraoctets stockés
Pourquoi c’est possibleUn volume et une qualité de données inédites
Data + SNCF
14
30000
99
millions de voyageurs transportés chaque jour en France et dans le monde
km de voies dont 1000 renouvelées par an
millions de billets vendus en ligne par an
Notre défi – Devenir une data CompanyDésiloter les SI et les organisations tout en protégeant les données
Data + SNCF
GDPR
Ouverture concurrence
Open Data
Tiers de
Confiance
VIBRATO
DATA IV
Trois piliers de la Data gouvernancepour servir la stratégie data
Data + Data
GOUVERNANCE DES
DONNÉES
RAPIDITÉ
GOUVERNANCESÉCURITÉ
TRANSVERSALITÉ
RAPIDITE
Des plateformes collaborativespour connecter et standardiser
Data + Data
DATALAKE D’ENTREPRISE
Alimentation à travers les projets Data
CLOUD & API
S’appuie sur des infrastructures / plateformes
BIG DATA & IA
Des compétences pour valoriserles données et soutenir les métiers
NECESSAIRE MAIS PAS SUFFISANT…
TRANSVERSALITEPROCESS SECURITE
Data + Data
CLOUD / BIG DATA
Mobilités Gares & co Réseau SNCF
Data Catalog & Lineage
Search & Use case Lib
Detection & Masking
Registres & Agreements
Roles & Stewardship
Workflow & Rules
GOUVERNANCE DATA
Un exemple Je suis
un responsable métierTER de l’exploitationferroviaire
mettre sous contrôle mon calcul de la régularité et pour cela capitaliser sur les données disponibles
J’ai besoin de
Un exempleTableaux de bord personnalisé par acteur Data
Un exemple Un « Google » interne des métadonnées
Un exempleUn catalogue de jeux de donnéesConsommable suivant les usages
Un exempleUn lignage pour identifier d’où proviennent les données critiques et analyser les impacts liés aux usages
Demande d’accès à la sourceREFERENTIEL
Un exempleUn workflow permettant aux responsables de données et Chief Data Officers de valider les demandes d’accès
Prochaines étapes En coulisses avec Collibra & Rhapsodies
Déploiement d’une offre de services interne (outillage + expertise conseil) mise à disposition des métiers de la SNCF, pour prioriser et déployer les cas d’usage permettant de valoriser le capital Data
FILIERE Gares &
Connexions
GOUVERNANCE :
• Confidentialité• Sécurité C1
METIERLocalisation bornes
wifi en garesLOGIQUE
Localisation des bornes wifi en
gares
SOURCE DE DONNÉES PHYSIQUES Bornes (Arborescence ADLS)
Cas d’usage 1
Cas d’usage 2
Cas d’usage 3
ConclusionLe levier essentiel c’est … l’humain