données pour la datascience : opérer une sélection ou se lancer tous azimuts ?

23
4, rue Chauveau-Lagarde - 75008 Paris - Tél : 01 44 51 72 72 - Fax : 01 44 51 72 73 www.institutdesactuaires.com Convictions des cabinets Solucom et solvINS Laurence Al Neimi – Stéphane Chappellier Données pour la Data Science : Opérer une sélection ou se lancer tous azimuts ?

Upload: stephane-chappellier

Post on 15-Apr-2017

639 views

Category:

Data & Analytics


1 download

TRANSCRIPT

Page 1: Données pour la DataScience : opérer une sélection ou se lancer tous azimuts ?

4, rue Chauveau-Lagarde - 75008 Paris - Tél : 01 44 51 72 72 - Fax : 01 44 51 72 73www.institutdesactuaires.com

Convictions des cabinets Solucom et solvINSLaurence Al Neimi – Stéphane Chappellier

Données pour la Data Science :Opérer une sélection ou se lancertous azimuts ?

Page 2: Données pour la DataScience : opérer une sélection ou se lancer tous azimuts ?

4, rue Chauveau-Lagarde - 75008 Paris - Tél : 01 44 51 72 72 - Fax : 01 44 51 72 73www.institutdesactuaires.com

IntroductionBig Data : une alchimie à trouver pour transformerla donnée en mine d’or…

Le BIG DATA ouvre un large champ despossibles…

§ Sources de données en nombrecroissant§ Evolution exponentielle des volumes de

données§ L’identification des signaux faibles

devient de plus en plus crédible

Mais plusieurs contraintes à l’exploitationde cette manne d’informations…

§ Techniques

§ Financières

§ Opérationnelles

…nécessitent de trouverun compromis

Page 3: Données pour la DataScience : opérer une sélection ou se lancer tous azimuts ?

4, rue Chauveau-Lagarde - 75008 Paris - Tél : 01 44 51 72 72 - Fax : 01 44 51 72 73www.institutdesactuaires.com

Données pour la Data Science :Opérer une sélection ou se lancer tous azimuts ?

3

1 L’utilisation des sources de données dans lachaîne de valeur de l’Assurance

Notre approche : « Think Big, Try Small » 2La démarche en rupture au service de

la valorisation de la donnéeRetour d’expérience EDF

Page 4: Données pour la DataScience : opérer une sélection ou se lancer tous azimuts ?

4, rue Chauveau-Lagarde - 75008 Paris - Tél : 01 44 51 72 72 - Fax : 01 44 51 72 73www.institutdesactuaires.com

Reconsidérer l’assurance à l’aune desnouvelles connaissances

ü Identifier les comportements anormauxü Identifier les informations déclaratives falsifiéesü Réduire le coût de la fraude

ü Affiner les modèlesü Proposer une tarification personnalisée et interactiveü Proposer une offre adossée aux usages et parcours de vie

ü Réduire les taux d’attritionü Cibler l’effort de prospectionü Individualiser la proposition client

ü Mettre en adéquation les moyensü Estimer le degré d’urgence afin de prioriser les traitements

ü Accompagner le client de manière globaleü Restituer aux clients des informations sur eux-mêmes

L’impact du Big Data est une opportunité pour plusieurs fonctionstout au long de la chaîne de valeur.

Concevoir des produitsConstruire une tarification

1

Connaître ses clientsson marché

2

Lutter contre la fraude

3

Gérer les sinistres

4

Proposer des services

5

Page 5: Données pour la DataScience : opérer une sélection ou se lancer tous azimuts ?

4, rue Chauveau-Lagarde - 75008 Paris - Tél : 01 44 51 72 72 - Fax : 01 44 51 72 73www.institutdesactuaires.com

S’investir dans une démarche DataPourquoi ?

1Repenser son Business Model

Repenser son Business Model& Entreprendre la bonne démarche

Le secteur de l’Assurance entreprend un virage sans précédentpour opérer un repositionnement. Le secteur est en recherche desolutions en rupture.

4 L’Assurance a besoin de nouveaux relais de croissance4 La Data va être au cœur de la solution et sera le vecteur de la

nécessaire transformation. 2Entreprendre la bonne démarcheLa construction d’une démarche expérimentale sans conscience

des opportunités va limiter les repositionnements et la portée desexpérimentations.

4 Une prise de conscience des opportunités offertes par la Data permetde servir la vision stratégique.

Page 6: Données pour la DataScience : opérer une sélection ou se lancer tous azimuts ?

4, rue Chauveau-Lagarde - 75008 Paris - Tél : 01 44 51 72 72 - Fax : 01 44 51 72 73www.institutdesactuaires.com

Sortir du cadreMettre le Big Data au service de l’expérience client

THE CLIMATE CORPORATION :Le Big Data conduit à intégrer l’assurance

météo agricole dans une démarche servicielle

§ Une entreprise fondée en 2006§ Par David Frieberg, un vétéran de

Google§ Rachetée par Monsanto

§ Un nouveau modèle de serviced’assurance en ligne

§ Destiné au monde agricole§ Prévention des risques

météorologiques

§ Optimiser la sélection des semences§ Optimiser l’organisation des semis§ Optimiser les conditions de récolte

Qui

PLUS VALUE

§ La plateforme technologique développée par The Climate Corporationpermet de réaliser une combinaison des trois techniques suivantes :

§ La surveillance et le recueil hyper-local des conditionsmétéorologiques, ce grâce à l’utilisation de capteurs implantés dansles champs

§ La modélisation des données agricoles§ Des simulations météo en haute résolution

§ …Afin de mettre à disposition des agriculteurs, via le site « climate.com »,une solution visant à améliorer leur activité.

§ Le dédommagement de l’agriculteur est automatisé en cas d’événementmal anticipé.

Quoi

Pourquoi

Page 7: Données pour la DataScience : opérer une sélection ou se lancer tous azimuts ?

4, rue Chauveau-Lagarde - 75008 Paris - Tél : 01 44 51 72 72 - Fax : 01 44 51 72 73www.institutdesactuaires.com

Données pour la Data Science :Opérer une sélection ou se lancer tous azimuts ?

3

1 L’utilisation des sources de données dans lachaîne de valeur de l’Assurance

Notre approche : « Think Big, Try Small » 2La démarche en rupture au service de

la valorisation de la donnéeRetour d’expérience EDF

Page 8: Données pour la DataScience : opérer une sélection ou se lancer tous azimuts ?

4, rue Chauveau-Lagarde - 75008 Paris - Tél : 01 44 51 72 72 - Fax : 01 44 51 72 73www.institutdesactuaires.com

Ouvrir le champ des possiblesComment ?

Chercherl’inspiration

Qualifier lafaisabilité

Développer desinnovations

Recenser et prioriser lessources de données possibles

Analyse des sources prioritaires

Idéation sur les cas d’usage possibles

Page 9: Données pour la DataScience : opérer une sélection ou se lancer tous azimuts ?

4, rue Chauveau-Lagarde - 75008 Paris - Tél : 01 44 51 72 72 - Fax : 01 44 51 72 73www.institutdesactuaires.com

Les sources du Big Datasont nombreuses et de natures différentes

DonnéesPartenaires

Donnéesinternes

DonnéesSemi -

Publiques

Donnéescollectées

Sources

Dat

a.go

uv.fr

INSE

ESI

V

Prog

ram

me

TV

AGIRA

Calendrier scolaire

Ope

nD

ata

RéférentielsPostaux

Base ARGOSVéhicules volés

Crim

inal

ité(C

arto

cim

e)ORIAS

Comparateurs

Rés

eaux

depr

esta

taire

s

Déclarationssociales desentreprises

Rapports d’expertise Acteursde

l’achatm

édia

RéseauxProfessionnelsde Santé Q

ualificateursd’audience

Annonceurs

Expe

rts,

Car

ross

iers

CRM

:Co

ntac

ts,

Dem

ande

s,Ac

tions

Aven

ants

Démographie desentreprises

Constats

CaractéristiquesclientsDevis

Garanties

Produits

Déclarations desinistres

Cont

rats

Prestations

Obj

ets

conn

ecté

s

Cookies

denavigation

Capteurs de laSmart City

Google MapGoogle trend

Boitier OBD-I Véhicule

Boitier Habitation/ Domotique

Réseaux sociaux

Bracelet / Balance/ Tensiomètre

PollutionTraficMétéo

Compteur et BoxIntelligents

L’analyse du degré d’exploitabilité et du degré d’intérêtdes données est un prérequis.

Page 10: Données pour la DataScience : opérer une sélection ou se lancer tous azimuts ?

4, rue Chauveau-Lagarde - 75008 Paris - Tél : 01 44 51 72 72 - Fax : 01 44 51 72 73www.institutdesactuaires.com

Favoriser l’idéationLes éléments clefs

Émergence des idées

Management des idées

> Cartographier :quelles sources de

données ?

> Cibler :à quelles sources de

données avoir recours ?

> Analyser : quels usagesenvisager pour ces

sources de données ?

Insp

iratio

nId

éatio

n

> Élaborer : quels casd’usage pour ces sources

de données ?

Expé

rimen

tatio

n Management des projets

Identifi-cation

descas

d’usage

Page 11: Données pour la DataScience : opérer une sélection ou se lancer tous azimuts ?

4, rue Chauveau-Lagarde - 75008 Paris - Tél : 01 44 51 72 72 - Fax : 01 44 51 72 73www.institutdesactuaires.com

La proposition de 4 étapes clefs conciliantcréativité et pragmatisme

Hiérarchiser lessources de données

• Réalisation d’unematrice SWOT pourchacune des sources etcibler l’étude

• Validation des sourcescibles à analyser

CIBLER ANALYSER

Obtenir une notationd’exploitabilité et

d’intérêt des sourcesciblées

• Analyse des sourcesretenues sur la based’un jeu de données

• Qualificationfonctionnelle ettechnique des sources

ELABORER

Cadrer des casd’usages au regard

des étapes 2 et 3

• Définition des casd’usage possibles

• Proposition d’une feuillede route

Obj

ectif

s Ouvrir le champ despossibles en terme

de sources dedonnées,

sans a priori

• Cartographie la plusexhaustive possible dessources de données

• Catégorisation selonles branchesd’assurance etles usages

CARTOGRAPHIER

Rés

ulta

ts

Page 12: Données pour la DataScience : opérer une sélection ou se lancer tous azimuts ?

4, rue Chauveau-Lagarde - 75008 Paris - Tél : 01 44 51 72 72 - Fax : 01 44 51 72 73www.institutdesactuaires.com

CARTOGRAPHIERUne première étape cleflaissant entrevoir le champ des possibles

UsageProduits

Conception et PricingCRM

Interactif et PrédictifFraudes

DétectionSinistres

GestionServices

Développement

Conduite

Habitation

Santé &Bien-être

BienVieillir

PrévoyanceEmprunteur

RetraiteAssur. Vie

Entreprises

Données CRM & avenantsBoitier OBD-IISIV, INSEE, CartocrimeDonnées partenaires (DARVA),comparateurs Pass-navigo - VelibDonnées CRM, PrestationsBox Domotique/Compteur intelligentINSEE, Cartocrime, GéolocalisationDonnées Smart City, Météo FranceDonnées partenaires, comparateurs

Données CRM, PrestationsObjets connectés : bracelets,balances, tensiomètres…SNIIRAM, INSEE,Données partenaires, comparateurs

Données CRM / Boitier OBD-IITraces internet : changement devéhicules, mutation professionnelle…Données comparateurs

Données CRMAGIRA, ArgosBoitier OBD-IIRéseaux sociaux

Données CRMSIV, INSEE, CartocrimeDonnées partenairesBoitier OBD-II

Données CRMRéseaux sociaux / Traces internetDonnées partenaires, comparateursBoitier OBD-II

Données CRM / Box / CompteurTraces internet : changement delogement, mutation professionnelle…Données comparateursDonnées Smart City

Données CRMBox domotique/Compteur intelligentRéseaux sociauxMétéo, Google Map…

Données CRM,Géolocalisation, Météo, BdD CCRDonnées partenaires, comparateursBox Domotique/Compteur intelligentDonnées Smart City

Données CRMRéseaux sociaux / Traces internetDonnées partenaires, comparateursBox Domotique/Compteur intelligentDonnées Smart City

Données CRM / Objets connectésTraces internet : nutrition, sport,loisirs…Données comparateursSNIIRAM, INSEE…

Données CRMRéseaux sociauxObjets connectés

Données CRM, analyse prestationsSNIIRAM, INSEE,Données partenaires, comparateursObjets connectés : bracelets,balances, tensiomètres…

Données CRM,Objets connectésSNIIRAM, INSEE,Données partenaires, comparateursDonnées SmartCity

Données CRM, analyse prestationsBox domotique/Compteur intelligentObjets connectésSNIIRAM, INSEE,Données SmartCity

Données CRM,Box domotique/Compteur intelligentObjets connectésTraces internet : centre d’intérêtsDonnées SmartCity

Données CRMBox domotique/Compteur intelligentObjets connectésRéseaux sociaux

Données CRM, analyse prestationsSNIIRAM, INSEE,Box domotique/Compteur intelligentObjets connectésDonnées SmartCity

Données CRMBox domotique/Compteur intelligentObjets connectésRéseauDonnées SmartCity

Données CRM/GestionObjets connectés : bracelets,balances, tensiomètres…SNIIRAM, INSEE,Données partenaires, comparateursAdministration : permis véhicule

Données on-linePole emploiNet-entreprises-fr (DSN)(Géolocalisation )

Données CRM – INSEE – Googlemap

Données CRM – Données on-lineAbonnements Presse spécialiséenumérique : Ex : Capital)

Données on-linePole emploiNet-entreprises-fr (DSN)

INSEE – AGIRA – FICOVIE –AGIRC-ARCO (+ caissescatégorielles)

Données CRM / BdD Euler, Coface…Boitier OBD-II pour flotteObjets connectés « domotique » et« santé » adaptésDonnées Smart City

Données CRMBdD Euler, Coface…Boitier OBD-II et Objets connectésDonnées Smart CityRéseaux sociaux

Données CRMBoitier OBD-II et Objets connectésRéseaux sociaux

Données CRMBoitier OBD-II et Objets connectésRéseaux sociaux

Données CRMBdD Euler, Coface…Boitier OBD-II et Objets connectésRéseaux sociaux

Associé à Santé

AGIRC-ARCO (+caissescatégorielles)Associé à Santé

Données CRM – Données on-lineAbonnements Presse spécialiséenumérique : Ex : Capital)INSEE,

Fonction

Usage

Page 13: Données pour la DataScience : opérer une sélection ou se lancer tous azimuts ?

4, rue Chauveau-Lagarde - 75008 Paris - Tél : 01 44 51 72 72 - Fax : 01 44 51 72 73www.institutdesactuaires.com

CIBLERUn travail de hiérarchisation des donnéesà travers l’analyse SWOT

Une première analyse SWOT (Force, Faiblesse, Opportunité, Menace) parsource de données permet de cibler celles à analyser plus finement.

Données disponibles auprès d’acteurs tiers du secteur Données disponibles (gratuit ou non) auprès de partenaires

Données collectées via internet ou les objets connectés

DONNÉES SEMI-PUBLIQUES DONNÉES PARTENAIRES

DONNÉES COLLECTÉESDONNÉES INTERNES

Données internes à l’entreprise (clients, gestion)

DonnéesPartenaires

Donnéesinternes

DonnéesSemi -

Publiques

Donnéescollectées

Sources

Accès libre

S W

O T

Accès libre Travail à fournir pour yaccéder et l’exploiter

Donnéessous-exploitéesDifférenciationconcurrentielle

Donnéesnon-exclusives

Timing important

S W

O T

Données propriétairesAccessibilité facile

Données parfoisnon structuréesnon conservées

Données exclusivesAccès impossible

pour les concurrents-

S W

T

Donnéespointues/spécialisées

Potentiel fort pourcontextualiser

Temps et coûtsde négociation avec

les partenaires

O Données trèssous-exploitéesDifférenciationconcurrentielle

Exclusivité parfoispossible à négocier

SAccès aux donnéescomportementales

WCoût et durée dela mise en œuvre

T Acquisitionproblématique -Intrusion dans la

« vie privée »

ODonnées très

sous-exploitéesDifférenciationconcurrentielle

Page 14: Données pour la DataScience : opérer une sélection ou se lancer tous azimuts ?

4, rue Chauveau-Lagarde - 75008 Paris - Tél : 01 44 51 72 72 - Fax : 01 44 51 72 73www.institutdesactuaires.com

ANALYSERL’identification du degré d’exploitabilité et dudegré d’intérêt de chaque source

Intérêt absolu de la donnée : quel est l’intérêt de la donnée utilisée seule ?

Intérêt relatif de la donnée : quel est le degré d’intérêt de la donnée enfonction des données avec lesquels on peut la croiser ?

Coût d’acquisition : Faut-il payer (et combien) pour obtenir la donnée?

#2Degré

d’intérêt

#1Degré

d’exploitabilité

Accès : Comment accède-t-on à la donnée ?- Donnée interne- Par partenariat- En mettant en place des objets connectés- Solution technique d’accès à la donnée (EDI, interface…)

Structure : La donnée est-elle structurée ?

Fiabilité : Quel est le degré de fiabilité de la donnée récoltée ?

Image : Quel est l’impact en terme d’image lié à l’utilisation de cette donnée ?

Technologie : Quelles sont les technologies à mettre en place pourcollecter/analyser/valoriser la donnée ?

Page 15: Données pour la DataScience : opérer une sélection ou se lancer tous azimuts ?

4, rue Chauveau-Lagarde - 75008 Paris - Tél : 01 44 51 72 72 - Fax : 01 44 51 72 73www.institutdesactuaires.com

ELABORERProposition de cas d’usage et cadrage

Investissement pour se positionnerà la source de la donnée

Les cas d’usage et lesdonnées s’avèrent-ils

pertinents ?

OK ?

Quels cas d’usage et quellesdonnées pourraient être

pertinents ?

QUOI ?

Comment collecte-t-on etexploite-t-on ces données ?

COMMENT ?

Que cherche-t-onà connaître ?

POURQUOI ?

Page 16: Données pour la DataScience : opérer une sélection ou se lancer tous azimuts ?

4, rue Chauveau-Lagarde - 75008 Paris - Tél : 01 44 51 72 72 - Fax : 01 44 51 72 73www.institutdesactuaires.com

Données pour la Data Science :Opérer une sélection ou se lancer tous azimuts ?

3

1 L’utilisation des sources de données dans lachaîne de valeur de l’Assurance

Notre approche : « Think Big, Try Small » 2La démarche en rupture au service de

la valorisation de la donnéeRetour d’expérience EDF

Page 17: Données pour la DataScience : opérer une sélection ou se lancer tous azimuts ?

4, rue Chauveau-Lagarde - 75008 Paris - Tél : 01 44 51 72 72 - Fax : 01 44 51 72 73www.institutdesactuaires.com

#PrincipeFondateur @SmartData

§ Exploiter, croiser les donnéesinternes

§ Intégrer des données externes

§ En veillant au respect desdonnées clients

§ Co-construire avec leséquipes opérationnelles

Au-delà du BIG,le SMART

Page 18: Données pour la DataScience : opérer une sélection ou se lancer tous azimuts ?

4, rue Chauveau-Lagarde - 75008 Paris - Tél : 01 44 51 72 72 - Fax : 01 44 51 72 73www.institutdesactuaires.com

Retour d’expérience EDFRésumé de la saison 1

Instance POC BOARD top Direction

Fréquence mensuellePassage en 30 minutes chrono

Présentations concrètes, mini démo,« donner à voir »

POC SmartData

Cadrage de ladémarcheSmart Data

Identification dethématiques dePOC et choix en

ateliers

Novembre Janvier

Réalisation des 5 POC

Juin

Préparation de la saison 2

Appel à idées sur laplateforme Com’In

Une sélectionTop-down & Bottom-up

+

Page 19: Données pour la DataScience : opérer une sélection ou se lancer tous azimuts ?

4, rue Chauveau-Lagarde - 75008 Paris - Tél : 01 44 51 72 72 - Fax : 01 44 51 72 73www.institutdesactuaires.com

Retour d’expérience EDFÉtapes clefs d’un POC Smart Data

ACCOMPAGNEMENT UTILISATEUR

EXPLORATION DATA

Constructiond’une base dedonnées

Etude des donnéesModélisation

Construction d’unoutil/prototype

Expérimentation

REX etcadragepost POC

Cadrage d’expérimentationEtude d’un besoin utilisateur

Ajustements…

Cadrage

Définir les étapes etobjectifs

Durées à titre indicatif sur un POC de 6 mois

2 semaines 2,5 mois 1 mois2,5 mois

Page 20: Données pour la DataScience : opérer une sélection ou se lancer tous azimuts ?

4, rue Chauveau-Lagarde - 75008 Paris - Tél : 01 44 51 72 72 - Fax : 01 44 51 72 73www.institutdesactuaires.com

Retour d’expérience EDFLes Facteurs Clefs de Succès

« Être rigide sur l’agilité »« Être rigide sur l’agilité » Un esprit start-up pour plus d’efficacitéUn esprit start-up pour plus d’efficacité

Prévoir l’après POCet les scenarii de poursuite

Favoriser l’esprit start-up

Garder le capet rester mobilisé sur l’objectif du POC (éviter uneplanification trop chronophage, ne pas embarquerdes sujets annexes…)

Data Board(3-4 personnes)

Fixe, décide etporte l’ambition

Data OpComOriente,

Coordonne,Priorise

Incube et réaliseles POC

Se réunit toutesles 2 semaines

Se réunit toutesles 2 semaines

Data Team

Durée d’un POC :environ 6 mois

++

+

Page 21: Données pour la DataScience : opérer une sélection ou se lancer tous azimuts ?

4, rue Chauveau-Lagarde - 75008 Paris - Tél : 01 44 51 72 72 - Fax : 01 44 51 72 73www.institutdesactuaires.com

ConclusionBig Data,nouveau vecteur de création de valeur…

Un Projet Big Data est avant tout un projet de transformation

Les clés du succès d’un tel projet :« Think big, try small » & « Test and Learn »

Travailler avec des petites équipes pluridisciplinaires en modeAgile / « start-up » est plus adapté aux itérations

La magie du Big Data n’existe pas…

Page 22: Données pour la DataScience : opérer une sélection ou se lancer tous azimuts ?

4, rue Chauveau-Lagarde - 75008 Paris - Tél : 01 44 51 72 72 - Fax : 01 44 51 72 73www.institutdesactuaires.com

Contacts

Laurence AL NEIMIest Manager chez Solucom, en charge du pôled’expertise Assurance avec plus de 15 ansd’expérience sur ce secteur. Elle a dirigé et faitaboutir de nombreux programmes detransformation sur les différentes branchesd’assurance et environnements du secteur(courtage international, bancassureur, assureur,mutuelle).

Stéphane CHAPPELLIERest Associé fondateur de solvINS, spécialisé dansles données issues des objets connectés. Actuairecertifié. Après un début de carrière en compagnie,il a exercé des responsabilités en conseil(notamment, associé-fondateur d’EMB Franceracheté par Towers Watson). Il a encadré desmissions en tarification, provisionnement,modélisation financière et fusion-acquisition enFrance et à l’international.

Mobile : +33 (0)6 13 49 07 92Mail : [email protected]

www.solucom.frwww.solvins.fr

Mobile : +33 (0)6 07 34 98 23Mail : [email protected]

Page 23: Données pour la DataScience : opérer une sélection ou se lancer tous azimuts ?