atelier 2 - comment utiliser l’analyse de données pour lutter contre … · 2017. 1. 17. ·...
TRANSCRIPT
Atelier 2 - Comment utiliser l’analyse de données
pour lutter contre la fraude
(salle de conférences CC6)
Conférence internationale des bonnes pratiques de lutte contre la fraude à l’ère du numérique - 6 décembre 2016
Conférence internationale des bonnes pratiques de lutte contre la fraude à l’ère du numérique - 6 décembre 2016
Déroulement de l’atelier
Retours d’expériences (1h) :
- Collecte des données,
- Data vizualisation, social network analysis,
- Data analytics (data mining, text mining).
Pause café / thé (15 min.)
Groupes de réflexion (1h)
Synthèse (15 min.)
Conférence internationale des bonnes pratiques de lutte contre la fraude à l’ère du numérique - 6 décembre 2016
Retour d’expériences
Gavin UGALE (OCDE) « L’innovation des pays de l’OCDE en « data analytics »
Juan Antonio ELENA GARCIA (Ministère de l'Emploi et de la Sécurité sociale, Espagne)
Miguel Angel CABO GARCIA (Trésorerie Générale de la Sécurité Sociale, Espagne),
Sophie KUZNIAC, Gaël KERMARREC (SPF Sécurité sociale, Inspection sociale, Belgique)
Yannic HULOT (Conseiller général, SPF finances, Belgique)
Jean-Louis TAUZIN (Pôle Emploi, France)
Aude COURNEE (Caisse Nationale d’Allocations Familiales, France)
Philippe SCHALL (Direction Générale des Finances Publiques, France)
Daniel ANSELLEM (Administrateur des données, Ministère de l’Intérieur, France)
Paul VINCKE (DG, European Healthcare Fraud & Corruption Network)
Gavin Ugale
Policy Analyst
Division of Public Sector Integrity
Gavin Ugale
Policy Analyst
Division of Public Sector Integrity
Gavin Ugale
Policy Analyst
Division of Public Sector Integrity
7
8
9
10
11
Analyse de données et lutte contre la fraude :
l’expérience de la DG Inspection Sociale
Conférence internationale des bonnes pratiques en matière de lutte contre la fraude
pour un gouvernement ouvert à l’ère du numérique
Paris
6 décembre 2016
Sophie [email protected]ël [email protected]
Pas d’infractions
Différences entre ces
employeurs ?
Data Mining
Traduction métier: Profils à risque
Infractions
1. Analyse de données
Automatisation
2. Automatisation
2. Automatisation
16
3. Expérience 2015 - 2016
• Adoption outil� 180 utilisateurs fréquents � 1225 listes/mois
• Enquêtes d’initiative� 25% à 33% dans les secteurs prioritaires (bâtiment,
hôtellerie, …)
• Conduite empirique� Gains significatifs� Orientation & bonnes pratiques
Yannic HULOT
Conseiller général à l’Inspection spéciale des impôts (Belgium)
Conférence internationale sur les bonnes pratiques digitales en
matière de lutte contre la fraude (Paris 6 déc. 2016) OCDE/DNLF
Inspection Spéciale des Impôts
FISCUS EN OPENBAAR MINISTERIE, PARTNERS IN DE STRIJ D TEGEN DE FISCALE FRAUDE FISC ET MINISTERE PUBLIC, PARTENAIRES DANS LA LUTTE CONTRE LA FRAUDE FISCALE
Inspection Spéciale des Impôts
• Inspection spéciale des impôts (ISI) en Belgique: compétente pour tous les impôts et autorité compétente (coop. Internat.)
• Expérience « Analytics » depuis 2002
• Genèse du data mining pour le phénomène carrousel
• Quasi éradication (1100 millions vers 30-40 millions)
• Commission Parlementaire de 2009� ‘Généraliser le système qui existe pour les carrousels TVA afin d’identifier plus rapidement les
nouveaux phénomènes de fraude’, Recommand. n°53
• 2012 POC simulation d’extranéité (BEPS)
• Données : Directives/Leaks/données internes/…
• Une dizaine de projets en cours actuellement (ISI)
Inspection Spéciale des Impôts
Environnement et difficultés
• Protection de la vie privée• Accès aux données• Protection des données• RH : une carrière de dataminer ?• IT – Dataminer – Métier• Entreposage• Production/réaction/contraintes• Logiciels
Inspection Spéciale des Impôts
Environnement et opportunités
• Enjeu financier• Place du digital• Transparence (Commissaire Moscovici)• Transparence sans outils adaptés ?• « Trop de données tue l’information » FAUX !• Faire parler les données• Projet transversal• Création de connaissance
Pôle emploi
Deux cas d’utilisation
de data mining et de text mining
Exemple d’une interface d’analyse qui met en évidence les relations entre des entités sans lien évident apriori.On relève des liens entre individus, ainsi que des liens entre individus et employeurs qui permettentd’identifier des cas de fraudes en réseau.
La visualisation par le data mining pour investiguer des fraudes aux allocations
L’auditeur fraude affiche la visualisation produite sur la base de quelques critères :des demandeurs d’emploi percevant des allocations chômage, dans le domaine du BTP, sur des entreprises de moins de 50 salariés, depuis 2008, …
La visualisation présente chronologiquement les faits :ouverture des droits, création de la société, etc.
Les faits et acteurs concernés apparaissent avec des couleurs scorées (vert-orange–rouge) en fonction d’incohérencespotentielles (absence de déclaration d’intention d’embauche, travail sur des périodes où l’entreprise n’existait pas,société fictive, etc.)
Les étoiles de cette constellation mettent en évidence des points d’alerte parce qu’ils sont communs à plusieurs individus: nom, RIB, adresse, NIR, email, téléphone, etc.
L’information affichée précise si la situation est active ou si sa période de validité est close.
Quand on sélectionne une information, on fait apparaître l’historique de cette information : changements successifs deRIB, d’adresse, ce qui n’est pas affiché usuellement au poste de travail et qui apporte des indices complémentaires.
L’investigation est accélérée, facilitée et met en évidenc e des acteurs impliqués avec les anomalies qui lesconcernent.
La visualisation par le data mining pour investiguer des fraudes aux allocations
Le text mining pour identifier des offres d’emploi impliquées dans du recyclage de chèques volés
Le text mining pour identifier des offres d’emploi impliquées dans du recyclage de chèques volés
Pôle emploi est confronté à une problématique de fraudes lors de certaines offres d’emploi pour des “aides à la personne” :� Les offres sont « correctes » dans leur contenu : les offres d’emploi publiées par Pôle emploi sont légales, non discriminatoires,
correctement rédigées ; des contrôles automatisés et des validations des conseillers entreprises contribuent à cela.� Et pourtant… Pôle emploi est pris à parti par des demandeurs d’emploi, car quelques « recruteurs » amènent certains candidats
à avancer de l’argent contre des chèques volés.� Un impact pour les DE, mais aussi pour les conseillers … qui annulent les annonces incriminées, recherchent les centaines de
personnes qui ont été en contact et les préviennent.
Le pari de Pôle emploi est de considérer que ces offres sont identifiables dès lors que l’une d’entre elles est connue, car un style derédaction des offres existe et est identifiable.La cible est très précise : identifier les offres dont le style est identique (mots utilisés, juxtaposition des mots, orthographe,ponctuation, majuscules, etc.)Usuellement, Pôle emploi utilise des informations précises qui caractérisent les offres: le type d’emploi, la date de dépôt de l’offre,etc. Il s’agit de compléter ces informations par le recours au texte libre de l’annonce elle-même.
Le travail de préparation a été dédié à préciser :� le cas très ciblé sur lequel porter l’analyse plutôt que de rechercher de multiples enseignements tels que : « avoir un classement
des offres selon de nouveaux critères », ou « détecter des situations propices à des risques », etc.� les données qui peuvent être utilisées et à les analyser : principalement celles qui correspondent à des définitions précises ou
celles qui comportent du texte libre.
Résultat : 99,6% des offres frauduleuses pré-ident ifiées par Pôle emploi sont retrouvées de façon aut omatique.
Le text mining pour identifier des offres d’emploi impliquées dans du recyclage de chèques volés
Aude Cournée, Sous-directrice
Direction du réseau-Département MDR et Lutte
contre la fraude
Mardi 6 décembre 2016
Aude Cournée, Sous-directrice
Direction du réseau-Département MDR et Lutte
contre la fraude
Mardi 6 décembre 2016
Le data mining, un outil de ciblage
efficace des contrôles
Pourquoi avoir utilisé la technique de data
mining ?
Pourquoi avoir utilisé la technique de data
mining ?
Quels enseignements tirer de la mise en place
du data mining ?
Quels enseignements tirer de la mise en place
du data mining ?
Quelles perspectives pour le
data mining en Branche Famille ?
Quelles perspectives pour le
data mining en Branche Famille ?
Avec le data mining
Sélection des contrôles scorés (plus un
dossier a de critères communs avec
les dossiers risqués, plus il est scoré)
Rendement des contrôles sur place en
2016: 81%
Avant le data mining
Sélection des contrôles par requêtes
simples ou sur la base de
signalements internes
Rendement des contrôles sur place <
30%
Pourquoi avoir utilisé la technique du data
mining ?
Mode-projet :
1 Caf pilote + 1 expérimentation d’un an
Les points d’attention
Communication interne: c’est quoi le data mining?
Temps de montée en charge: Des rendements qui ont progressé dans
le temps et de manière hétérogène selon les Caf
Les résultats:
. Des contrôles mieux ciblés: taux d’impact financier qui augmentent de 50
à 81% sur 2012-2016
. Davantage de fraudes détectées : x 2 en 3 ans.
Quels enseignements tirer de la mise en
place du data mining ?
Critères de réussite :
Une mise en place centralisée
Des objectifs de contrôles Data mining fixés aux Caf
Un accompagnement du réseau
Une actualisation des modèles (en 2016)
L’introduction de variables externes
Le recours au data mining sur
d’autres champs : data
mining métier, accès aux droits
Quelles perspectives pour le
data mining en Branche Famille ?
Conférence internationale des bonnes pratiques de lutte contre la fraude à l’ère du numérique - 6 décembre 2016
Conférence internationale des bonnes pratiques de lutte contre la fraude à l’ère du numérique - 6 décembre 2016
Conférence internationale des bonnes pratiques de lutte contre la fraude à l’ère du numérique - 6 décembre 2016
Conférence internationale des bonnes pratiques de lutte contre la fraude à l’ère du numérique - 6 décembre 2016
Conférence internationale des bonnes pratiques de lutte contre la fraude à l’ère du numérique - 6 décembre 2016
Conférence internationale des bonnes pratiques de lutte contre la fraude à l’ère du numérique - 6 décembre 2016
38
Comment utiliser l’analyse de données pour lutter contre la fraude ?
Atelier 2 – CC06 partie I
Paul VinckeManaging Director EHFCN
Paris, OECD6 December 2016
39
Healthcare Fraud, Corruption and Waste in
Europe: National and Academic Perspectives
April 2017
April 2017
Main Area of Concern
Fraudulent overconsumption in dental practice:
- Restorative dental care on the same tooth on the same
patient in the same year: > 10% of all the proceedings
invoiced
- Duration of the proceedings : > P200
40
3 fraud measurement exercises on fraudulent
overconsumption in dental practice
• Belgium
• Germany
• UK
41
42
Conférence internationale des bonnes pratiques de lutte contre la fraude à l’ère du numérique - 6 décembre 2016
Groupes de réflexion
1. Quels enseignements retenez-vous des
interventions ?
- Aspects technologiques,
- Management de projet,
- Conduite du changement,
- Portage politique…
(20 min.)
Conférence internationale des bonnes pratiques de lutte contre la fraude à l’ère du numérique - 6 décembre 2016
Groupes de réflexion
2. Quelles actions seriez-vous amené(e) à
engager dans votre entité ?
(20 min.)
Conférence internationale des bonnes pratiques de lutte contre la fraude à l’ère du numérique - 6 décembre 2016
Groupes de réflexion
3. Selon vous, quelle est LA priorité pour
mener à bien un projet de lutte contre la
fraude basé sur les nouvelles technologies ?
(20 min.)
Conférence internationale des bonnes pratiques de lutte contre la fraude à l’ère du numérique - 6 décembre 2016
Synthèse
Priorité retenue
par chaque groupe de réflexion
(15 min.)