chapitre 0 gÉnÉralitÉs - e-monsitefahmi-benrejab.e-monsite.com/medias/files/01-generalites...le...

23
1 FBR. ISG. 2019 Advanced data warehouse Mastère Professionnel Data science for business FBR. ISG. 2019 Fahmi Ben Rejab CHAPITRE 0 GÉNÉRALITÉS Année universitaire 2019/2020

Upload: others

Post on 28-May-2020

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: CHAPITRE 0 GÉNÉRALITÉS - e-monsitefahmi-benrejab.e-monsite.com/medias/files/01-generalites...Le site de recherche d’emploi Glassdoor a élu le travail de Data Scientisten première

1FBR. ISG. 2019

Advanced data warehouse

Mastère Professionnel Data science for business

FBR. ISG. 2019

Fahmi Ben Rejab

CHAPITRE 0

GÉNÉRALITÉS

Année universitaire 2019/2020

Page 2: CHAPITRE 0 GÉNÉRALITÉS - e-monsitefahmi-benrejab.e-monsite.com/medias/files/01-generalites...Le site de recherche d’emploi Glassdoor a élu le travail de Data Scientisten première

2FBR. ISG. 2019

SOURCE Gestion de projet Informatique

Mastère Pro. DSB

http://fahmi-benrejab.e-monsite.com/

Page 3: CHAPITRE 0 GÉNÉRALITÉS - e-monsitefahmi-benrejab.e-monsite.com/medias/files/01-generalites...Le site de recherche d’emploi Glassdoor a élu le travail de Data Scientisten première

Le cours Entrepôt de données avancés est destiné

aux administrateurs des bases de données ou futurs

data scientist,

ou tout autre acteur mené à structurer

et/ou

analyser , jouer avec les données volumineuses

3FBR. ISG. 2019

OBJECTIF Gestion de projet Informatique

Mastère Pro. DSB

Page 4: CHAPITRE 0 GÉNÉRALITÉS - e-monsitefahmi-benrejab.e-monsite.com/medias/files/01-generalites...Le site de recherche d’emploi Glassdoor a élu le travail de Data Scientisten première

©2012 Jaspersoft Corporation. Proprietary and Confidential 4

Page 5: CHAPITRE 0 GÉNÉRALITÉS - e-monsitefahmi-benrejab.e-monsite.com/medias/files/01-generalites...Le site de recherche d’emploi Glassdoor a élu le travail de Data Scientisten première

Le site de recherche d’emploi Glassdoor a élu le travail de Data Scientist

en première position de son top 25 des meilleurs métiers du monde.

Selon l’étude menée par Glassdoor, le salaire annuel moyen d’un Data

Scientist s’élève à 116 840 dollars.

De 45K€ pour un profil junior, jusqu’à 120K €/an,

Le Chief Data Scientist peut gagner jusqu’à 180K €/an.

Les opportunités d’embauche sont nombreuses et largement supérieures

à la quantité de profils qualifiés. Fin, janvier Glassdoor dénombrait

ainsi 1736 offres d’emploi.

5

« PORTRAIT » D’UN DATA SCIENTIST

FBR. ISG. 2019

Gestion de projet Informatique

Mastère Pro. DSB

Page 6: CHAPITRE 0 GÉNÉRALITÉS - e-monsitefahmi-benrejab.e-monsite.com/medias/files/01-generalites...Le site de recherche d’emploi Glassdoor a élu le travail de Data Scientisten première

6

« PORTRAIT » D’UN DATA SCIENTIST

FBR. ISG. 2019

Gestion de projet Informatique

Mastère Pro. DSB

Page 7: CHAPITRE 0 GÉNÉRALITÉS - e-monsitefahmi-benrejab.e-monsite.com/medias/files/01-generalites...Le site de recherche d’emploi Glassdoor a élu le travail de Data Scientisten première

7FBR. ISG. 2019

il s’agit également d’un poste à haute responsabilité, qui nécessite des

prédispositions naturelles et une éducation de haut niveau.

Gla

ssd

oo

r,

Jan

vie

r 2018

« PORTRAIT » D’UN DATA SCIENTIST Gestion de projet Informatique

Mastère Pro. DSB

Page 8: CHAPITRE 0 GÉNÉRALITÉS - e-monsitefahmi-benrejab.e-monsite.com/medias/files/01-generalites...Le site de recherche d’emploi Glassdoor a élu le travail de Data Scientisten première

8

« PORTRAIT » D’UN DATA SCIENTIST

FBR. ISG. 2019

Gestion de projet Informatique

Mastère Pro. DSB

Page 9: CHAPITRE 0 GÉNÉRALITÉS - e-monsitefahmi-benrejab.e-monsite.com/medias/files/01-generalites...Le site de recherche d’emploi Glassdoor a élu le travail de Data Scientisten première

9FBR. ISG. 2019

Multidisciplinaire

« PORTRAIT » D’UN DATA SCIENTIST Gestion de projet Informatique

Mastère Pro. DSB

Page 10: CHAPITRE 0 GÉNÉRALITÉS - e-monsitefahmi-benrejab.e-monsite.com/medias/files/01-generalites...Le site de recherche d’emploi Glassdoor a élu le travail de Data Scientisten première

10FBR. ISG. 2019

Une formation d’analyste

88% des Data Scientists sont diplômés au minimum d’un master

46% d’entre eux sont titulaires d’un doctorat

32% sont issus d’une formation dans le domaine des mathématiques et des statistiques

30% ont étudié les sciences informatiques

16% proviennent d’écoles d’ingénieurs.

« PORTRAIT » D’UN DATA SCIENTIST Gestion de projet Informatique

Mastère Pro. DSB

Page 11: CHAPITRE 0 GÉNÉRALITÉS - e-monsitefahmi-benrejab.e-monsite.com/medias/files/01-generalites...Le site de recherche d’emploi Glassdoor a élu le travail de Data Scientisten première

11FBR. ISG. 2019

Le Data Scientist doit avoir des connaissances en statistiques

Avoir au minimum des notions de calculs statistiques.

Ces connaissances lui permettront de déterminer la bonne technique d’approche et

d’analyse pour chaque donnée.

Capacité à réaliser des analyses prédictives et statistiques à partir des différentes bases de

données,

« PORTRAIT » D’UN DATA SCIENTIST Gestion de projet Informatique

Mastère Pro. DSB

Page 12: CHAPITRE 0 GÉNÉRALITÉS - e-monsitefahmi-benrejab.e-monsite.com/medias/files/01-generalites...Le site de recherche d’emploi Glassdoor a élu le travail de Data Scientisten première

12FBR. ISG. 2019

Le Data Scientist doit maîtriser des outils analytiques

Une connaissance approfondie d’au moins un outil analytique tel que SAS, R,

est en général exigée.

« PORTRAIT » D’UN DATA SCIENTIST Gestion de projet Informatique

Mastère Pro. DSB

Page 13: CHAPITRE 0 GÉNÉRALITÉS - e-monsitefahmi-benrejab.e-monsite.com/medias/files/01-generalites...Le site de recherche d’emploi Glassdoor a élu le travail de Data Scientisten première

13FBR. ISG. 2019

Le Data Scientist doit maîtriser Les langages de programmation

Les postes de Data Scientist requièrent la maîtrise d’au moins un langage de programmation.

Le plus couramment employé est Python, mais il peut être remplacé par Java, Perl ou

C/C++.

« PORTRAIT » D’UN DATA SCIENTIST Gestion de projet Informatique

Mastère Pro. DSB

Page 14: CHAPITRE 0 GÉNÉRALITÉS - e-monsitefahmi-benrejab.e-monsite.com/medias/files/01-generalites...Le site de recherche d’emploi Glassdoor a élu le travail de Data Scientisten première

14FBR. ISG. 2019

Savoir des notions de Machine Learning

Connaitre quelques méthodes de Machine Learning peut être un réel atout pour la création

d’un produit dirigée par les données.

Les différentes techniques peuvent être directement implémentées à l’aide des librairies R ou

Python, il n’est pas indispensable de savoir comment fonctionnent leurs algorithmes.

L’important est de comprendre leur fonctionnement dans les grandes lignes et de savoir quelle

méthode est la plus pertinente selon la situation.

« PORTRAIT » D’UN DATA SCIENTIST Gestion de projet Informatique

Mastère Pro. DSB

Page 15: CHAPITRE 0 GÉNÉRALITÉS - e-monsitefahmi-benrejab.e-monsite.com/medias/files/01-generalites...Le site de recherche d’emploi Glassdoor a élu le travail de Data Scientisten première

15FBR. ISG. 2019

La programmation en SQL

Hadoop et les bases de données NoSQL se sont largement imposés dans le domaine du Big

Data.

La plupart des recruteurs exigent des candidats la maîtrise de la programmation en SQL pour

pouvoir formuler et exécuter des requêtes.

Le SQL tend à redevenir le langage prédominant dans le Big Data en 2020

« PORTRAIT » D’UN DATA SCIENTIST Gestion de projet Informatique

Mastère Pro. DSB

Page 16: CHAPITRE 0 GÉNÉRALITÉS - e-monsitefahmi-benrejab.e-monsite.com/medias/files/01-generalites...Le site de recherche d’emploi Glassdoor a élu le travail de Data Scientisten première

16FBR. ISG. 2019

La gestion de données non structurées

Savoir gérer des données non structurées. Ces données sont le principal challenge du Big Data.

Savoir traiter les données comportant des imperfections, telles que des valeurs manquantes ou

des chaînes de format incohérentes.

Cette compétence est particulièrement importante au sein des entreprises n’étant pas

habituées à l’analyse de données.

« PORTRAIT » D’UN DATA SCIENTIST Gestion de projet Informatique

Mastère Pro. DSB

Page 17: CHAPITRE 0 GÉNÉRALITÉS - e-monsitefahmi-benrejab.e-monsite.com/medias/files/01-generalites...Le site de recherche d’emploi Glassdoor a élu le travail de Data Scientisten première

17FBR. ISG. 2019

Des compétences en ingénierie logicielle

Permettront notamment de prendre en charge le développement d’un produit dirigé par les

données

« PORTRAIT » D’UN DATA SCIENTIST Gestion de projet Informatique

Mastère Pro. DSB

Page 18: CHAPITRE 0 GÉNÉRALITÉS - e-monsitefahmi-benrejab.e-monsite.com/medias/files/01-generalites...Le site de recherche d’emploi Glassdoor a élu le travail de Data Scientisten première

18FBR. ISG. 2019

La curiosité intellectuelle

La curiosité intellectuelle est indispensable

pour détecter les données les plus intéressantes et exploitables au sein d’un gigantesque

volume de data.

Pour mener à bien le travail de Data Scientist, il est nécessaire d’être créatif et de poser ses

propres questions plutôt que de simplement répondre à celles qui se posent.

« PORTRAIT » D’UN DATA SCIENTIST Gestion de projet Informatique

Mastère Pro. DSB

Page 19: CHAPITRE 0 GÉNÉRALITÉS - e-monsitefahmi-benrejab.e-monsite.com/medias/files/01-generalites...Le site de recherche d’emploi Glassdoor a élu le travail de Data Scientisten première

19FBR. ISG. 2019

Le Data Scientist doit avoir le sens de la communication

Communiquer ses découvertes techniques aux autres intervenants,

Son rôle est d’aider les décideurs à prendre les bonnes décisions, en leur fournissant les

informations nécessaires.

Comprendre les problèmes des autres équipes

« PORTRAIT » D’UN DATA SCIENTIST Gestion de projet Informatique

Mastère Pro. DSB

Page 20: CHAPITRE 0 GÉNÉRALITÉS - e-monsitefahmi-benrejab.e-monsite.com/medias/files/01-generalites...Le site de recherche d’emploi Glassdoor a élu le travail de Data Scientisten première

20FBR. ISG. 2019

Page 21: CHAPITRE 0 GÉNÉRALITÉS - e-monsitefahmi-benrejab.e-monsite.com/medias/files/01-generalites...Le site de recherche d’emploi Glassdoor a élu le travail de Data Scientisten première

21FBR. ISG. 2019

Etude des données en possession de l’entreprise qui permettront de définir

• les données qui seront extraites

• La manière de traiter les données

en accord avec les exigences de la direction

Récupération et analyse des données pertinentes liées au processus de

production de l’entreprise, à la vente ou encore liées aux données client…

Construction d’algorithmes permettant d’améliorer les résultats de recherches et

de ciblage,

Élaboration de modèles prédictifs afin d’anticiper l’évolution des données et

tendances relatives à l’activité de l’entreprise,

Modélisation des résultats d’analyse des données pour les rendre lisibles et

exploitables par les managers,

Principales missions du data scientist

« PORTRAIT » D’UN DATA SCIENTIST Gestion de projet Informatique

Mastère Pro. DSB

Page 22: CHAPITRE 0 GÉNÉRALITÉS - e-monsitefahmi-benrejab.e-monsite.com/medias/files/01-generalites...Le site de recherche d’emploi Glassdoor a élu le travail de Data Scientisten première

22FBR. ISG. 2019

Recommandations business auprès de la direction générale afin d’améliorer la

prise de décision.

Ce travail d’interprétation des données pourra également se faire au travers de la

création d’un tableau de bord spécifique et/ou logiciel sur mesure analysant les

données traitées. La création de métriques d’aide à la décision pourra avoir une

influence conséquente sur la stratégie de l’entreprise.

Principales missions du data scientist

« PORTRAIT » D’UN DATA SCIENTIST Gestion de projet Informatique

Mastère Pro. DSB

Page 23: CHAPITRE 0 GÉNÉRALITÉS - e-monsitefahmi-benrejab.e-monsite.com/medias/files/01-generalites...Le site de recherche d’emploi Glassdoor a élu le travail de Data Scientisten première

Thank You