plateforme bigdata orientée bi avec hortoworks data platform et apache spark

33
Charly CLAIRMONT CTO ALTIC http://altic.org [email protected] @egwada Plateforme Big Data orientée BI avec Hadoop et Spark

Upload: altic-altic

Post on 31-May-2015

268 views

Category:

Technology


2 download

DESCRIPTION

Description de l'architecture bigdata chez Altic Hortonworks HDP Apache Spark InfiniDB Tableau Software JasperReports Birt Talend

TRANSCRIPT

Page 1: Plateforme bigdata orientée BI avec Hortoworks Data Platform et Apache Spark

Charly CLAIRMONTCTOALTIChttp://altic.org

[email protected]@egwada

Plateforme Big Data orientée BI avecHadoop et Spark

Page 2: Plateforme bigdata orientée BI avec Hortoworks Data Platform et Apache Spark

petite bio

Depuis 10 ans Altic

Une évolution permanente avec les technologies suivantes :

Un des animateurs de l'écosystème Hadoop en France

Un groupe de plus en plus actif !(messages échangés sur l'année)

Page 3: Plateforme bigdata orientée BI avec Hortoworks Data Platform et Apache Spark

Altic@Altic_Buzz

Métier

Informatique Décisionnelle

Intégration de données

Valeurs

– Innovations

– Open Source

Une maîtrise de toute la chaîne de valeur du Big Data

Page 4: Plateforme bigdata orientée BI avec Hortoworks Data Platform et Apache Spark

Notre approche historique de la BI

● Intégration de données

– Talend

● Reporting :

– JasperReports,

– Birt

● OLAP :

– Mondrian,

– Jedox

● Portail décisionnel :

– SpagoBI,

– JasperServer

Page 5: Plateforme bigdata orientée BI avec Hortoworks Data Platform et Apache Spark

Tout le monde parle de déluge de données !

Chez Altic nous aimerions déjà décloisonner l'entreprise !

Et lui rappeler qu'elle est une « Entreprise étendue »

Page 6: Plateforme bigdata orientée BI avec Hortoworks Data Platform et Apache Spark

Toute organisation peut désormais avoir son « lac de données »,

construire une vision unifiée de ses clients, ses produits, ses partenaires, ses

processus

Page 7: Plateforme bigdata orientée BI avec Hortoworks Data Platform et Apache Spark

Le standard du Big Data : « Hadoop », et son compagnon par défaut « Spark »

Page 8: Plateforme bigdata orientée BI avec Hortoworks Data Platform et Apache Spark

Hadoop est robuste !

● Stable

– Testé - Yahoo! (40 000 nœuds)

● Fiable

– Tolérant à la panne

● Flexible

– Schéma à la lecture !

– Passage à l'échelle

● Économique

– Prédictibilité des coûts

Page 9: Plateforme bigdata orientée BI avec Hortoworks Data Platform et Apache Spark

Hadoop,système d'exploitation de la donnée

Page 10: Plateforme bigdata orientée BI avec Hortoworks Data Platform et Apache Spark

Vous connaissez ?

Page 11: Plateforme bigdata orientée BI avec Hortoworks Data Platform et Apache Spark

Spark, Simple et rapide

Iter. 1

LectureHDFS

ÉcritureRAM

Iter. 2

LectureRAM

ÉcritureRAM

. . .

LectureHDFS

ÉcritureHDFS

LectureHDFS

ÉcritureHDFS

. . .Iter. 1 Iter. 2

Hadoop Map / Reduce

Spark

Page 12: Plateforme bigdata orientée BI avec Hortoworks Data Platform et Apache Spark

Spark,meilleur compagnon d'Hadoop

Page 13: Plateforme bigdata orientée BI avec Hortoworks Data Platform et Apache Spark

Construire sa plateforme Big Data

Page 14: Plateforme bigdata orientée BI avec Hortoworks Data Platform et Apache Spark

Une architecture BI à l'heure du Big Data

Page 15: Plateforme bigdata orientée BI avec Hortoworks Data Platform et Apache Spark

Collecter, Transformer, avec Talend Big Data

Des jobs Talend Pig !

Des composants toujours plus riches

Page 16: Plateforme bigdata orientée BI avec Hortoworks Data Platform et Apache Spark

Hortonworks HDP, une distribution open source

Page 17: Plateforme bigdata orientée BI avec Hortoworks Data Platform et Apache Spark

Analyser de larges volume de données en SQL avec

InfiniDB

● Sans doute le moteur SQL pour Hadoop le plus performant du moment

Page 18: Plateforme bigdata orientée BI avec Hortoworks Data Platform et Apache Spark

Reporting

● JasperReports

– Connecteur Hive

– Connecteur HBase

– Connecteur Avro

● Birt

– Connecteur pour Hive

Page 19: Plateforme bigdata orientée BI avec Hortoworks Data Platform et Apache Spark

Visualisation, Exploration

Datameer Tableau Software

Via Hive (Odbc, Jdbc)

Page 20: Plateforme bigdata orientée BI avec Hortoworks Data Platform et Apache Spark

Cas d'utilisation

Page 21: Plateforme bigdata orientée BI avec Hortoworks Data Platform et Apache Spark

Oui, mais concrètement...

Page 22: Plateforme bigdata orientée BI avec Hortoworks Data Platform et Apache Spark

– Groupe bancaire de plein exercice

– 3.2 millions de sociétaires et clients

– 9000 salariés

– 84 milliard d'euros de total de bilan (2011)

Hadoop dans le monde bancaire : Crédit Mutuel Arkea

Page 23: Plateforme bigdata orientée BI avec Hortoworks Data Platform et Apache Spark

Hadoop dans le monde bancaire : Crédit Mutuel Arkea

http://www.journaldunet.com/solutions/dsi/big-data-dans-les-dsi/l

● Offrir une meilleure expérience aux utilisateurs

– Les clients peuvent accéder à leur historique de paiements depuis 2001 !

● Dé-silotage l'organisation

– Avoir une vision à 360° des clients, des produits

Page 24: Plateforme bigdata orientée BI avec Hortoworks Data Platform et Apache Spark

Quelle démarche pour votre projet Big Data !

Page 25: Plateforme bigdata orientée BI avec Hortoworks Data Platform et Apache Spark

Commencer petit !

Page 26: Plateforme bigdata orientée BI avec Hortoworks Data Platform et Apache Spark

Oublier les démarches classiques ! Trop long !

Page 27: Plateforme bigdata orientée BI avec Hortoworks Data Platform et Apache Spark

Oublier les démarches classiques ! Trop long !

Page 28: Plateforme bigdata orientée BI avec Hortoworks Data Platform et Apache Spark

Soyez Lean !

Page 29: Plateforme bigdata orientée BI avec Hortoworks Data Platform et Apache Spark

Big Data, BI,le tout en mode agile

Page 30: Plateforme bigdata orientée BI avec Hortoworks Data Platform et Apache Spark

Commencer petit !

Page 31: Plateforme bigdata orientée BI avec Hortoworks Data Platform et Apache Spark

Y aller pas à pas

● Télécharger une VM prêt à l'emploi (Pseudo cluster)

– Tester les démos / tutoriels

– Essayer avec vos données

● Passer à la vitesse supérieure avec une offre hébergée

● Formez vous, faites vous accompagner

● Lancez vous avec vos propres machines, hébergées ou non !

Page 32: Plateforme bigdata orientée BI avec Hortoworks Data Platform et Apache Spark

Questions

Page 33: Plateforme bigdata orientée BI avec Hortoworks Data Platform et Apache Spark

Charly [email protected]@egwada@ALtic_Buzz

Merci !

Plateforme Big Data orientée BI avecHadoop et Spark