nrb - plateforme big data pour la wallonie

16
La Plateforme BigData pour la Région wallonne Pierre-Paul Fares 19/06/2015

Upload: infopole-cluster-tic

Post on 02-Aug-2015

58 views

Category:

Technology


0 download

TRANSCRIPT

La Plateforme BigData pour la Région wallonne

Pierre-Paul Fares 19/06/2015

2

La solution : La PFI BigData

Les enjeux pour la Région wallonne1

2

BigData: les concepts3

Différentes applications par secteur4

La plateforme BigData pour les Pôles: le Hub5

Les services offerts par la plateforme6

L’architecture de la plateforme

The B

ig D

ata

Pla

tform

7

Comment conserver l’avantage concurrentiel obtenu grâce au Plan Marshall?Maîtriser l’information globale

Comment garantir une politique de Gouvernance et de sécurité des données pour certains secteurs?Healthcare

Comment éviter la fuite des cerveaux? Emplois à haut potentiel

Comment industrialiser plus rapidement les résultats de la rechercheTime to Market

3

Les enjeux pour la Région wallonne

3

2

1

4

• Master global Information• Local Data• Open Data

Conserver l’avantage compétitif apporté par le

Plan Marshall

• Private Cloud• Local Storage

• 2 Data centersProtection des données

• Emplois à haut potentiel• Data Scientist• Business Scenario Modeler (BSM)

Eviter la fuite des cerveaux

• Centres de recherche• Universités• Entreprises IT

Mettre les compétences en commun

4

La solution: La PFI(*) Bigdata

(*) – Plateforme d’Innovation

5

Volume : énorme volume de données (presque illimité)

Varieté : structuré, non-structuré, documents, videos, sons, social media (Facebook, Twitter, …)

Vélocité : quasi temps réel or temps réel

Valeur : identifie la valeur réelle de la donnée (modèles prédictifs, modèles analytiques)

Visualisation : cela compte vraiment (Web 2.0, maps, smartphone, …)

BigData: Les Concepts

BI Traditionnel Advanced Analytics

J.Wieczorek 20/04/2015

Data Mart/Warehouse

Traditional BI

ERP

Data Visualization

Application 1

StructuredData

External

Analysis Scorecards Dashboards KPI’s

Unstructured

DataExternal

Predictive

DescriptivePrescriptiv

eCognitiv

e

+ Advanced Analytics

7

Dans l’assurance et la Banque:• Détection de

Fraude• Churn

Prediction• Risk

Management

Dans l’Industrie :• Capacity

Management• Predictive

Maintenance• Marketing

Dans le Healthcare:• Monitoring

temps réel des patients

• Validation de diagnostic

Les Pouvoirs Locaux :• Smartcities• Building

intelligents• Services à la

population• Sécurité

Dans les Utilities:• Smart Metering• Grid

Management

Différentes applications du BigData par secteur

J.Wieczorek 20/04/2015

Quelques valeurs ajoutées

Valeur ajoutéeAu travers du Bigdata

AugmenterCash Flow

AssetEfficiency

Gouvernance

Améliorationprocessus

Productivité

RisqueSecurité

Intelligence

CustomerInsight

OptimisationRessources

9

La plateforme BigData pour les Pôles de compétitivité : le Hub

9

Big Data Infrastructure

Plateforme BigData

10

Les services offerts par la plateforme Bigdata

10

ExplorationExploration

Descriptive AnalyticsDescriptive Analytics

Diagnostic AnalyticsDiagnostic Analytics

Prescriptive & Predictive AnalyticsPrescriptive & Predictive Analytics

Value Chain

CREATION COLLECT STORAGE PROCESS ANALYZE VISUALIZE

DashboardDashboard

PACKAGESPACKAGES

Adhoc-QueryAdhoc-Query

ReportingReporting

OutsourcingOutsourcing

Enabled

Disabled

Portefeuille de services

Consultance Design Implementation

Run

Définition du scope ( choix du service Analytics )

Experts Business

Business scenario modeller

Design

Customisation de l’existant

packages Analytics :

predictive, prescriptive, descriptive,diagnostic,..

Recherche & Experimentation

de nouveaux algorithms ou de nouveaux package analytics

Deploiement du package analytics ou bien de l’ algorithme

Execution

Maintenance

Un service « end-to-end »

Computation cloud based on dedicated Vblock Two dedicated infrastructures for Hadoop

service Shared infrastructure in secondary data center

PowerfullInfrastructure

High Velocy

L’architecture de la Plateforme

13

Stream

Batch Collector (ETL)

Capture (CDC)

Social Media

ClusterHadoop

Appliance

Predictive

Visualization

Analytics

Exploration

Master Data Management (MDM) Data security et Data privacy (Audit / Non répudiation)

StreamBatch Collector (ETL)

Capture (CDC) Social Media

Predictive

Visualisation

Analytics

Exploration ClusterHadoop

Our pricing Model

Pour chaque Package, Equation du type:

aX + bY + cZ = …………€/moisVolume Processing Visualisati

on

valeur a b c

unité Giga Time of processing (hour)

# users/tool

Un modèle flexible et instantané

Exemple: Package Dashboard• 500 giga de données mensuelles;• processées sur 24 heures;• 5 users Dashboard

TOTAL: 500 x 3 + 24 x 10 + 5 x 70 = 2.090 €/mois

?

16