1 grid, virtualisation, et hpc bernard ourghanlian cto & cso – microsoft france

14
1 Grid, Virtualisation, Grid, Virtualisation, et HPC et HPC Bernard Ourghanlian Bernard Ourghanlian CTO & CSO – Microsoft France CTO & CSO – Microsoft France

Upload: willelm-barbier

Post on 03-Apr-2015

108 views

Category:

Documents


2 download

TRANSCRIPT

Page 1: 1 Grid, Virtualisation, et HPC Bernard Ourghanlian CTO & CSO – Microsoft France

1

Grid, Virtualisation, Grid, Virtualisation, et HPCet HPC

Bernard OurghanlianBernard OurghanlianCTO & CSO – Microsoft FranceCTO & CSO – Microsoft France

Page 2: 1 Grid, Virtualisation, et HPC Bernard Ourghanlian CTO & CSO – Microsoft France

Grid ComputingGrid Computing

2

Page 3: 1 Grid, Virtualisation, et HPC Bernard Ourghanlian CTO & CSO – Microsoft France

Grid ComputingGrid ComputingIl n'existe pas de définitions très précises des grilles de calcul.

Plaszczak/Wellner définissent la grille de calcul comme la technologie qui permet la virtualisation de ressources à la demande, et le partage entre plusieurs organisationsIBM définit le calcul en grille comme une méthode utilisant une panoplie de protocoles standards pour avoir l'accès aux applications et aux données, à la puissance de calcul, à la capacité de stockage entre un vaste réseau de ressources informatiques à travers InternetUne autre définition de la grille de calcul est donnée par Fernando Corbató du MIT. Lui et les autres concepteurs du système d'exploitation Multics envisageaient le système comme une entreprise fournisseur d'énergie ou une compagnie des eaux. Buyya définit la grille comme un type de système parallèle et distribué qui permet le partage, la sélection, et l'agrégation de ressources autonomes géographiquement distribués dynamiquement. Chacune de ces ressources ont leur propre disponibilité, capacité, performance, coût, et utilisateurs, avec leurs propres contraintes de qualité de service.Le CERN (European Organization for Nuclear Research), un des plus gros consommateurs de puissance de calcul à travers la technologie du Grid Computing, la définit comme un service pour le partage de puissance informatique et de capacité de stockage à travers l'Internet.

Il n'existe pas de définitions très précises des grilles de calcul. Plaszczak/Wellner définissent la grille de calcul comme la technologie qui permet la virtualisation de ressources à la demande, et le partage entre plusieurs organisationsIBM définit le calcul en grille comme une méthode utilisant une panoplie de protocoles standards pour avoir l'accès aux applications et aux données, à la puissance de calcul, à la capacité de stockage entre un vaste réseau de ressources informatiques à travers InternetUne autre définition de la grille de calcul est donnée par Fernando Corbató du MIT. Lui et les autres concepteurs du système d'exploitation Multics envisageaient le système comme une entreprise fournisseur d'énergie ou une compagnie des eaux. Buyya définit la grille comme un type de système parallèle et distribué qui permet le partage, la sélection, et l'agrégation de ressources autonomes géographiquement distribués dynamiquement. Chacune de ces ressources ont leur propre disponibilité, capacité, performance, coût, et utilisateurs, avec leurs propres contraintes de qualité de service.Le CERN (European Organization for Nuclear Research), un des plus gros consommateurs de puissance de calcul à travers la technologie du Grid Computing, la définit comme un service pour le partage de puissance informatique et de capacité de stockage à travers l'Internet.

3Source : http://www-igm.univ-mlv.fr/~dr/XPOSE2006/Jolly_Laskri/index.html

Page 4: 1 Grid, Virtualisation, et HPC Bernard Ourghanlian CTO & CSO – Microsoft France

Grid ComputingGrid Computing

Mais la définition « finale » est probablement celle fournie par Ian Foster dans son article « What is a Grid? A Three Point Checklist »Les trois points qu’il définit sont :

Des ressources informatiques dont l’administration n’est pas centralisée, Des méthodes utilisées qui sont standardisées, Des ressources dont la qualité de service n’est pas assurée.

Mais la définition « finale » est probablement celle fournie par Ian Foster dans son article « What is a Grid? A Three Point Checklist »Les trois points qu’il définit sont :

Des ressources informatiques dont l’administration n’est pas centralisée, Des méthodes utilisées qui sont standardisées, Des ressources dont la qualité de service n’est pas assurée.

Source : http://www-igm.univ-mlv.fr/~dr/XPOSE2006/Jolly_Laskri/index.html

Page 5: 1 Grid, Virtualisation, et HPC Bernard Ourghanlian CTO & CSO – Microsoft France

Grid Computing : une tentative de définitionGrid Computing : une tentative de définition

Une grille informatique ou Grid est une infrastructure virtuelle constituée d'un ensemble coordonné de ressources informatiques potentiellement partagées, distribuées, hétérogènes, externalisées et sans administration centraliséeUne grille est donc une infrastructure matérielle et logicielle qualifiée de virtuelle car les relations entre les entités qui la composent n'existent pas matériellement mais numériquementUne grille garantit des qualités de service non-triviales, c'est-à-dire qu'elle se distingue des autres infrastructures dans son aptitude à répondre adéquatement à des exigences (accessibilité, disponibilité, fiabilité, ...) compte tenu de la puissance de calcul ou de stockage qu'elle représente

Une grille informatique ou Grid est une infrastructure virtuelle constituée d'un ensemble coordonné de ressources informatiques potentiellement partagées, distribuées, hétérogènes, externalisées et sans administration centraliséeUne grille est donc une infrastructure matérielle et logicielle qualifiée de virtuelle car les relations entre les entités qui la composent n'existent pas matériellement mais numériquementUne grille garantit des qualités de service non-triviales, c'est-à-dire qu'elle se distingue des autres infrastructures dans son aptitude à répondre adéquatement à des exigences (accessibilité, disponibilité, fiabilité, ...) compte tenu de la puissance de calcul ou de stockage qu'elle représente

5D’après http://fr.wikipedia.org/wiki/Grille_de_calcul

Page 6: 1 Grid, Virtualisation, et HPC Bernard Ourghanlian CTO & CSO – Microsoft France

Grid Computing : une tentative de définition (suite)Grid Computing : une tentative de définition (suite)

Une grille se compose de ressources informatiques : tout élément qui permet l’exécution d'une tâche ou le stockage d’une donnée numérique

Cette définition inclut bien sûr les ordinateurs personnels, mais aussi en théorie les téléphones portables et tout objet qui présente un composant informatique

Une grille se compose de ressources informatiques : tout élément qui permet l’exécution d'une tâche ou le stockage d’une donnée numérique

Cette définition inclut bien sûr les ordinateurs personnels, mais aussi en théorie les téléphones portables et tout objet qui présente un composant informatique

6D’après http://fr.wikipedia.org/wiki/Grille_de_calcul

Page 7: 1 Grid, Virtualisation, et HPC Bernard Ourghanlian CTO & CSO – Microsoft France

Grid Computing : une tentative de définition (suite)Grid Computing : une tentative de définition (suite)

Ces ressources sont potentiellement qualifiées de :Partagées : elles sont mises à la disposition des différents consommateurs de la grille et éventuellement pour différents usages applicatifs

Distribuées : elles sont situées dans des lieux géographiques différents

Hétérogènes : elles sont de toute nature, différant par exemple par le système d'exploitation ou le système de gestion des fichiers

Coordonnées : les ressources sont organisées, connectées et gérées en fonction de besoins (objectifs) et contraintes (environnements). Ces dispositions sont souvent assurées par un ou plusieurs ordonnanceurs

Externalisées : les ressources sont accessibles à la demande chez un fournisseur externe

Non-contrôlées (ou autonomes) : les ressources ne sont pas contrôlées par une unité commune. Contrairement à un cluster, les ressources sont hors de la portée d'un moniteur de contrôle

Ces ressources sont potentiellement qualifiées de :Partagées : elles sont mises à la disposition des différents consommateurs de la grille et éventuellement pour différents usages applicatifs

Distribuées : elles sont situées dans des lieux géographiques différents

Hétérogènes : elles sont de toute nature, différant par exemple par le système d'exploitation ou le système de gestion des fichiers

Coordonnées : les ressources sont organisées, connectées et gérées en fonction de besoins (objectifs) et contraintes (environnements). Ces dispositions sont souvent assurées par un ou plusieurs ordonnanceurs

Externalisées : les ressources sont accessibles à la demande chez un fournisseur externe

Non-contrôlées (ou autonomes) : les ressources ne sont pas contrôlées par une unité commune. Contrairement à un cluster, les ressources sont hors de la portée d'un moniteur de contrôle

D’après http://fr.wikipedia.org/wiki/Grille_de_calcul

Page 8: 1 Grid, Virtualisation, et HPC Bernard Ourghanlian CTO & CSO – Microsoft France

Grid Computing : une tentative de définition (suite)Grid Computing : une tentative de définition (suite)

L'expression grille de calcul est parfois employée alors que d'autres termes conviennent mieux. Il est nécessaire de distinguer les concepts suivants :

Cluster : ensemble de machines homogènes et localisées, organisées en grappe. Grille : ensemble de ressources hétérogènes et délocalisées (ordinateurs, serveurs, clusters, ...).

Une grille de calcul intègre un intergiciel (middleware) : l'ensemble des couches réseaux et services logiciels qui permettent le dialogue entre les différents composants d'une application répartie.

L'intergiciel masque la complexité des échanges inter-applications.

Le desktop grid est une forme de grille de calcul. Il s'agit d'exploiter pleinement l'ensemble des ressources inutilisées de PC tout à fait classique.

L'expression grille de calcul est parfois employée alors que d'autres termes conviennent mieux. Il est nécessaire de distinguer les concepts suivants :

Cluster : ensemble de machines homogènes et localisées, organisées en grappe. Grille : ensemble de ressources hétérogènes et délocalisées (ordinateurs, serveurs, clusters, ...).

Une grille de calcul intègre un intergiciel (middleware) : l'ensemble des couches réseaux et services logiciels qui permettent le dialogue entre les différents composants d'une application répartie.

L'intergiciel masque la complexité des échanges inter-applications.

Le desktop grid est une forme de grille de calcul. Il s'agit d'exploiter pleinement l'ensemble des ressources inutilisées de PC tout à fait classique.

D’après http://fr.wikipedia.org/wiki/Grille_de_calcul

Page 9: 1 Grid, Virtualisation, et HPC Bernard Ourghanlian CTO & CSO – Microsoft France

La Globus Alliance et le Globus ToolkitLa Globus Alliance et le Globus Toolkit

La Globus Alliance est une « Organisation Virtuelle » qui a pour but d'aider le monde scientifique, la recherche, les entreprises à créer des applications basées sur le Grid Computing.  L'architecture de grille permet à plusieurs entités de collaborer, de mettre en commun leurs ressources informatiques. La Globus Alliance s'étend du laboratoire national d'Argonne (Etats-Unis, Illinois) en passant par l'université de l'institut des sciences de l'information de la Californie méridionale (Etats-Unis), l'université de Chicago (Etats-Unis),le centre national pour les applications de « Supercomputing » NCSA, Arlington en Virginie, Etats-Unis), l'université d'Edimbourg (Ecosse), et enfin vers  le centre suédois pour les ordinateurs mis en parallèle (Linköping, Suède).

La Globus Alliance est une « Organisation Virtuelle » qui a pour but d'aider le monde scientifique, la recherche, les entreprises à créer des applications basées sur le Grid Computing.  L'architecture de grille permet à plusieurs entités de collaborer, de mettre en commun leurs ressources informatiques. La Globus Alliance s'étend du laboratoire national d'Argonne (Etats-Unis, Illinois) en passant par l'université de l'institut des sciences de l'information de la Californie méridionale (Etats-Unis), l'université de Chicago (Etats-Unis),le centre national pour les applications de « Supercomputing » NCSA, Arlington en Virginie, Etats-Unis), l'université d'Edimbourg (Ecosse), et enfin vers  le centre suédois pour les ordinateurs mis en parallèle (Linköping, Suède). 9

Page 10: 1 Grid, Virtualisation, et HPC Bernard Ourghanlian CTO & CSO – Microsoft France

La Globus Alliance et le Globus ToolkitLa Globus Alliance et le Globus Toolkit

Elle développe et essaie de standardiser la technologie qu’est le Grid Computing au moyen de son middleware vedette le « Globus Toolkit ».

Comme son nom l'indique c’est une boîte à outils (modules, bibliothèques) de type middleware développée en C et en Java, qui permet de créer une architecture de grille et de développer des applications basées sur la technologie du Grid Computing. 

Le Globus Toolkit est à la base de nombreux projets dans le monde scientifique et des entreprises

Elle développe et essaie de standardiser la technologie qu’est le Grid Computing au moyen de son middleware vedette le « Globus Toolkit ».

Comme son nom l'indique c’est une boîte à outils (modules, bibliothèques) de type middleware développée en C et en Java, qui permet de créer une architecture de grille et de développer des applications basées sur la technologie du Grid Computing. 

Le Globus Toolkit est à la base de nombreux projets dans le monde scientifique et des entreprises

10

Page 11: 1 Grid, Virtualisation, et HPC Bernard Ourghanlian CTO & CSO – Microsoft France

Le Globus ToolkitLe Globus Toolkit

Plus d’information en http://www.globus.org/

Page 12: 1 Grid, Virtualisation, et HPC Bernard Ourghanlian CTO & CSO – Microsoft France

Quelques projets emblématiques Quelques projets emblématiques

AstronomieSloan Digital Sky Survey  National Virtual Observatory

ChimieCMCS (Collaboratory for the Multi-scale Chemical Science)

Génie CivilNEES (Network for Earthquake Engineering Simulation)

ClimatologieLEAD (Linked Environments for Atmospheric Discovery)Earth System Grid

EcologieLTER (Long Term Ecological Research)

MédecineBIRN (Biomedical Informatics Research Network)

AstronomieSloan Digital Sky Survey  National Virtual Observatory

ChimieCMCS (Collaboratory for the Multi-scale Chemical Science)

Génie CivilNEES (Network for Earthquake Engineering Simulation)

ClimatologieLEAD (Linked Environments for Atmospheric Discovery)Earth System Grid

EcologieLTER (Long Term Ecological Research)

MédecineBIRN (Biomedical Informatics Research Network)

Page 13: 1 Grid, Virtualisation, et HPC Bernard Ourghanlian CTO & CSO – Microsoft France

Quelques projets emblématiques Quelques projets emblématiques

OcéanographieLOOKING (Laboratory for the Ocean Observatory Knowledge INtegration Grid)

PhysiqueLIGO (Laser Interferometer Gravitational-Wave Observatory) Particle Physics Data Grid EGEE

GéologieSCEC (Southern California Earthquake Center)

OcéanographieLOOKING (Laboratory for the Ocean Observatory Knowledge INtegration Grid)

PhysiqueLIGO (Laser Interferometer Gravitational-Wave Observatory) Particle Physics Data Grid EGEE

GéologieSCEC (Southern California Earthquake Center)

Page 14: 1 Grid, Virtualisation, et HPC Bernard Ourghanlian CTO & CSO – Microsoft France

© 2007 Microsoft France

Votre potentiel, notre passion TM