clumeq 2 - québec - recherche, création et … · th is pr op osal is requ e stin g an in v e...

24
CLUMEQ 2 - Québec État de la situation 20 septembre 2006

Upload: voxuyen

Post on 26-Aug-2018

212 views

Category:

Documents


0 download

TRANSCRIPT

Compute Canada — Calcul CanadaA proposal to the

Canada Foundation for Innovation – National Platforms Fund

Hugh Couchman (McMaster University, SHARCNET)Robert Deupree (Saint Mary’s University, ACEnet)Ken Edgecombe (Queen’s University, HPCVL)Wagdi Habashi (McGill University, CLUMEQ)Richard Peltier (University of Toronto, SciNet)Jonathan Schae!er (University of Alberta, WestGrid)David Senechal (Universite de Sherbrooke, RQCHP)

Executive Summary

The Compute/Calcul Canada (CC) initiative unites the academic high-performance comput-ing (HPC) organizations in Canada. The seven regional HPC consortia in Canada —ACEnet,CLUMEQ, RQCHP, HPCVL, SciNet, SHARCNET and WestGrid— represent over 50 institutionsand over one thousand university faculty members doing computationally-based research. TheCompute Canada initiative is a coherent and comprehensive proposal to build a shared distributedHPC infrastructure across Canada to best meet the needs of the research community and en-able leading-edge world-competitive research. This proposal is requesting an investment of 60 M$from CFI (150 M$ with matching money) to put the necessary infrastructure in place for fourof the consortia for the 2007-2010 period. It is also requesting operating funds from Canada’sresearch councils, for all seven consortia. Compute Canada has developed a consensus on nationalgovernance, resource planning, and resource sharing models, allowing for e!ective usage and man-agement of the proposed facilities. Compute Canada represents a major step forward in movingfrom a regional to a national HPC collaboration. Our vision is the result of extensive consultationswith the Canadian research community.

CLUMEQ 2 - QuébecÉtat de la situation20 septembre 2006

CLUMEQ-Qc, 20 septembre 2006

Plan

• Situer le CLUMEQ sur le plan national

• Présenter le CLUMEQ en général

• Décrire le CLUMEQ-Québec en particulier

✦ la salle✦ les ressources matérielles✦ les ressources humaines

• Présenter notre vision

2

CLUMEQ-Qc, 20 septembre 2006

Fonds des plateformes nationales (FCI)

• 120M$ (FCI + provinces)

• 7 consortiums:

ACENET (provinces maritimes)

CLUMEQ + RQCHP (Québec)

HPCVL + SCINET + SHARCNET (Ontario)

WESTGRID (provinces de l’ouest)

• 1 seule demande nationale

3

CLUMEQ-Qc, 20 septembre 2006

La demande nationale

• Rédigée par le NIC:

«National Initiative Committee»

• Formée d’un représentant / consortium

• CLUMEQ: Fred Habashi de McGill

4

CLUMEQ-Qc, 20 septembre 2006

Budget consortiums

Autres5

WESTGRID40

SCINET30

RQCHP15

CLUMEQ30

(en millions de $)

5

CLUMEQ-Qc, 20 septembre 2006

Distribution régionale

Ouest34%

Ontario28%

Québec38%

Maritimes1%

6

CLUMEQ-Qc, 20 septembre 2006

Nombre de sites

CLUMEQ 2 Montréal et Québec

RQCHP 3 Montréal, Sherbrooke et Concordia

SCINET 1 Toronto

WestGRID 7Victoria, Vancouver (2),

Calgary, Edmonton, Saskatoon et Winnipeg

7

CLUMEQ-Qc, 20 septembre 2006

Politique de partage

• À l’échelle nationale!

• Toutes les machines de tous les consortiums seront accessibles à tous les chercheurs

8

CLUMEQ-Qc, 20 septembre 2006

CLUMEQ

• «Consortium Laval, Uqam, Mcgill and Eastern Québec»

• Regroupe maintenant Laval, McGill et l’UduQ en entier

• Conseil d’administration intérimaire:

✓ 4 vice-recteurs: McGill, Laval, UQAM, et UQTR

✓ 3 chercheurs: McGill, Laval, et UQAM✓ 1 externe: Gilbert Brunet (Environnement

Canada)9

CLUMEQ-Qc, 20 septembre 2006

Types d’équipement• Capacity cluster: noeuds de calculs

commun avec connectivité ordinaire

• Capability cluster: noeuds de calcul commun avec connectivité haute performance

• SMP: noeuds de calcul avec grande capacité de mémoire partagée

• Vector: unités vectorielles de calcul

10

CLUMEQ-Qc, 20 septembre 2006

Équipements

Capacity Capability SMP Vector

CLUMEQ ✓RQCHP ✓ ✓ ✓

SCINET ✓ ✓ ✓

WestGRID ✓ ✓ ✓

11

CLUMEQ-Qc, 20 septembre 2006

CLUMEQ

Cores / Node

Fast Network

Memory / Node

Disk Budget

Montréal 16 ✓ 64GB 1PB 20M$

Québec 4 ✓ 8GB 200TB 10M$

Fat vs Thin nodes

12

CLUMEQ-Qc, 20 septembre 2006

Architecture du CLUMEQ-QC

• General purpose cluster

• Commodity, high density nodes

• Low latency, high throughput interconnect

• Clustered file system

13

CLUMEQ-Qc, 20 septembre 2006

• Classement semi-annuel basé sur le «Linpack» benchmark («dense system of linear equations»)

• CLUMEQ-qc ∈ Top50 ?

14

CLUMEQ-Qc, 20 septembre 2006

Emplacement physique

• Pavillon Vachon

• En dessous du Van de Graff, salle des cibles

• Projet vert

15

CLUMEQ-Qc, 20 septembre 2006

Coopération inter-centres

• Interopération:

✓ compte unique✓ software stack compatible✓ même processeur?✓ meta-scheduler?

• Lien dédié à 10Gb/sec entre Québec et Montréal

• Rapprochement avec RQCHP

16

CLUMEQ-Qc, 20 septembre 2006

Grande étapes à venirCLUMEQ-QC

Ra!nement des besoins 68 days

Tests de performance 80 days

Préparation de l'appel d'o"re 90 days

Conception de la salle 93 days

Construction de la salle 105 days

Réception des machines

Installation et configuration des machines 79 days

Réponse FCI

Recrutement du personnel 300 days

Structure de gouvernance 93 days

Inauguration du centre

05 06 07 08 09 10 11 12 01 02 03 04 05 06 07 08 09 10 11 12 01 02

Q2 / 2006 Q3 / 2006 Q4 / 2006 Q1 / 2007 Q2 / 2007 Q3 / 2007 Q4 / 2007 Q1 / 2008

17

CLUMEQ-Qc, 20 septembre 2006

Tests de performance

• On a besoin de vos applications !

• Elles serviront à la préparation de l’appel d’offre.

18

CLUMEQ-Qc, 20 septembre 2006

Conception de la salle

• Expérience de Sherbrooke

• Expérience de Queens

• Expertise dans le privé

• Expertise chez les manufacturiers

• Votre expérience ?

19

CLUMEQ-Qc, 20 septembre 2006

Conception de l’appel d’offre

• Comité national

• Expériences récentes (Sherbrooke, Queens, ACENET)

• Coordination avec CLUMEQ-Mtl

20

CLUMEQ-Qc, 20 septembre 2006

Gouvernance

• Basée sur la collégialité et la transparence

• Assemblée annuelle des chercheurs/utilisateurs

• Comité des utilisateurs

• Comité d’allocation des ressources

• Comité de direction

• Mandats de courte durée; renouvelables

21

CLUMEQ-Qc, 20 septembre 2006

Ressources humaines et formation

• Personnel pour gérer les machines

• Analystes pour porter et optimiser les codes; potentiellement pour en développer de nouveaux

• Formation pour les chercheurs

• Expertise générale en CHP

• Présence active sur les comités nationaux

22

CLUMEQ-Qc, 20 septembre 2006

Conclusion

• Infrastructures majeures de niveau mondial

• Ressources humaines structurantes

• Développer un leadership au niveau de la recherche en CHP

• Participation active des chercheurs/utilisateurs

23

CLUMEQ-Qc, 20 septembre 2006

Questions ?

24