clumeq 2 - québec - recherche, création et … · th is pr op osal is requ e stin g an in v e...
TRANSCRIPT
Compute Canada — Calcul CanadaA proposal to the
Canada Foundation for Innovation – National Platforms Fund
Hugh Couchman (McMaster University, SHARCNET)Robert Deupree (Saint Mary’s University, ACEnet)Ken Edgecombe (Queen’s University, HPCVL)Wagdi Habashi (McGill University, CLUMEQ)Richard Peltier (University of Toronto, SciNet)Jonathan Schae!er (University of Alberta, WestGrid)David Senechal (Universite de Sherbrooke, RQCHP)
Executive Summary
The Compute/Calcul Canada (CC) initiative unites the academic high-performance comput-ing (HPC) organizations in Canada. The seven regional HPC consortia in Canada —ACEnet,CLUMEQ, RQCHP, HPCVL, SciNet, SHARCNET and WestGrid— represent over 50 institutionsand over one thousand university faculty members doing computationally-based research. TheCompute Canada initiative is a coherent and comprehensive proposal to build a shared distributedHPC infrastructure across Canada to best meet the needs of the research community and en-able leading-edge world-competitive research. This proposal is requesting an investment of 60 M$from CFI (150 M$ with matching money) to put the necessary infrastructure in place for fourof the consortia for the 2007-2010 period. It is also requesting operating funds from Canada’sresearch councils, for all seven consortia. Compute Canada has developed a consensus on nationalgovernance, resource planning, and resource sharing models, allowing for e!ective usage and man-agement of the proposed facilities. Compute Canada represents a major step forward in movingfrom a regional to a national HPC collaboration. Our vision is the result of extensive consultationswith the Canadian research community.
CLUMEQ 2 - QuébecÉtat de la situation20 septembre 2006
CLUMEQ-Qc, 20 septembre 2006
Plan
• Situer le CLUMEQ sur le plan national
• Présenter le CLUMEQ en général
• Décrire le CLUMEQ-Québec en particulier
✦ la salle✦ les ressources matérielles✦ les ressources humaines
• Présenter notre vision
2
CLUMEQ-Qc, 20 septembre 2006
Fonds des plateformes nationales (FCI)
• 120M$ (FCI + provinces)
• 7 consortiums:
ACENET (provinces maritimes)
CLUMEQ + RQCHP (Québec)
HPCVL + SCINET + SHARCNET (Ontario)
WESTGRID (provinces de l’ouest)
• 1 seule demande nationale
3
CLUMEQ-Qc, 20 septembre 2006
La demande nationale
• Rédigée par le NIC:
«National Initiative Committee»
• Formée d’un représentant / consortium
• CLUMEQ: Fred Habashi de McGill
4
CLUMEQ-Qc, 20 septembre 2006
Budget consortiums
Autres5
WESTGRID40
SCINET30
RQCHP15
CLUMEQ30
(en millions de $)
5
CLUMEQ-Qc, 20 septembre 2006
Nombre de sites
CLUMEQ 2 Montréal et Québec
RQCHP 3 Montréal, Sherbrooke et Concordia
SCINET 1 Toronto
WestGRID 7Victoria, Vancouver (2),
Calgary, Edmonton, Saskatoon et Winnipeg
7
CLUMEQ-Qc, 20 septembre 2006
Politique de partage
• À l’échelle nationale!
• Toutes les machines de tous les consortiums seront accessibles à tous les chercheurs
8
CLUMEQ-Qc, 20 septembre 2006
CLUMEQ
• «Consortium Laval, Uqam, Mcgill and Eastern Québec»
• Regroupe maintenant Laval, McGill et l’UduQ en entier
• Conseil d’administration intérimaire:
✓ 4 vice-recteurs: McGill, Laval, UQAM, et UQTR
✓ 3 chercheurs: McGill, Laval, et UQAM✓ 1 externe: Gilbert Brunet (Environnement
Canada)9
CLUMEQ-Qc, 20 septembre 2006
Types d’équipement• Capacity cluster: noeuds de calculs
commun avec connectivité ordinaire
• Capability cluster: noeuds de calcul commun avec connectivité haute performance
• SMP: noeuds de calcul avec grande capacité de mémoire partagée
• Vector: unités vectorielles de calcul
10
CLUMEQ-Qc, 20 septembre 2006
Équipements
Capacity Capability SMP Vector
CLUMEQ ✓RQCHP ✓ ✓ ✓
SCINET ✓ ✓ ✓
WestGRID ✓ ✓ ✓
11
CLUMEQ-Qc, 20 septembre 2006
CLUMEQ
Cores / Node
Fast Network
Memory / Node
Disk Budget
Montréal 16 ✓ 64GB 1PB 20M$
Québec 4 ✓ 8GB 200TB 10M$
Fat vs Thin nodes
12
CLUMEQ-Qc, 20 septembre 2006
Architecture du CLUMEQ-QC
• General purpose cluster
• Commodity, high density nodes
• Low latency, high throughput interconnect
• Clustered file system
13
CLUMEQ-Qc, 20 septembre 2006
• Classement semi-annuel basé sur le «Linpack» benchmark («dense system of linear equations»)
• CLUMEQ-qc ∈ Top50 ?
14
CLUMEQ-Qc, 20 septembre 2006
Emplacement physique
• Pavillon Vachon
• En dessous du Van de Graff, salle des cibles
• Projet vert
15
CLUMEQ-Qc, 20 septembre 2006
Coopération inter-centres
• Interopération:
✓ compte unique✓ software stack compatible✓ même processeur?✓ meta-scheduler?
• Lien dédié à 10Gb/sec entre Québec et Montréal
• Rapprochement avec RQCHP
16
CLUMEQ-Qc, 20 septembre 2006
Grande étapes à venirCLUMEQ-QC
Ra!nement des besoins 68 days
Tests de performance 80 days
Préparation de l'appel d'o"re 90 days
Conception de la salle 93 days
Construction de la salle 105 days
Réception des machines
Installation et configuration des machines 79 days
Réponse FCI
Recrutement du personnel 300 days
Structure de gouvernance 93 days
Inauguration du centre
05 06 07 08 09 10 11 12 01 02 03 04 05 06 07 08 09 10 11 12 01 02
Q2 / 2006 Q3 / 2006 Q4 / 2006 Q1 / 2007 Q2 / 2007 Q3 / 2007 Q4 / 2007 Q1 / 2008
17
CLUMEQ-Qc, 20 septembre 2006
Tests de performance
• On a besoin de vos applications !
• Elles serviront à la préparation de l’appel d’offre.
18
CLUMEQ-Qc, 20 septembre 2006
Conception de la salle
• Expérience de Sherbrooke
• Expérience de Queens
• Expertise dans le privé
• Expertise chez les manufacturiers
• Votre expérience ?
19
CLUMEQ-Qc, 20 septembre 2006
Conception de l’appel d’offre
• Comité national
• Expériences récentes (Sherbrooke, Queens, ACENET)
• Coordination avec CLUMEQ-Mtl
20
CLUMEQ-Qc, 20 septembre 2006
Gouvernance
• Basée sur la collégialité et la transparence
• Assemblée annuelle des chercheurs/utilisateurs
• Comité des utilisateurs
• Comité d’allocation des ressources
• Comité de direction
• Mandats de courte durée; renouvelables
21
CLUMEQ-Qc, 20 septembre 2006
Ressources humaines et formation
• Personnel pour gérer les machines
• Analystes pour porter et optimiser les codes; potentiellement pour en développer de nouveaux
• Formation pour les chercheurs
• Expertise générale en CHP
• Présence active sur les comités nationaux
22
CLUMEQ-Qc, 20 septembre 2006
Conclusion
• Infrastructures majeures de niveau mondial
• Ressources humaines structurantes
• Développer un leadership au niveau de la recherche en CHP
• Participation active des chercheurs/utilisateurs
23