gestion d'énergie dans les systèmes distribuésgeorges.da-costa/cours/liban/cours... ·...
TRANSCRIPT
Boucle autonome Décision Évolution Et au delà
Gestion d'énergie dans les systèmes
distribués
Georges Da Costa
Action IC0804www.cost804.org
[email protected] 1/77
Boucle autonome Décision Évolution Et au delà
Impact des centres de cal-culs cloud
Centre de calcul récent 40000 serveurs, 500000 services(machines virtuelles). Google, Facebook > 1million serveursLes centres de calculs consomment beaucoup
2000 : 70 TWh2007 : 330 TWh, 2%production mondiale deCO2
2011 : 6eme paysconsommateurd'électricité au monde2020 : 1000 TWh
En augmentation2014 : 8.5% des centresde calculs considéréscomme su�sants au delàde 2015
[email protected] 2/77
Boucle autonome Décision Évolution Et au delà
Impact des centres de cal-culs
China TelecomInner MongoliaInformationPark
150 MW
Tianhe-217.8MW
[email protected] 3/77
Boucle autonome Décision Évolution Et au delà
Des centres de calcul souten-ables
Actions à plusieurs niveaux orthogonauxMatériel: changer les serveurs ou l'infrastructure derefroidissement
Si entropie constante, consommation théorique = 0
Applicatif: réécrire les applications en changeant deparadigme∗ou de bibliothèqueIntergiciel: gère l'état des serveurs et des services/applications
Intergiciel: coût minimal, impact maximalOpenStack : 30% de part de marché en 2014Solutions OpenSource : 43% (+72% en 2 ans)
∗ Georges et al. Exascale machines require new programming paradigms and runtimes, SFI journal, 2015
[email protected] 4/77
Boucle autonome Décision Évolution Et au delà
Principes de fonctionnementd'un intergiciel
Deux buts :Gérer (besoins, erreurs, fautes,surchau�es)Optimiser (énergie, performance)
Leviers/E�ecteursAllumage, extinction, DVFSMigration (x86/ARM)∗,réduction de ressources,suspension
MéthodesSouvent dans la réalité : Humainou règlesEn recherche : Boucle autonome
Boucle MAPE-K c©IBM
∗ Violaine et al., Big, Medium, Little : Reaching Energy Proportionality with Heterogeneous Computing
Scheduler, Parallel Processing Letters, journal, 2015.
[email protected] 5/77
Boucle autonome Décision Évolution Et au delàPlan : Comment gérer e�-cacement un centre de cal-cul ?
E�cacement ?Il faut pouvoir comparer (modèles &
métriques)
Gérer veut dire déciderOutils de mesure
Outils d'évaluation : expérimentation,simulationApproches exactes et heuristiques pourla décision
L'évolution des centres de calculFédération de centres de calculOptimisation multi-niveau
[email protected] 7/77
Boucle autonome Décision Évolution Et au delàModèles et Métriques Mesures Outils d'évaluation
Plan
1 Boucle autonomeModèles et MétriquesMesuresOutils d'évaluation
2 DécisionPlacementFédération de cloudsData center in the box
3 Évolution, optimisation des noeudsGros grainMoyen GrainGrain �n
4 Et au delà
[email protected] 8/77
Boucle autonome Décision Évolution Et au delàModèles et Métriques Mesures Outils d'évaluation
Modéliser un système
Pour gérer un système il faut :
Connaître toutes les actions possibles
Savoir quelle est la(/les) plus adaptée
Ce qui se traduit par :
Modéliser l'impact et la modalité (temps, énergie, ...) de cesactions
Être capable de comparer deux scenarii
[email protected] 9/77
Boucle autonome Décision Évolution Et au delàModèles et Métriques Mesures Outils d'évaluation
Impact des leviers : DVFS
Puissance dynamique délivrée par un composant CMOS :Pcmos = Ce� × V
2 × f
avec, Ce� la capacitance e�ective *, V le voltage et f la fréquence* grandeur physique : capacité d'un composant à s'opposer au changement de voltage entre ses bornes
Énergie dépensée par tâche :
E = P ∗ T ∝ T ∗ V 3 , avec V ∝ f et T ∝ 1/F , alors E ∝ f2︸ ︷︷ ︸
WTime
Frequency
00
f1
T1
T1
D
WTime
Frequency
00
f2
T2 D
[email protected] 10/77
Boucle autonome Décision Évolution Et au delàModèles et Métriques Mesures Outils d'évaluation
Modélisation multi-échellesdu monde réel
Plusieurs modèles décrivant la puissance consommée par un serveur :
Classique : a�ne (erreurE∼10-15%)
Plus �n : Voltage/fréquenceprocesseur (E∼5-9%)
Encore plus �n: Températureprocesseur (E∼4-7%)
Ne pas oublier les biais :alimentation électrique
E∼2-3%, refroidissement, ...
Méthodes par apprentissage(réseaux de neurones, E∼2%) ∗
Power = Pmin + Load × (Pmax − Pmin)
[email protected] 11/77
Boucle autonome Décision Évolution Et au delàModèles et Métriques Mesures Outils d'évaluation
Modélisation multi-échellesdu monde réel
Plusieurs modèles décrivant la puissance consommée par un serveur :
Classique : a�ne (erreurE∼10-15%)
Plus �n : Voltage/fréquenceprocesseur (E∼5-9%)
Encore plus �n: Températureprocesseur (E∼4-7%)
Ne pas oublier les biais :alimentation électrique
E∼2-3%, refroidissement, ...
Méthodes par apprentissage(réseaux de neurones, E∼2%) ∗
Power = Pmin+Load×αVoltage2Frequency
[email protected] 11/77
Boucle autonome Décision Évolution Et au delàModèles et Métriques Mesures Outils d'évaluation
Modélisation multi-échellesdu monde réel
Plusieurs modèles décrivant la puissance consommée par un serveur :
Classique : a�ne (erreurE∼10-15%)
Plus �n : Voltage/fréquenceprocesseur (E∼5-9%)
Encore plus �n: Températureprocesseur (E∼4-7%)
Ne pas oublier les biais :alimentation électrique
E∼2-3%, refroidissement, ...
Méthodes par apprentissage(réseaux de neurones, E∼2%) ∗
Power = Pmin+Load×αVoltage2Frequency+λTemperature
0
5
10
15
20
25
30
35
40
45
50
0 200 400 600 800 1000Puis
sance
(W
)Temps (s)
ApplicationsCourant de fuitePuissance a vide
Total
[email protected] 11/77
Boucle autonome Décision Évolution Et au delàModèles et Métriques Mesures Outils d'évaluation
Modélisation multi-échellesdu monde réel
Plusieurs modèles décrivant la puissance consommée par un serveur :
Classique : a�ne (erreurE∼10-15%)
Plus �n : Voltage/fréquenceprocesseur (E∼5-9%)
Encore plus �n: Températureprocesseur (E∼4-7%)
Ne pas oublier les biais :alimentation électrique
E∼2-3%, refroidissement, ...
Méthodes par apprentissage(réseaux de neurones, E∼2%) ∗
PowerDC = ω0+ω1PowerAC+ω2Power3AC
0 200 400 600 800 1000
020
4060
8010
0
●
●
●
●
●●
●●●
●
●●
●● ● ● ● ● ● ●
● ● ● ● ● ● ● ● ●● ● ●
DC Power (W)
Effi
cien
cy (
%)
[email protected] 11/77
Boucle autonome Décision Évolution Et au delàModèles et Métriques Mesures Outils d'évaluation
Modélisation multi-échellesdu monde réel
Plusieurs modèles décrivant la puissance consommée par un serveur :
Classique : a�ne (erreurE∼10-15%)
Plus �n : Voltage/fréquenceprocesseur (E∼5-9%)
Encore plus �n: Températureprocesseur (E∼4-7%)
Ne pas oublier les biais :alimentation électrique
E∼2-3%, refroidissement, ...
Méthodes par apprentissage(réseaux de neurones, E∼2%) ∗
∗ Leandro et al., Towards a generic power estimator, CSRD
journal, 2015
...
inpu
t lay
er
...
outp
ut la
yer
hidden layers
[email protected] 11/77
Boucle autonome Décision Évolution Et au delàModèles et Métriques Mesures Outils d'évaluation
Modéliser un centre de cal-cul
Un grand nombre de typesd'éléments
ApplicationsProcess: Traces, collectionhaut niveau puis abstraction
ServeursInfrastructure
Et leurs interactionsThermiques (D-Matrix)∗
Entre applications
[email protected] 12/77
Boucle autonome Décision Évolution Et au delàModèles et Métriques Mesures Outils d'évaluation
Modéliser un centre de cal-cul
Un grand nombre de typesd'éléments
ApplicationsProcess: Traces, collectionhaut niveau puis abstraction
Serveurs
Infrastructure
Et leurs interactionsThermiques (D-Matrix)∗
Entre applications
[email protected] 12/77
Boucle autonome Décision Évolution Et au delàModèles et Métriques Mesures Outils d'évaluation
Modéliser un centre de cal-cul
Un grand nombre de typesd'éléments
ApplicationsProcess: Traces, collectionhaut niveau puis abstraction
ServeursInfrastructure
Et leurs interactionsThermiques (D-Matrix)∗
Entre applications
[email protected] 12/77
Boucle autonome Décision Évolution Et au delàModèles et Métriques Mesures Outils d'évaluation
Modéliser un centre de cal-cul
Un grand nombre de typesd'éléments
ApplicationsProcess: Traces, collectionhaut niveau puis abstraction
ServeursInfrastructure
Et leurs interactionsThermiques (D-Matrix)∗
Entre applications
∗ Hong Yang et al.,Energy-e�cient and thermal-aware resource management for heterogeneous
datacenters, SUSCOM journal, 2014.
[email protected] 12/77
Boucle autonome Décision Évolution Et au delàModèles et Métriques Mesures Outils d'évaluation
Interactions simples d'applications
Deux types d'applicationsmono-thread
Application 1 : Cpu-IntensiveLimitée par le processeurApplication 2 : Mem-IntensiveLimitée par la mémoire
Exécution sur un quadri-c÷urApplications 1 : IndépendantesApplications 2 : Impact croiséfort
0
0.5
1
1.5
2
2.5
3
Expérience 1
Expérience 2
Expérience 3
Expérience 4
Expérience 5
Rale
nti
ssem
ent
Cpu-IntensiveMem-Intensive
[email protected] 13/77
Boucle autonome Décision Évolution Et au delàModèles et Métriques Mesures Outils d'évaluation
Métriques
Valeurs directes :Charge processeur et mémoire, puissance, Température, ...Objectif : Ça marche bien ? Comparer deux centres,intergiciels, logiciels,...
40000 serveurs, 500000 services → Besoin de métriquessimples
Consommation et performance
Di�cile à standardiser, surtout la performanceDépend du service, de l'implémentation, ...
Métrique classique : PUE
Georges et al. Data Centres Sustainability Cluster Activities Task 3. Rapport de recherche 3. European
Commission, 2014
[email protected] 14/77
Boucle autonome Décision Évolution Et au delàModèles et Métriques Mesures Outils d'évaluation
PUE : Power Usage E�ec-tiveness
Ratio électricité totale/électricité IT
En moyenne 1.7 en 2014
Standardisation initiée parGreenGridOù s'arrête la partie IT
Alimentation ? Ventilateur sur lacarte mère ? Processeur ?
Ne sert que dans un cadre trèsprécis
[email protected] 15/77
Boucle autonome Décision Évolution Et au delàModèles et Métriques Mesures Outils d'évaluation
PUE : Power Usage E�ec-tiveness
Ratio électricité totale/électricité IT
En moyenne 1.7 en 2014
Standardisation initiée parGreenGridOù s'arrête la partie IT
Alimentation ? Ventilateur sur lacarte mère ? Processeur ?
Ne sert que dans un cadre trèsprécis
Surcoût constant(100), partie IT 100 à200 suivant la chargePour un même servicerendu deux logiciels
1 Charge moyenne75%PUE = 275/175= 1.57
2 Charge moyenne100%PUE = 300/200= 1.5
[email protected] 15/77
Boucle autonome Décision Évolution Et au delàModèles et Métriques Mesures Outils d'évaluation
Problème du multi-objectif
Impossible à dé�nir dans l'absolu,besoin d'un contexte, d'un but
Formaliser les métriques simples∗ :Dynamisme, Énergie, Performance,RésiliencePlusieurs méthodes classiques
Optimisation sous contrainte
Pondération d'objectifPondération �oue† (contraintepar relâchement de l'optimal)
∗ Tom et al., Quality of Service Modeling for Green
Scheduling in Clouds, SUSCOM journal, 2014.
[email protected] 16/77
Boucle autonome Décision Évolution Et au delàModèles et Métriques Mesures Outils d'évaluation
Problème du multi-objectif
Impossible à dé�nir dans l'absolu,besoin d'un contexte, d'un but
Formaliser les métriques simples∗ :Dynamisme, Énergie, Performance,RésiliencePlusieurs méthodes classiques
Optimisation sous contraintePondération d'objectif
Pondération �oue† (contraintepar relâchement de l'optimal)
∗ Tom et al., Quality of Service Modeling for Green
Scheduling in Clouds, SUSCOM journal, 2014.
[email protected] 16/77
Boucle autonome Décision Évolution Et au delàModèles et Métriques Mesures Outils d'évaluation
Problème du multi-objectif
Impossible à dé�nir dans l'absolu,besoin d'un contexte, d'un but
Formaliser les métriques simples∗ :Dynamisme, Énergie, Performance,RésiliencePlusieurs méthodes classiques
Optimisation sous contraintePondération d'objectifPondération �oue† (contraintepar relâchement de l'optimal)
† Hong Yang et al. Energy-e�cient and thermal-aware
resource management for heterogeneous datacenters,
SUSCOM journal, 2014.
[email protected] 16/77
Boucle autonome Décision Évolution Et au delàModèles et Métriques Mesures Outils d'évaluation
Exemple: Performance etpuissance
Deux métriques, une linéaire, une quadratiqueMq est la partie puissance, donc quadratique en la fréquence(x)Ml est la partie performance, donc linéaire en la fréquence (x)
Objα(x) = αMq + (1− α)Ml = αx2 + (1− α)(1− x)α est le coe�cient de pondération
0
0.2
0.4
0.6
0.8
1
0 0.2 0.4 0.6 0.8 1
Com
bin
ais
on lin
éair
e :
αM
q+
(1
-α)M
l
Levier : fréquence
α=1/3α=1/2α=2/3
[email protected] 17/77
Boucle autonome Décision Évolution Et au delàModèles et Métriques Mesures Outils d'évaluation
Comment choisir α ?
0
0.2
0.4
0.6
0.8
1
0 0.2 0.4 0.6 0.8 1
Vale
ur
op
tim
ale
pour
la f
réq
uence
α
Valeur optimale de la fréquence en fonction de la valeur de α.Objα(x) = αMq + (1− α)Ml = αx2 + (1− α)(1− x)α = 0 : fréquence maxα = 1 : fréquence minEntre les deux... Vaudoo !
[email protected] 18/77
Boucle autonome Décision Évolution Et au delàModèles et Métriques Mesures Outils d'évaluation
Suite de tests
Deux grande catégoriesSuites dédiées (services Web, base de données, HPC,...)Suites génériques
Scienti�que, Gestionnaire d'infrastructure : Applications boîtesnoires
Le système doit être le meilleur dans tous les casSuite de tests avec couverture maximale
Mêmes ressources/Puissances di�érentesRessources di�érentes/Puissances identiques
Georges et al., Energy- and Heat-aware HPC Benchmarks, EuroEcoDc workshop, 2013
[email protected] 19/77
Boucle autonome Décision Évolution Et au delàModèles et Métriques Mesures Outils d'évaluation
Conclusion
Étude d'un système
Pour quel usage ?Trois notions sont liées pour utiliser la réponse :
Équilibre du front de précision de la modélisation∗
Objectifs utilisés pour choisir la méthode de comparaisonScenarii pour réaliser la comparaison
∗ Georges et al., Modèles �uides pour l'économie d'énergie dans les grilles par migration : une première
approche, RenPar conférence, 2009
[email protected] 20/77
Boucle autonome Décision Évolution Et au delàModèles et Métriques Mesures Outils d'évaluation
Infrastructure de mesure
Base pour pour prendre la décisionBase pour évaluer les métriques
Infrastructure classique (nagios, ganglia, ...)Problème du passage à l'échelle
Des valeurs inutilisées ou agrégées tardivement
Des mesures (processeur, mémoire), pas de la connaissanceBesoin de mesures haut niveauUne (phase d') applicationLa puissance électrique consommée par une application
[email protected] 21/77
Boucle autonome Décision Évolution Et au delàModèles et Métriques Mesures Outils d'évaluation
Quelle (phase d') applica-tion s'exécute
Une phase : comportementlocalement régulier
Équivaut à consommation deressource constanteMesures systèmes constantes
Détection puis identi�cationSignature d'une phasePhase équivalente ∼ impactéquivalent
Landry et al., Exploiting performance counters to predict and
improve energy performance of HPC systems, FGCS journal,
2014.
Temps (s)
Tem
ps
(s)
Dis
tance
norm
alis
ée
{{
{{
4 phasesidentiques
Phaseen courssemblable
{
Matrice de similitude des mesures
systèmes (WRF : Weather Research and
Forecasting)
[email protected] 22/77
Boucle autonome Décision Évolution Et au delàModèles et Métriques Mesures Outils d'évaluation
Détection externe d'application
Récupérer les valeurs systèmes estintrusif
Diminuer le nombre de valeurs
Récupérer des valeurs externes(puissance, réseau)
S'autoriser les outils statistiques
Étudier le comportement au coursdu temps
Georges et al., Characterizing applications from power
consumption : A case study for HPC benchmarks, ICT-GLOW
Symposium, 2011
[email protected] 23/77
Boucle autonome Décision Évolution Et au delàModèles et Métriques Mesures Outils d'évaluation
Détection externe d'application
Récupérer les valeurs systèmes estintrusif
Diminuer le nombre de valeurs
Récupérer des valeurs externes(puissance, réseau)
S'autoriser les outils statistiques
Étudier le comportement au coursdu temps
Georges et al., Characterizing applications from power
consumption : A case study for HPC benchmarks, ICT-GLOW
Symposium, 2011
0
2e+07
4e+07
6e+07
8e+07
1e+08
1.2e+08
0 10 20 30 40 50 60 70 80
Num
ber
of byte
s s
ent per
second
time (s)
benchmark CG (NPB)
[email protected] 23/77
Boucle autonome Décision Évolution Et au delàModèles et Métriques Mesures Outils d'évaluation
Détection externe d'application
Récupérer les valeurs systèmes estintrusif
Diminuer le nombre de valeurs
Récupérer des valeurs externes(puissance, réseau)
S'autoriser les outils statistiques
Étudier le comportement au coursdu temps
Georges et al., Characterizing applications from power
consumption : A case study for HPC benchmarks, ICT-GLOW
Symposium, 2011
0
2e+07
4e+07
6e+07
8e+07
1e+08
1.2e+08
0 50 100 150 200 250 300 350
Num
ber
of byte
s s
ent per
second
time (s)
benchmark SP (NPB)
[email protected] 23/77
Boucle autonome Décision Évolution Et au delàModèles et Métriques Mesures Outils d'évaluation
Détection externe d'application
Récupérer les valeurs systèmes estintrusif
Diminuer le nombre de valeurs
Récupérer des valeurs externes(puissance, réseau)
S'autoriser les outils statistiques
Étudier le comportement au coursdu temps
Georges et al., Characterizing applications from power
consumption : A case study for HPC benchmarks, ICT-GLOW
Symposium, 2011
[email protected] 23/77
Boucle autonome Décision Évolution Et au delàModèles et Métriques Mesures Outils d'évaluation
Puissance des serveurs etapplications
Wattmètres pas toujours disponibles (niveau application)
Modèle liant mesures systèmes à la puissanceAnalytique
Utilise les Datasheets. Très simple à mettre en oeuvre :PowerAPI
[email protected] 24/77
Boucle autonome Décision Évolution Et au delàModèles et Métriques Mesures Outils d'évaluation
Puissance des serveurs etapplications
Wattmètres pas toujours disponibles (niveau application)
Modèle liant mesures systèmes à la puissanceMéthode par apprentissage
Bonne couverture de la base d'apprentissage et faible impactde la mesure
Charge synthétique générique, 220 valeurs mesurées (4% augmentation puissance), 8 gardées
[email protected] 24/77
Boucle autonome Décision Évolution Et au delàModèles et Métriques Mesures Outils d'évaluation
Puissance des serveurs etapplications
Wattmètres pas toujours disponibles (niveau application)
Modèle liant mesures systèmes à la puissanceMéthode par apprentissage
Bonne couverture de la base d'apprentissage et faible impactde la mesure
20% des valeurs prises par des jeux de tests HPC ne sont pas atteintes
[email protected] 24/77
Boucle autonome Décision Évolution Et au delàModèles et Métriques Mesures Outils d'évaluation
Réseau de neurones VS mod-èle capacitif
0 500 1000 1500 2000 250030
40
50
60
70
80
Pow
er (W
)
Power Model: Neural Network (all)
MeasuredEstimated
−20 −10 0 10 200
100
200
300
400
500
600
700
Num
ber o
f ele
men
ts
Error (W)
MAPE=1.83%
30 40 50 60 70 8030
40
50
60
70
80
Out
put ~
= 0.
92*T
arge
t+3.
64
Target
R2=0.9509
0 500 1000 1500 2000 250030
40
50
60
70
80
Pow
er (W
)
Power Model: w0 + w1*CPUu*CPUaf
MeasuredEstimated
−10 0 10 20 300
50
100
150
200
250
300
Num
ber o
f ele
men
ts
Error (W)
MAPE=5.42%
30 40 50 60 70 8030
40
50
60
70
80
Out
put ~
= 0.
71*T
arge
t+12
.99
Target
R2=0.7144
(a)ANN regression using all K PIs. (b)Calibrated capacitivemodel.
[email protected] 25/77
Boucle autonome Décision Évolution Et au delàModèles et Métriques Mesures Outils d'évaluation
Résultat des méthodes parapprentissage
Erreur de deux modèles : Aggregated (régression linéaire sur somme des sous-modèles) et ANN (réseau
de neurones)
Majorité de modèles 5% d'erreurRéférence du domaine : Rivoire et Al. A Comparison of
High-Level Full-System Power Models
Leandro Modeling the power consumption of computing systems and applications through Machine
Learning techniques, [email protected] 26/77
Boucle autonome Décision Évolution Et au delàModèles et Métriques Mesures Outils d'évaluation
Conclusion
Approches actuelles nécessitent une vue globalePassage à l'échelleProblème de latenceBeaucoup de décisions sont locales (DVFS, échange decharge,...)
Problèmes ouvertsGranularité de la mesure adaptative et multi-échelleIndépendance temporelle et spatialeGénération suite synthétique avec couverture maximale
[email protected] 27/77
Boucle autonome Décision Évolution Et au delàModèles et Métriques Mesures Outils d'évaluation
Outils d'évaluation: expéri-mentation, simulation
Pour améliorer il faut comparerTrois grandes méthodes
Modèles mathématiquesSimulationExpérimentation
[email protected] 28/77
Boucle autonome Décision Évolution Et au delàModèles et Métriques Mesures Outils d'évaluation
Programmation linéaire
Expliciter toutes les contraintes pardes équations linéaires
Exprimer l'objectif sous formed'une fonction à minimiser
Formalise les leviers et leur impact
Approximation du monde réel(phénomènes quadratiques)
Résolution exacte possible pour lespetits cas
Exemple : Un service est surun serveur unique
Soit ejh la présence duservice j sur le serveur h
ejh = 1 ssi le service jest sur le serveur h
∀j , h ejh ∈ {0, 1},∀j
∑h ejh = 1
Damien et al., Energy-Aware Service Allocation, FGCS journal, 2011
[email protected] 29/77
Boucle autonome Décision Évolution Et au delàModèles et Métriques Mesures Outils d'évaluation
Programmation linéaire
Expliciter toutes les contraintes pardes équations linéaires
Exprimer l'objectif sous formed'une fonction à minimiser
Formalise les leviers et leur impact
Approximation du monde réel(phénomènes quadratiques)
Résolution exacte possible pour lespetits cas
Exemple : Minimiser lapuissance totale consommée
Pstath et Pdyn
h :puissances statique etdynamique du serveur h(modèle a�ne)
Soit αjh la fraction deressources processeurdu service j sur leserveur h
Minimiser∑h (P
stath +
∑j αjhP
dynh )
Damien et al., Energy-Aware Service Allocation, FGCS journal, 2011
[email protected] 29/77
Boucle autonome Décision Évolution Et au delàModèles et Métriques Mesures Outils d'évaluation
Programmation linéaire
Expliciter toutes les contraintes pardes équations linéaires
Exprimer l'objectif sous formed'une fonction à minimiser
Formalise les leviers et leur impact
Approximation du monde réel(phénomènes quadratiques)
Résolution exacte possible pour lespetits cas
Contraintes :∀h ph ∈ {0, 1}
∀j∑
h ejh = 1, ∀j, h ejh ∈{0, 1}, αjh ≤ ejh,mjh ≤ ejh
∀j vj ∈ {0, 1}, ∀h∑
j αjh ≤vj ,
∑j mjh ≤ vj
∀j, h ph ≤ (1− ejh) + vj∀j, h vj ≤ (1− ejh) + ph
∀h∑
j αjh/rj ≤ vj∀j
∑h mjh ≤ vj
Réduire la puissance sous contrainte deperformance :
∀j∑
h αjh/rj > Seuil
min(∑
h (Pminh
+∑
j αjh × (Pmaxh− Pmin
h))
Damien et al., Energy-Aware Service Allocation, FGCS journal, 2011
[email protected] 29/77
Boucle autonome Décision Évolution Et au delàModèles et Métriques Mesures Outils d'évaluation
Passage à l'échelle (program-mation linéaire)
Méthode exacte: Temps de résolution exponentiel en fonctiondes variables entières
6 serveurs, 16 services : 3 minutes (GLPK)
Méthode des variables constantes
Fixe certaines variables, résout, change de variables, itèreMoins bon que l'optimal, mais peut être très rapide
Relaxation de la contrainte entière
Meilleur que l'optimal (un service à moitié sur une machine età moitié sur une autre)
Avec les deux on peut donner un intervalle
[email protected] 30/77
Boucle autonome Décision Évolution Et au delàModèles et Métriques Mesures Outils d'évaluation
Passage à l'échelle (program-mation linéaire)
Méthode exacte: Temps de résolution exponentiel en fonctiondes variables entières
6 serveurs, 16 services : 3 minutes (GLPK)
Méthode des variables constantesFixe certaines variables, résout, change de variables, itèreMoins bon que l'optimal, mais peut être très rapide
Relaxation de la contrainte entière
Meilleur que l'optimal (un service à moitié sur une machine età moitié sur une autre)
Avec les deux on peut donner un intervalle
[email protected] 30/77
Boucle autonome Décision Évolution Et au delàModèles et Métriques Mesures Outils d'évaluation
Passage à l'échelle (program-mation linéaire)
Méthode exacte: Temps de résolution exponentiel en fonctiondes variables entières
6 serveurs, 16 services : 3 minutes (GLPK)
Méthode des variables constantesFixe certaines variables, résout, change de variables, itèreMoins bon que l'optimal, mais peut être très rapide
Relaxation de la contrainte entièreMeilleur que l'optimal (un service à moitié sur une machine età moitié sur une autre)
Avec les deux on peut donner un intervalle
[email protected] 30/77
Boucle autonome Décision Évolution Et au delàModèles et Métriques Mesures Outils d'évaluation
Passage à l'échelle (program-mation linéaire)
Méthode exacte: Temps de résolution exponentiel en fonctiondes variables entières
6 serveurs, 16 services : 3 minutes (GLPK)
Méthode des variables constantesFixe certaines variables, résout, change de variables, itèreMoins bon que l'optimal, mais peut être très rapide
Relaxation de la contrainte entièreMeilleur que l'optimal (un service à moitié sur une machine età moitié sur une autre)
Avec les deux on peut donner un intervalle
[email protected] 30/77
Boucle autonome Décision Évolution Et au delàModèles et Métriques Mesures Outils d'évaluation
Simulation
Grand nombre de simulateurs existent : SimGrid, DCWorms,CloudSim, ...Besoins dans notre domaine
Modèle de cloud (migration, sur-allocation de ressources,fédération†)Gestion du DVFSPuissance électriqueTempérature
La situation évolueDVFS et gestion �ne du cloud dans CloudSimThermique dans DCWorms∗
DVFS et énergie dans SimGrid
∗ Wojtek et al., Energy and thermal models for simulation of workload and resource management in
computing systems, SMPT journal, 2015. †Thiam et al., Cooperative Scheduling Anti-load balancing
Algorithm for Cloud, CCTS workshop, 2013
[email protected] 31/77
Boucle autonome Décision Évolution Et au delàModèles et Métriques Mesures Outils d'évaluation
Ajout du DVFS dans CloudSim
Simulateurs du monde des Grillesde calcul
Grande stabilité dans le tempsRessources utilisées à 100%
DVFS provoque décalaged'événements
Gestion temporelle �ne (1/10 s)
Tom et al., Energy-aware simulation with DVFS, SMPT
journal, 2013
[email protected] 32/77
Boucle autonome Décision Évolution Et au delàModèles et Métriques Mesures Outils d'évaluation
Des simulateurs ad-hoc : Réin-venter la roue ?
Des simulateurs simplistes
Permet de tester une idée à moindre coûtNécessaire de s'arrêter au bon niveau de complexité
Simulateur d'architectures hétérogènes∗
Pas de simulation du réseauExemple: prouver l'utilité de l'hétérogénéité pour atteindre unsystème proportionnel
∗ Georges, Heterogeneity: The Key to Achieve Power-Proportional Computing, CCGrid conférence,
2013.
[email protected] 33/77
Boucle autonome Décision Évolution Et au delàModèles et Métriques Mesures Outils d'évaluation
Expérimentation
Un modèle est toujours approché
Validation �nale par expérimentationCompliqué par la nécessité d'avoir des informations électriques
A Lyon, parmi les premier à expérimenter la capture depuissance à grande échelle (GreenNet)
Problème des mesures distribuées, conversions électriques,impact de la mesure (compteurs de performance)
Problème de la reproductibilité
[email protected] 34/77
Boucle autonome Décision Évolution Et au delàModèles et Métriques Mesures Outils d'évaluation
Reproductibilité d'une expéri-ence
Expérimentation simple deTransformée de Fourier (NPB)
100 expériences sur les mêmesmachines (Grid'5000)Grande variation
Temps: 12s, 7% (Std. Dev. 3.2s)Énergie: 9.3kJ, 5.5% (3kJ)
Pour un même temps, 167s,di�érence de 4kJ
Temps 6= Énergie
162
164
166
168
170
172
174
164 166 168 170 172 174 176
Tem
ps
(s)
Energie (kJ)
Transformée de fourrier
[email protected] 35/77
Boucle autonome Décision Évolution Et au delàModèles et Métriques Mesures Outils d'évaluation
Conclusion
Tous les outils sont limitésModélisation: Approximatif ou optimal inatteignableSimulation: ApproximatifExpérimentation: Reproductibilité et très sensible
Investissement très fort nécessaire
Simulation : Bon rapport qualité/temps
Di�culté de tester In-Vivo
[email protected] 36/77
Boucle autonome Décision Évolution Et au delàPlacement Fédération de clouds Data center in the box
Plan
1 Boucle autonomeModèles et MétriquesMesuresOutils d'évaluation
2 DécisionPlacementFédération de cloudsData center in the box
3 Évolution, optimisation des noeudsGros grainMoyen GrainGrain �n
4 Et au delà
[email protected] 37/77
Boucle autonome Décision Évolution Et au delàPlacement Fédération de clouds Data center in the box
Approches exactes et heuris-tiques
Deux problèmesPlacementTemporalité
Les heuristiques classiques du placementGloutons Best Fit, First FitVector Packing (Glouton gourmet)Algorithmes Génétiques
[email protected] 38/77
Boucle autonome Décision Évolution Et au delàPlacement Fédération de clouds Data center in the box
Les algorithmes gloutons clas-siques
CaractéristiquesMémoireProcesseur
Tri des services
Tri des machines
Pas de remise encause
3 3
2 2
4
4
1
1
10% 60% 50% 50% 20% 20% 80% 10%
CPU RAM
Tâches
First-Fit et Best-Fitmémoire
1
13
3
2 2
4
4
1
1 2 23 3
4
4
Round Robin
2 2
3 3
1
1
4
4
Vector Packing
2 2
4
4
3
3
First-Fit et Best-Fitprocesseur
1
1
CPU RAMServeur 1
CPU RAMServeur 2
CPU RAMServeur 3
CPU RAM CPU RAM CPU RAM
CPU RAMServeur 1
CPU RAMServeur 2
CPU RAMServeur 3
CPU RAMServeur 1
CPU RAMServeur 2
CPU RAMServeur 3
CPU RAMServeur 1
CPU RAMServeur 2
CPU RAMServeur 3
[email protected] 39/77
Boucle autonome Décision Évolution Et au delàPlacement Fédération de clouds Data center in the box
Vector packing gourmet
4 objectifs dans la fonction de triServeur est énergétiquementattractifRajouter la tâche ne surchargepasServeur alluméLa tâche rétablit l'équilibre dansles ressources
Temps �seulement�enO(J × H ln(H))
Mais la solution du gourmet estdi�cile à quali�er
Damien et al., Energy-Aware Service Allocation, FGCS journal, 2012.
[email protected] 40/77
Boucle autonome Décision Évolution Et au delàPlacement Fédération de clouds Data center in the box
Algorithmes Génétiques
Chromosome = Allocation
Génération aléatoire initialeÀ chaque génération :
Croisements et mutationTri sur la métrique d'objectifGarder les meilleurs
Tom et al., Quality of Service Modeling
for Green Scheduling in Clouds,
SUSCOM journal, 2014
[email protected] 41/77
Boucle autonome Décision Évolution Et au delàPlacement Fédération de clouds Data center in the box
Métriques pour AlgorithmesGénétique
Contrairement aux gloutons on peut optimiser une métriquedirectementExemples de métriques
Énergie, Performance, Résilience, Dynamisme
Nom GACoe�cients appliqués aux métriques
ÉnergieTemps
Robustesse Dynamismede réponse
GA_All 1 1 1 1GA_Energy 1 0 0 0GA_RespT 0 1 0 0GA_Rob 0 0 1 0GA_Dyn 0 0 0 1
[email protected] 42/77
Boucle autonome Décision Évolution Et au delàPlacement Fédération de clouds Data center in the box
Résultats de l'algorithme géné-tique
Chaque algorithmeest meilleur dansson domaine(Énergie)
GA_All très bonpartout
400 services sur110 machines,environ 40s
Tenir compted'une métrique estdéjà trèsimportant
[email protected] 43/77
Boucle autonome Décision Évolution Et au delàPlacement Fédération de clouds Data center in the box
Glouton Flou
Avantage du G.A. : viser un objectifMéthode similaire pour glouton
Famille de gloutonGarde le meilleurDé�nir le meilleur ?
Multi-objectif : �ou Optimal sur E relaché
Famille de Gloutons
Nouvel optimal
Hong Yang et al., Multi-Objective Scheduling for Heterogeneous Server Systems with Machine
Placement, CCGRID conférence, 2014
[email protected] 44/77
Boucle autonome Décision Évolution Et au delàPlacement Fédération de clouds Data center in the box
Ce qui rend la puissance/énergieunique
Le coté temporelInertie liée à latempératureAllumage et extinctionde serveurs
Sur- ouSous-réservation
Les cycles sont parfoisbon
Les non linéaritésÉquation de puissance
Les boucles derétroaction
Système derefroidissement
Violaine et al., Thermal-aware cloud middleware to
reduce cooling needs, WETICE workshop, 2014
[email protected] 45/77
Boucle autonome Décision Évolution Et au delàPlacement Fédération de clouds Data center in the box
À l'échelle de la fédérationde clouds
Opérateur loue les ressources de sesconcurrents (itinérance télécom)
Méthode semblable au super-peers
Distribué ou centralisé, mêmesperformances
Thiam et al., Cooperative
Scheduling Anti-load balancing
Algorithm for Cloud : CSAAC,
CCTS workshop, 2013
[email protected] 46/77
Boucle autonome Décision Évolution Et au delàPlacement Fédération de clouds Data center in the box
Follow the sun, Follow themoon
Approches classiquesConsolidation entre les centres de calculsGestion coordonnée de la QoS (ex: CDN)
Suivre les conditions des centres de calculsLa nuit, moins de frais de coolingLe jour, plus de production renouvelable
[email protected] 47/77
Boucle autonome Décision Évolution Et au delàPlacement Fédération de clouds Data center in the box
À l'échelle du Data center
in the box
Échelle du Rack
Peu de services : Forte variabilité
Adaptation parfaite à la chargeActuellement coûteux : Sur-coûtinitial
ClimatisationTout ce qui est négatif dans lePUE
Architecture proportionnelle
Violaine et al., Big, Medium, Little : Reaching Energy Proportionality with Heterogeneous Computing
Scheduler, Parallel Processing Letters, journal, 2015.
[email protected] 48/77
Boucle autonome Décision Évolution Et au delàPlacement Fédération de clouds Data center in the box
À l'échelle du Data center
in the box
Échelle du Rack
Peu de services : Forte variabilité
Adaptation parfaite à la chargeActuellement coûteux : Sur-coûtinitial
ClimatisationTout ce qui est négatif dans lePUE
Architecture proportionnelle
Violaine et al., Big, Medium, Little : Reaching Energy Proportionality with Heterogeneous Computing
Scheduler, Parallel Processing Letters, journal, 2015.
[email protected] 48/77
Boucle autonome Décision Évolution Et au delàPlacement Fédération de clouds Data center in the box
Exemple de proportionnal-ité
Accès au serveurs web de la coupe du monde de football 1998
[email protected] 49/77
Boucle autonome Décision Évolution Et au delàPlacement Fédération de clouds Data center in the box
Architecture proportionnelle
Application : serveur webArchitecture matérielle
Raspberry Pi, Intel Atom et I7
Processor Watt range Max request/s E�ciencyIntel I7 11 - 42 353 .12 W/r/sIntel Atom 8 - 9 34 .26 W/r/sRaspberry Pi 2.56 - 2.81 5.6 .50 W/r/s
Da Costa, Heterogeneity, the key to reach proportionality, CCGRID 2014
[email protected] 50/77
Boucle autonome Décision Évolution Et au delàPlacement Fédération de clouds Data center in the box
Comparaison des cocktailsd'architectures
0
1e+06
2e+06
3e+06
4e+06
5e+06
6e+06
0 10 20 30 40 50 60 70 80 90 100
Energ
ie (
J)
Temps (jour)
Serveur proportionnelServeurs hétérogènes (I7, Atom, RaspberryPi)
Intel I7
[email protected] 51/77
Boucle autonome Décision Évolution Et au delàPlacement Fédération de clouds Data center in the box
Comparaison des cocktailsd'architectures
0
1e+06
2e+06
3e+06
4e+06
5e+06
6e+06
0 10 20 30 40 50 60 70 80 90 100
Energ
ie (
J)
Temps (jour)
Serveur proportionnelServeurs hétérogènes (I7, Atom, RaspberryPi)
Intel I7
1
10
100
0 10 20 30 40 50 60 70 80 90 100Energ
y Ineffi
ciency
(Pro
port
ional=
1)
Time (day)
Proportional hardwareHeterogeneous hardware
Intel I7Intel Atom
Raspberry Pi
[email protected] 51/77
Boucle autonome Décision Évolution Et au delàGros grain Moyen Grain Grain �n
Plan
1 Boucle autonomeModèles et MétriquesMesuresOutils d'évaluation
2 DécisionPlacementFédération de cloudsData center in the box
3 Évolution, optimisation des noeudsGros grainMoyen GrainGrain �n
4 Et au delà
[email protected] 52/77
Boucle autonome Décision Évolution Et au delàGros grain Moyen Grain Grain �n
Vers le futur
Un plus grand nombre de centres de calculBeaucoup de plus petits (gestion hybride)
La connaissance : ressource critique
Un grand nombre de tailles diversesQuelques plus grands (2016 : 6 300 000m2)
De manière globale des centres de calcul plus intégrés dansleur environnement
Aspects électriquesAspects thermiques
[email protected] 53/77
Boucle autonome Décision Évolution Et au delàGros grain Moyen Grain Grain �n
À l'échelle du n÷ud
Trois temporalitésGros grain (minute) : Fréquence optimale en fonction dugraphe de tâches∗
13% d'économie d'énergie
Moyen Grain (seconde) : Détection de phase†
20% d'économie d'énergie, 3% augmentation du temps
Grain �n (1/10s) : Politique noyau de gestion de fréquence‡
25% d'économie d'énergie, 1% réduction du temps
Pas de coordination entre les trois temporalités, pas d'objectif
∗ Tom et al., Energy-aware simulation with DVFS, SMPT journal, 2013 †Landry et al., Exploiting
performance counters to predict and improve energy performance of HPC systems, SUSCOM journal,
2014 ‡Georges et al., DVFS governor for HPC: Higher, Faster, Greener, PDP conférence, 2015
[email protected] 54/77
Boucle autonome Décision Évolution Et au delàGros grain Moyen Grain Grain �n
À l'échelle du n÷ud: Grosgrain
Utilisation d'informations extérieures contextuelles
Exemple au niveau du scheduler : DAG de tâches
[email protected] 55/77
Boucle autonome Décision Évolution Et au delàGros grain Moyen Grain Grain �n
Coordination des vitesses desnoeuds
[email protected] 56/77
Boucle autonome Décision Évolution Et au delàGros grain Moyen Grain Grain �n
Coordination des vitesses desnoeuds
Généralisation auchemin critique
[email protected] 56/77
Boucle autonome Décision Évolution Et au delàGros grain Moyen Grain Grain �n
Action au niveau du noeud
[email protected] 57/77
Boucle autonome Décision Évolution Et au delàGros grain Moyen Grain Grain �n
Action au niveau du noeud
Pour aller plus loinAllumer/Éteindreles serveursGérer latempérature
[email protected] 57/77
Boucle autonome Décision Évolution Et au delàGros grain Moyen Grain Grain �n
À l'échelle du n÷ud: Moyengrain
Réactions à latence moyenne au niveau du noeudChangement de fréquence processeurChangement de mode du disque durRecon�guration de la carte réseau
Détection de la phase actuelle
Réaction en fonction du pro�l
Impact léger sur l'infrastructure
[email protected] 58/77
Boucle autonome Décision Évolution Et au delàGros grain Moyen Grain Grain �n
Consommation de ressourcesd'une application complexe
0
0.002
0.004
0.006
0.008
0.01
0.012
0 50 100 150 200 250 300 350
Co
un
ters
ac
ce
ss
ra
te
Time (s)
Idle
MG
BT
EP
IS CG
branch missescache references
cache misses
[email protected] 59/77
Boucle autonome Décision Évolution Et au delàGros grain Moyen Grain Grain �n
Les phases de consomma-tion de ressources constantes
0
2
4
6
8
10
0 50 100 150 200 250 300 350
ph
ase id
time (s)
Idle
MG
BT
EP IS
CG
[email protected] 60/77
Boucle autonome Décision Évolution Et au delàGros grain Moyen Grain Grain �n
Méthode de décision
Label de phase Décision de recon�guration possible
compute-intensive éteindre les bancs mémoires inutilisés; mettre le disque en sommeil;
mettre le processeur à fréquence maximale;
mettre les interfaces réseaux en sommeil.
memory-intensive réduire la fréquence du processeur; mettre le disque en sommeil;
ou réduire sa vitesse; allumer tous les bancs mémoires.
mixed allumer tous les bancs mémoire; augmenter la fréquence du processeur;
mettre le disque en sommeil; mettre les interfaces réseaux en sommeil.
communication éteindre les bancs mémoire; réduire la fréquence du processeur;
intensive allumer le disque.
IO-intensive allumer les bancs mémoire; réduire la fréquence du processeur;
augmenter la vitesse du disque.
[email protected] 61/77
Boucle autonome Décision Évolution Et au delàGros grain Moyen Grain Grain �n
Energie et performance, 28noeuds
-20 %
-15 %
-10 %
-5 %
0 %
5 %
10 %
CG MG POP X1 GeneHunter WRF MDS
Ener
gy c
onsu
mpt
ion
/ ext
ra e
xecu
tion
time
Energy consumption Execution time
[email protected] 62/77
Boucle autonome Décision Évolution Et au delàGros grain Moyen Grain Grain �n
Grain �n = DVFS ?
Valeurs relatives entre les gouverneurs performance et ondemand
Benchmark FT SP BT EP LU IS CGTime increase (%) 0 -3 -1 1 -2 2 0Energy increase (%) 0 -3 -1 -1 -2 -1 -1
Les applications HPC sont rarement en Idle... Surprise !
Les bibliothèques MPI font de l'attente active
Classical HPC benchmarks from NPB (Nas Parallel Benchmark)
[email protected] 63/77
Boucle autonome Décision Évolution Et au delàGros grain Moyen Grain Grain �n
Le DVFS = fonction de lacharge
80
90
100
110
120
130
140
150
FT SP BT EP LU IS CG
meta_sched2_0.05smart3
meta_schedondemand
meta_sched2_0.01meta_sched2_1
smart2_0.5conservative
smart2_0.2smart2_0.01
smart2_0.1meta_sched3smart2_0.05performance
meta_sched2_0.2meta_sched2_0.1
smart2_1powersave
meta_sched2_0.5smart
[email protected] 64/77
Boucle autonome Décision Évolution Et au delàGros grain Moyen Grain Grain �n
Le DVFS a pourtant du po-tentiel
Valeurs relatives entre performance et powersave
Benchmark FT SP BT EP LU IS CGTime increase (%) 36 69 110 159 96 35 83Energy increase (%) -18 2 21 50 16 -19 7
Le temps augmente, mais jusqu'à 19% de réduction de laconsommation d'énergie !
[email protected] 65/77
Boucle autonome Décision Évolution Et au delàGros grain Moyen Grain Grain �n
Hypothèse HPC
États des applicationsCalculCommunicationsDisk I/OIdle
[email protected] 66/77
Boucle autonome Décision Évolution Et au delàGros grain Moyen Grain Grain �n
Hypothèse HPC
États des applicationsCalculCommunications
Disk I/OIdle
[email protected] 66/77
Boucle autonome Décision Évolution Et au delàGros grain Moyen Grain Grain �n
Décision
Énergie pour la fréquence max
(α+ β)P1
Énergie pour la fréquence min
(λα+ β)P2
On reste à fréquence maximum si on consomme moins d'énergie :
(α+ β)P1 < (λα+ β)P2
[email protected] 67/77
Boucle autonome Décision Évolution Et au delàGros grain Moyen Grain Grain �n
Comment mesurer α et β
Di�cile de mesurer directement α et βOn veut du runtime, pas de l'instrumentation de code
Facile de mesurer la bande passante réseau (avec Bm Bandepassante maximale)
Bw = Bm
β
α+ β
En fait α et β ne sont pas importantOn veut α
β , i.e. le ratio entre le time to compute et le time to
communicate
[email protected] 68/77
Boucle autonome Décision Évolution Et au delàGros grain Moyen Grain Grain �n
The great mix
Mélanger, servir:
Bw <Bm
λ− 1(λ− P1
P2) = B1
B1 : Bande passante limite à fréquence max pour utiliser ou non leDVFS
Dans l'autre sens
B2 =Bm
λ− 1(λ
P2
P1− 1)
B2 : Bande passante limite à fréquence min pour utiliser ou non leDVFS
[email protected] 69/77
Boucle autonome Décision Évolution Et au delàGros grain Moyen Grain Grain �n
Ajout d'un hystéresis pourl'inertie
Algorithme NetSched
Tous les 10emes de seconde, faire:Si Current_Frequency = Slowest frequency et IBR ≤ .9B1
Changer la fréquence vers Fastest
Si Current_Frequency = Fastest frequency et IBR ≥ 1.1B2
Changer la fréquence vers Slowest
Sinon, ne rien faire
IBR : Incoming Byte Rate
[email protected] 70/77
Boucle autonome Décision Évolution Et au delàGros grain Moyen Grain Grain �n
Environment expérimental
Serveurs (thanks Grid5000)Processeurs : bi Dual-Core AMD Opteron (2218)Mémoire : 8GBCarte réseau : Gigabyte EthernetFréquence : 2.6GHz and 1GHzPuissance électrique : P1 = 280W et P2 = 152W
Benchmark7 Nas Parallel Benchmark (NPB)
GouverneursPerformance/Powersave/OndemandNetSched
1.1B1 ' 7.107 et 0.9B2 ' 3.107
[email protected] 71/77
Boucle autonome Décision Évolution Et au delàGros grain Moyen Grain Grain �n
Exemple d'exécution
Communication réseau en fonction du temps
0
2e+07
4e+07
6e+07
8e+07
1e+08
1.2e+08
10 20 30 40 50 60 70 80 90 100
Inco
min
g b
andw
idth
(B
yte
s/s)
Time (normalized)
0
2e+07
4e+07
6e+07
8e+07
1e+08
1.2e+08
10 20 30 40 50 60 70 80 90 100
Inco
min
g b
and
wid
th (
Byte
s/s)
Time (normalized)
SPEPCGLUFTBTIS
performance powersave
[email protected] 72/77
Boucle autonome Décision Évolution Et au delàGros grain Moyen Grain Grain �n
Résultats: Makespan
80
100
120
140
160
180
200
220
240
260
IS FT SP CG LU BT EP
Mak
espa
n (in
% o
f per
form
ance
)
performancepowersavenet_schedondemand
[email protected] 73/77
Boucle autonome Décision Évolution Et au delàGros grain Moyen Grain Grain �n
Résultats: Energy-to-solution
70
80
90
100
110
120
130
140
150
160
IS FT SP CG LU BT EP
Ener
gy (i
n %
of p
erfo
rman
ce)
performancepowersavenet_schedondemand
[email protected] 74/77
Boucle autonome Décision Évolution Et au delà
Plan
1 Boucle autonomeModèles et MétriquesMesuresOutils d'évaluation
2 DécisionPlacementFédération de cloudsData center in the box
3 Évolution, optimisation des noeudsGros grainMoyen GrainGrain �n
4 Et au delà
[email protected] 75/77
Boucle autonome Décision Évolution Et au delà
Le chaînon manquant entreles échelles
Une activité �artisanale�Un grand nombre d'intergiciels indépendantsDes manipulations humaines
Vers une coopération décentralisée
[email protected] 76/77
Boucle autonome Décision Évolution Et au delà
Coopération entre les échellesde décision
1 Situation initiale à l'équilibre
2 Baisse de la production solaire
3 Tâche non critique : DVFSagressif
3 Tâche critique : dynamismeindisponible
4 Tâche critique cherche positionadéquate
5 Extinction d'une machine
6 DVFS moins agressif
VM1
VM2
[email protected] 77/77
Boucle autonome Décision Évolution Et au delà
Coopération entre les échellesde décision
1 Situation initiale à l'équilibre
2 Baisse de la production solaire
3 Tâche non critique : DVFSagressif
3 Tâche critique : dynamismeindisponible
4 Tâche critique cherche positionadéquate
5 Extinction d'une machine
6 DVFS moins agressif
VM1
VM2
[email protected] 77/77
Boucle autonome Décision Évolution Et au delà
Coopération entre les échellesde décision
1 Situation initiale à l'équilibre
2 Baisse de la production solaire
3 Tâche non critique : DVFSagressif
3 Tâche critique : dynamismeindisponible
4 Tâche critique cherche positionadéquate
5 Extinction d'une machine
6 DVFS moins agressif
VM1
VM2
[email protected] 77/77
Boucle autonome Décision Évolution Et au delà
Coopération entre les échellesde décision
1 Situation initiale à l'équilibre
2 Baisse de la production solaire
3 Tâche non critique : DVFSagressif
3 Tâche critique : dynamismeindisponible
4 Tâche critique cherche positionadéquate
5 Extinction d'une machine
6 DVFS moins agressif
VM2
VM1
[email protected] 77/77
Boucle autonome Décision Évolution Et au delà
Coopération entre les échellesde décision
1 Situation initiale à l'équilibre
2 Baisse de la production solaire
3 Tâche non critique : DVFSagressif
3 Tâche critique : dynamismeindisponible
4 Tâche critique cherche positionadéquate
5 Extinction d'une machine
6 DVFS moins agressif
VM2
VM1
[email protected] 77/77