les réseaux de neurones artificiels (rna) un outil efficace pour appréhender le caractère...
TRANSCRIPT
Les réseaux de neurones artificiels (RNA)
Un outil efficace pour appréhender le caractère
saisonnier des débits dans un bassin versant ?
Dilemme de la modélisation hydrologique
• Tend vers la prédiction• Prédiction basée sur des séries hydrologiques
• Le DÉBAT : Ces séries sont-elles chaotiques ?– Si OUI, problème majeur
• Recours à l’APPROCHE NEURONALE
Qu’est-ce qu’un RNA ?
Ce qu’on veut faire :
Étudier le comportement intelligent du RN, qui émerge de la structure et du comportement
des éléments de base (les neurones)
Réseau
Stimulus Réponse
0 1 0 1 1 1 0 0
1 1 00 10 10
Architecture d’un RNA
Coulibaly et al., 1999
Les RNA sont…
• Nouvel outil d’approximation des systèmes complexes
• Efficaces lorsque les systèmes sont non linéaires
Les RNA sont-ils… ?
Capables de capter et de reproduire la variabilité et les effets de saisonnalité qui
existent dans certaines séries hydrologiques ?
Site d’étude : Bassin versant de l’Hermine (0,05 km²)– Variabilité inter-saisonnière très forte– Variabilité intra-saisonnière également forte
CONSTRUIRE LE RNA
LES ÉTAPES
Rassembler les données
• Données enregistrées quotidiennement
Choisir la variable cible et les variables de forçage
Variable cibleLe débit moyen Q au jour t
Variables prédictives
Au jour t-n, avec n = 1, 2, 3 ou 5
Équation symbolique :
Le débit moyen Q
La quantité de pluie P
La quantité de neige N
La température moyenne T
( , , , )t t n t n t n t nQ f Q P N T
Choisir la structure du RNA
• Perceptron multicouches– 1 couche d’entrée, 1 couche cachée, 1 couche de sortie
• Algorithme d’apprentissage : Rétro-propagation
• Fonction d’activation– Couche d’entrée Couche cachée : tanh– Couche cachée Couche de sortie : linéaire
S Y S T E M E
couche
cachée
(hidden ) j
couche
d'entrée
(input) i
couche
de sortie
(output) k
Env
iron
nem
ent
Env
iron
nem
ent
11bias bias
j aj
ia
W ji
bias = 1
W bias
a f x e x e x
e x e x xfxfxf 1.1
Séparer l’ensemble de données initial
• Effet de saisonnalité– Données enregistrées à l’année longue– Données enregistrées sur chaque saison (PR, ET, AU)
• Phases ou étapes de travail– Sous-fichier d’apprentissage– Sous-fichier de validation– Sous-fichier de test
• Effet de la taille des sous-fichiers– Permutation
Entraîner le RNA
• Couche d’entrée : 4 variables + 1 neurone de biais
• Couche de sortie : 1 variable
• Couche cachée : On teste 3 options différentes– Même nombre de neurones que la couche d’entrée– 75 % de la couche d’entrée
– √(neurones d’entrée ∙ neurones de sortie)
Évaluer les résultats
1
( )²n
i ii
Q QRMSE
n
1
1
( )²1
( )²
n
i iin
ii
Q QEfficience
Q Q
2
1
1 1
( ) ( )²
( )² ( ) ²
n
i ii
n n
i ii i
Q Q Q Qr
Q Q Q Q
INTERPRÉTER LES RÉSULTATS
Points communs des simulations
• Concernant les sous-fichiers :– Les meilleurs résultats sont toujours ceux de
l’apprentissage– Performance moins bonne des phases de test et de
validation
• Concernant les variables prédictives :– Gradient des résultats en fonction de la valeur de n
– Plus la valeur de n est grande, plus le RNA a du mal à prédire Qt
( , , , )t t n t n t n t nQ f Q P N T
Résultats selon la période de l’année modélisée
• Architecture de base : RNA (5, 5, 1)
• Résultats assez surprenants– Efficience des données annuelles > Efficience des
données saisonnières– Meilleurs résultats saisonniers : Printemps
– Résultats les plus décevants : Été et automne
Débits réels et simulés par le RNA pour le fichier
ANSE1-1
Autres résultats pour le fichier ANSE1-1
Débits réels et simulés par le RNA pour les fichier PR-1 et
ET-1
Fichier ET-1
Fichier PR-1
Expliquer la contre-performance du RNA pour l’été et l’automne
• Hypothèse 1 : Conditions d’humidité antécédentes
0
5
10
15
20
25
30
35
1 51 101 151 201 251 301 351
0
10
20
30
40
50
60
70
80
90
Pluie (mm) Débit (mm/jour)
0
5
10
15
20
25
1 51 101 151 201 251 301 351
0
50
100
150
200
250
Pluie (mm) Neige (mm) Débit (mm/jour)
Expliquer la contre-performance du RNA pour l’été et l’automne
• Hypothèse 2 : Taille de l’ensemble de données initial
• Taille des fichiers de données annuelles : – 1462 échantillons
• Taille des fichiers de données saisonnières : – 368 ou 372 échantillons
Expliquer la contre-performance du RNA pour l’été et l’automne
En l’absence de données de conditions d’humidité antécédentes à fournir en « input » au RNA, comment s’assurer que ledit RNA identifie et
distingue les conditions sèches et les conditions humides par lui-même pour fournir des résultats
corrects ?
– Résultats saisonniers sont mauvais Le RNA ne fait pas la distinction
– Résultats annuels satisfaisants Le RNA fait la distinction
• Hypothèse 3 : Apprentissage non supervisé nécessitant beaucoup de données
superviseur
réseau
sortie désirée
sortie obtenue
erreur
EN
TR
EE
S
réseau sortie obtenueEN
TR
EE
S
Permutation des sous-ensembles de données
• Meilleurs résultats : Grand nombre d’échantillons affectés aux phases d’apprentissage et de validation
• Fichier ANSE1-1– Apprentissage sur 731 échantillons (366 de l’année 1996
humide et 365 de l’année 1997 sèche)– Validation sur 365 échantillons de l’année 2002 sèche– Test sur 366 échantillons de l’année 2004 humide
Efficience assez bonne• Fichier ANSE2-1
– Validation sur 731 échantillons (366 de l’année 1996 humide et 365 de l’année 1997 sèche)
Efficience meilleure que ANSE1-1• Fichier ANSE3-1
– Apprentissage sur une année humide seulement– Validation sur une année sèche uniquement
Efficience moins bonne, surtout pour la phase de test
Rôle du nombre de neurones dans la couche cachée
• Pas de différence significative entre :– RNA (5, 5, 1)– RNA (5, 4, 1)
– RNA (5, 2, 1)
Conclusion
• Bon potentiel des RNA en hydrologie
• L’application d’un RNA sur de grands ensembles de données non dépourvues de leurs tendances ou de leurs fluctuations saisonnières semble efficace
• Maier et Dandy (2000) : – There is a tendancy among users to throw a problem
blindly at a neural network in the hope that it will formulate an acceptable solution…
Questions ?