1
Un nouveau modèle statistique pour Un nouveau modèle statistique pour l’évaluation de l’abondance en espèces l’évaluation de l’abondance en espèces
marines marines à partir de données géo-référencées à partir de données géo-référencées
zero-inflatedzero-inflatedApplication à des données de relevés Application à des données de relevés
au chalut de fondau chalut de fondSophie Ancelet 1, Marie-Pierre Etienne 1 , Hugues Benoît 2, Eric Parent1
1 AgroParisTech/ENGREF, équipe MORSE, Paris2 Fisheries and Oceans Canada, Gulf Fisheries Centre, Moncton
8ème Forum Halieumétrique, La Rochelle , 21 Juin 2007
2
pêche commerciale massive au chalut et à la senne
surexploitation Constat: diminution inquiétantes des ressources halieutiques
Contexte Contexte
3
Misant sur le fait que plusieurs espèces Misant sur le fait que plusieurs espèces d’invertébrés marins d’invertébrés marins ont une mobilité restreinte au stage adulte, ont une mobilité restreinte au stage adulte, essayer de dissocier les impacts directs et essayer de dissocier les impacts directs et indirects indirects de la de la pêche commercialepêche commerciale de la de la prédation prédation des des changements climatiqueschangements climatiques sur les sur les dynamiques spatio-temporellesdynamiques spatio-temporelles..
46°
47°
48°
49°
65° 64° 63° 62° 61° 60° 59°
1986-88
46°
47°
48°
49°1991-92
46°
47°
48°
49°1995-96
65° 64° 63° 62° 61° 60° 59°
46°
47°
48°
49°1999-00
46°
47°
48°
49°
65° 64° 63° 62° 61° 60° 59°
1989-90
46°
47°
48°
49°1993-94
46°
47°
48°
49°1997-98
65° 64° 63° 62° 61° 60° 59°
46°
47°
48°
49°2001-02
10
50
250
1000
2000
hours /
Otb for Jan-Dec
1997-1998
46°
47°
48°
49°
66° 65° 64° 63° 62° 61° 60°
1999-2000
46°
47°
48°
49°
2001-2002
66° 65° 64° 63° 62° 61° 60°
46°
47°
48°
49°
46°
47°
48°
49°
66° 65° 64° 63° 62° 61° 60° 59°
46°
47°
48°
49°
66° 65° 64° 63° 62° 61° 60° 59°
46°
47°
48°
49°
Crab survey (Jul-Aug) Sept. bottom-trawl survey
Comment dissocier les effets Comment dissocier les effets des impacts que l’on peut et ne des impacts que l’on peut et ne
peut pas contrôler ?peut pas contrôler ?
4
6 6 6 5 6 4 6 3 6 2 6 1 6 0
4 6
4 7
4 8
4 9
4 6
4 7
4 8
4 9
6 6 6 5 6 4 6 3 6 2 6 1 6 0
415
416
417
418
419
420
421
422 423
424
425426
427
428
429431
432
433
434
435
436
437
439
402
403
Tous les mois de septembre depuis 1971 65-200 traits de chalut standards par année Relevés aléatoires stratifiés Trait standard ciblé: 30min à 3.5 nœuds Biomasses en kg/trait pour 14 espèces d’invertébrés épibenthiques.
Les donnéesLes données
5
Un exemple typique de Un exemple typique de données données
zero-inflatedzero-inflated
Histogramme des biomasses en oursins recueillies entre 1999 et 2001
Impossibilité d’utiliser les lois de probabilité standard
Comment analyser et cartographier l’abondance en oursins à partir de telles données?
Strongylocentrotus sp.
Biomass in kg
6
Approche classique: Approche classique: le modèle Delta-Gammale modèle Delta-Gamma
Modèle de mélange à 2 composantes ( two-parts model)
k=1,2,.,r
Pas de propriété d’additivité
Modèle spécifié pour des données préalablement standardiséesSur-estimation ou sous-estimation de la probabilité d’absence
7
Dans une strate ….. Nk = Nombre aléatoire de « gisements » collectés sur une surface chalutée Sk
NNkk | | , S, Skk ~ Poisson( ~ Poisson(××(S(Skk/d))/d))
Chaque « gisement » contient une quantité aléatoire inconnue de biomasse Xk,j j=1,…,Nk
Si Nk=0, aucun « gisement » ramassé :
Si Nk>0, au moins un « gisement » ramassé :
XXk,jk,j | | ~ ~iidiid Exp( Exp())
S k
Alternative: utiliser un Alternative: utiliser un processus de Poisson composé processus de Poisson composé
(la loi des fuites)(la loi des fuites)
8
La probabilité d’absence décroît avec la distance chalutéeLa probabilité d’absence décroît avec la distance chalutée
P(YP(Ykk=0)= P(N=0)= P(Nkk=0)= exp(-=0)= exp(-××SSkk/d) /d)
Propriété d’additivité vérifiée:
Les avantages du modèleLes avantages du modèle
Modèle conceptuel, parcimonieux (2 paramètres et )
Le modèle permet de traiter directement des données brutes !
9
Variabilité intra-strateVariabilité intra-strate
-66 -65 -64 -63 -62 -61 -60
4546
4748
4950
Longitude
Latit
ude
Découpage de l’hétérogénéité spatiale: 38 strates
Dans chaque strate i : Les observations sont Les observations sont identiquement identiquement distribuées:distribuées: un jeu de un jeu de paramètres par strate paramètres par strate ((ii,,ii))
Les observations sont Les observations sont indépendantesindépendantes : :
YYi,ki,k ~ Fuite( ~ Fuite(ii,,ii) )
10
Loi des fuites appliquée indépendamment dans chaque strate
Faiblesse: mauvaise qualité de l’estimation dans les petites strates
Version 1: Modèle (LOL)Version 1: Modèle (LOL)*38*38
-66 -65 -64 -63 -62 -61 -60
4546
4748
4950
Longitude
Latit
ude
11
-66 -65 -64 -63 -62 -61 -60
4546
4748
4950
Longitude
Latit
ude
Hypothèse: comportement similaire entre toutes les strates
Tirer profit de l’information disponible dans toutes les strates du Golfe modélisation de la variabilité entre les strates
Relier les strates via une distribution régionale commune
distribution régionale commune
i ~iid Gamma(a,b)i~iid Gamma(c,d)
Version 2: Modèle RVersion 2: Modèle R,,-LOL-LOL
12
Et s’il existait une structure Et s’il existait une structure spatiale spatiale
entre strates voisines?entre strates voisines?
Répartition spatiale des oursins en 1999-2000-2001
13
Tendance Variabilité spatialiséeModèle CAR Gaussien Intrinsèque
Bruit résiduelnon spatialisé
i = pour tout i=1,2,…,38
Log(i)= m0 + Ψi + εi
Version 3: Modèle IARVersion 3: Modèle IAR-LOL-LOL
ni= nombre de strates voisines de la strate i
14Yi,k
Ni,k
μii=
Ob
serv
ati
on
s
Si,k
Un modèle hiérarchique à 3 Un modèle hiérarchique à 3 niveauxniveaux
m0 IAR ε
0 5 10 150
0.02
0.04
0.06
0.08
0.1
0.12
0.14
0.16
0.18
prior
[ ]
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 50
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
prior
[]
Pri
or
s 0 5 10 150
0.02
0.04
0.06
0.08
0.1
0.12
0.14
0.16
0.18
prior
[ ]
Inférence Bayésienne:Algorithmes MCMC
Pro
cess
us
Sp
ati
al
mu[30] sample: 6000
mu[30]
-0.2 0.0 0.2 0.4 0.6
P(m
u[30
])0.
020
.0Obtention de lois a posteriori pour tous les paramètres et variables latentes
15
Ajustements comparés de 8 Ajustements comparés de 8 modèlesmodèles
Données d’ajustement: Oursins (1999-2000-2001)Critère: Facteurs de Bayes + DIC
16
Moyenne a posteriori des i
Résultats d’inférence: Résultats d’inférence: IARIAR-LOL-LOL
Difficultés du IAR ?
Répartition spatiale des oursins 1999-2000-2001
17
Prédictions comparées de 8 Prédictions comparées de 8 modèlesmodèles
Données prédites: oursins 2002Critère: Posterior Predictive Loss Criterion (PPLC) moyens calculés à partir de 100 échantillons prédictifs de 2000 valeurs
18
La standardisation de La standardisation de données données
zero-inflated: une source de zero-inflated: une source de biaisbiaisDistance standard= 0.5 Distance standard= 1.75
Distance standard= 3
Fu
ite
Fu
ite
Fu
ite
Delta-Gamma
Delta-Gamma
Delta-Gamma
19
Conclusions & Conclusions & PerspectivesPerspectives
Loi des fuites = solution aux problèmes liés à la non-Loi des fuites = solution aux problèmes liés à la non-additivité des modèles Deltaadditivité des modèles Delta
La prise en compte de la structure spatiale de La prise en compte de la structure spatiale de données d’abondance permet d’améliorer les données d’abondance permet d’améliorer les prédictions prédictions
Construction d’un modèle hiérarchique spatio-Construction d’un modèle hiérarchique spatio-temporel couplant un modèle de dynamique des temporel couplant un modèle de dynamique des populations à un modèle géostatistique. populations à un modèle géostatistique. en cours.en cours.
Modelling spatial zero-inflated continuous data with Modelling spatial zero-inflated continuous data with an exponentially compound Poisson process. an exponentially compound Poisson process. Environmental and Ecological StatisticsEnvironmental and Ecological Statistics
S.Ancelet, M.P.Etienne, H.P.Benoît, E.Parent. (Article soumis)S.Ancelet, M.P.Etienne, H.P.Benoît, E.Parent. (Article soumis)