Download - Valeur extrême et l’estimation de la prime pure en traité ... · distribution de type-Pareto (ou loi limite est de Fréchet) est a priori la plus appropriée dans le contexte

21

résumé

Les valeurs extrêmes, aussi rares soient-elles, peuvent engendrer des dégâts consi-dérables dans plusieurs secteurs et surtout dans celui des finances et de l’assu-rance. Dans cet article, nous nous intéressons à l’estimation de la prime pure en réassurance en excédent de sinistre dans le cas des risques lourds (queue épaisse). Dans un premier temps, nous allons nous servir des résultats des lois limites des valeurs extrêmes pour la tarification de ces plus gros coûts de sinistres. Deux approches de tarification, non paramétrique et semi-paramétrique , seront menées à l’étude. Dans un second temps, nous présenterons une application de telles approches sur des données réelles provenant de la compagnie d’assurance Zurich, Tanger, Maroc.

Mots clés : Valeur extrême; indice de la valeur extrême; réassurance en excédent de sinistre; prime pure.

abstract

Extreme values, so rare they are, can cause considerable damage in several sectors and especially in the finance and insurance. In this paper, we consider the esti-mation of insurance premiums for excess-of-loss reinsurance policies in excess of a high retention level. In the first step, we’ll use the results of extreme value theory for pricing these larger costs of claims by two approaches: non-parametric

Assurances et gestion des risques, vol. 77(1-2), avril-juillet 2009, 21-32Insurance and Risk Management, vol. 77(1-2), April-July 2009, 21-32

Les auteurs :Mohamed Dakkoun, Université Abdelmalek Essaâdi, Département de Mathématiques. Faculté des Sciences et Techniques, Tanger, Maroc, [email protected] El Arrouchi, Département de Mathématiques et Informatiques. Faculté des Sciences, Kénitra, Maroc [email protected].

Valeur extrême et l’estimation de la prime pure en traité de réassurance

en excédent de sinistre

par Mohamed Dakkoun et Mohamed El Arrouchi

ARTICLES A

CADÉM

IQUES

ACA

DEM

IC ARTICLES

Assurances et gestion des risques, vol. 77(1-2), avril-juillet 200922

and semi-parametric. In the second step, we will present an application of such approaches on real insurance data from Zurich Insurance Company in Tanger, Morocco.

Keywords: Extreme value; extreme value index; excess-of-loss reinsurance; net premium.

1. IntroDuctIon Et générALItés

La théorie des valeurs extrêmes est une branche probabiliste fascinante qu’on rencontre dans de nombreux domaines pratiques tels que l’assurance, la réassurance et la finance. Ce domaine de recherche a d’abord attiré aussi bien l’intérêt des probabilistes que celui des ingénieurs de risques financiers et assuranciels. Il est basé sur la connaissance de la loi asymptotique des extrêmes (maximum et minimum) d’un échantillon aléatoire. En 1928, Fisher et Tippett établissent un résultat crucial qui spécifie la forme de la distribution limite du maximum convenablement normalisé. Ils montrent que la distribution limite possible des extrêmes est l’une des trois familles de distributions suivantes : Gumbel, Fréchet ou Weibull, appelées distributions de valeurs extrêmes. Citons en référence Embrechts et al. (1997) pour la théorie, et Beirlant et al. (1996), Finkenstäat et Rootzén (2004) pour les applications des valeurs extrêmes. La distribution de type-Pareto (ou loi limite est de Fréchet) est a priori la plus appropriée dans le contexte financier et assuranciel car elle correspond à des observations individuelles dont la distribution possède des queues épaisses, et elle est cohérente avec les modèles GARCH de séries temporelles – voir pour l’instant Rootzén and Tajvidi (1996), Mc Neil (1997), Feuerverger et Hall (1999), Resnick et Rootzén (2000), Cebrian et al. (2003), Beirlant et al. (2004)(pp:99), Ladoucette et Teugels (2006).

D’ailleurs la loi des valeurs extrêmes, lorsqu’elle existe, est indexée par un paramètre appelé indice de la valeur extrême, et éventuellement par des paramètres d’échelle et de position. Cette loi limite est notée par GEV (Generalized Extreme Value Distribution) et sa distribution est de la forme suivante

avec μ paramètre de localisation, σ paramètre de dispersion et ξ est un paramètre de forme, encore appelé indice des valeurs extrêmes ou indice de queue. La connaissance de cet indice est un élément

Valeur extrême et l’estimation de la prime pure en traité de réassurance... 23

fondamental permettant de contrôler la « lourdeur » de la queue de distribution. Ainsi, de nombreux estimateurs de cet indice ont été proposés dans la littérature. Les deux estimateurs les plus populai-res, étant les estimateurs de Hill (1975) et de Pickands (1975), sont basés sur les plus grandes valeurs d’un échantillon. Pour plus de détails, le lecteur peut se référer à Embrechts et al. (1997)), Beirlant et al. (2004).

En réassurance, l’estimation de la prime pure a pour but d’évaluer, pour chaque assuré ou prospect, le montant attendu des sinistres pour la période d’assurance étudiée. Cette évaluation se fait souvent par des méthodes statistiques. Pour plus de détails, voir Denuit et Charpentier (2004), Young (2004). Cependant, les gros coûts de sinistres nécessitent une modélisation d’événements rares, c’est-à-dire les événements avec une faible probabilité d’occurrence, mais avec un montant de sinistre élevé et souvent des effets désas-treux. L’analyse de ces événements extrêmes peut être réalisée à l’aide de la méthodologie des valeurs extrêmes où le comportement de la queue d’une distribution est principalement caractérisé par son indice de la valeur extrême ξ qui permet d’indiquer la taille et la fréquence de certains phénomènes extrêmes dans le cadre d’une distribution de probabilité donnée.

Dans cet article, nous nous intéressons à l’estimation de la prime pure en traité de réassurance en excédent de sinistre dans le cas des risques lourds (queue épaisse). Dans un premier temps, nous allons nous servir des résultats des lois limites des valeurs extrêmes pour la tarification de ces plus gros coûts de sinistres. Pour cela, nous procéderons par deux approches : non paramétrique et semi-paramé-trique. Dans un second temps, nous présenterons une application de telles approches sur des données réelles provenant de la compagnie d’assurance Zurich, Tanger, Maroc.

2. EstIMAtIon DE LA prIME purE En réAssurAncE

Supposons que le coût total des sinistres pour une seule police d’assurance est une variable aléatoire positive X de fonction de survie F–(x) = P(X > x). Le principe le plus utilisé du calcul de la prime dans la littérature assurancielle est le principe de la prime pure dont le risque pure II égale l’espérance mathématique

24 Insurance and Risk Management, vol. 77(1-2), April-July 2009

Considérons maintenant une réassurance en excédent de sinistre avec une large franchise globale R, la fonction de survie du coût total (X-R)+, avec y+ = max(0, y), est F–(x+R) où x > 0. Donc, la prime pure II(R) est donnée par

Dans la suite, nous nous intéressons à l’estimation de II(R) et ce d’après les travaux de Vandewalle et Beirlant (2006). Notons Xi est une suite de variables aléatoires décrivant les coûts des sinistres indépendantes et identiquement distribuées suivant X. On désigne par X1,n ≤ X2,n ≤ ... ≤ Xn,n les statistiques d’ordre associées aux n premières observations X1, X2, ..., Xn de la suite. La façon la plus simple (et la plus naturelle) d’estimer la prime pure est de dire que c’est la moyenne de n coûts de sinistres indépendants. On écrit donc

D’autre part, la fonction moyenne d’excès s’écrit en terme de F comme suit

En passant à l’estimation, on a donc

Rappelons que la fonction de répartition empirique s’écrit

et que Fn → F, lorsque n → ∞.Si R est fixé comme une des observations de notre variable

aléatoire, soit R = Xn-k,n, l’estimateur non-paramétrique de la prime pure est donné dans ce cas par


où Pour des valeurs

grandes de R, cet estimateur reste peu fiable car il est construit à partir d’un petit nombre d’observations.

Revenons à la formule basique pour calculer la prime pure

Multiplions et divisons simultanément le côté droit de l’égalité par R, on obtient

Si l’indice de la valeur extrême ξ > 0, on dit alors que F est de type Pareto d’indice ξ, i.e.,

avec L une fonction à variation lente, c’est-à-dire,

pour tout x > 0. Alors, d’après le Théorème de Karamata (voir Resnick (1987)), on a pour 0 < ξ < 1

Donc

Lorsque R est prise dans l’échantillon: R = Xn-k,n, la prime pure peut être estimée par

avec ^ξn,k est l’estimateur de ξ > 0 proposé par Hill (1975) et défini

comme suit

Pour R non prise comme étant une observation de l’échantillon, les formules des valeurs extrêmes peuvent être utilisées pour estimer


F–(R). En effet, pour les modèles de type Pareto d’indice ξ > 0, la queue de distribution est à variation régulière d’indice ξ, c’est-à-dire, autour de x > 0

or, remplaçons R par tx,

Si ^

k est le k optimal choisi dans l’estimation par ^ξn,k, et si t =Xn-

^

k,n, la prime pure peut donc être estimée par

3. DonnéEs réELLEs D’AssurAncE

Afin d’illustrer l’utilité pratique des estimateurs précédents, nous considérons des données réelles provenant de la compagne Zurich d’assurance (Tanger-Maroc) sur les réclamations automobile de 2001 à 2008. L’ensemble de données se compose de n = 61 réclama-tions qui sont au moins aussi grandes que 490 dirhams. Pour plus de détails, le Tableau 1 présente une statistique descriptive de données récoltées.

tABLEAu 1stAtIstIquE DEscrIptIVE

taille Moyenne somme Minimum Maximum

61 8316,797 507324,6 495,45 46781,25

Variance Écart-Type Médiane Skewness Kurtosis

108724780 10427,12 3876 2,364245 5,661831

Percentile90 %

Percentile10 %

20500 1507,500


D’après la Figure 1, on constate que les données ne peuvent pas être ajustées par une simple loi normale. Pour trouver un bon ajus-tement, on utilise le logiciel "EasyFit 5.0”. Ce logiciel ajuste (quand cela est possible) les données aux différentes lois dont il estime aussi leurs paramètres et nous fournit un classement d’ajustements effec-tués en réalisant une évaluation de la qualité d’ajustements par les trois tests les plus couramment utilisés.

D’après les Figures 2, 3 et le Tableau 2, le modèle de Fréchet semble constituer un bon ajustement, ce qui suggère que les données proviennent d’une lourde queue de distribution. Le résultat est assez logique, cette distribution intervenant très souvent dans le domaine de l’assurance. L’indice de la valeur extrême correspondant est posi-tif, donc on pourra se placer dans le cas où la distribution est de type Pareto, qui nous donne droit de faire appel à la statistique de Hill comme étant l’estimateur le mieux adapté dans ce cas.

Ensuite, la Figure 4 présente le tracé de l’estimateur de Hill en fonction du nombre des statistiques d’ordre k à utiliser dans cette estimation. On constate que les valeurs estimées de ξ oscillent autour de la valeur 0,4 lorsque k allant de 20 à 50.

Au vu des résultats précédents, on peut estimer la prime pure par les deux estimateurs non-paramétrique et semi-paramétrique, proposés

FIgurE 1AjustEMEnt pAr LA LoI norMALE

50

45

40

35

30

25

20

15

10

5

0-10000 10000 20000 30000 40000 500000

No.

of a

bs.

Histogram: Var1K-S d= ,28389, p<,01; Lilliefors p<,01

____ Expected Normal

X <= Category Boundary

28 Insurance and Risk Management, vol. 77(1-2), April-July 2009

FIgurE 2HIstogrAMME D’AjustEMEnt pAr LA LoI DE FrécHEt à troIs pArAMètrEs

0,72

0,64

0,56

0,48

0,4

0,32

0,24

0,16

0,08

0

Histogramme - Fréchet (3P)

Fonction de densité de probabilité

8000 16000 24000 32000 40000

FIgurE 3q-q pLot D'AustEMEnt pAr LA LoI DE FrécHEt à troIs pArAMètrEs

Quantile-Quantile

40000 8000 12000 16000 20000 24000 28000 32000 36000 40000 44000

44000

40000

36000

32000

28000

24000

20000

16000

12000

8000

4000

0

Qua

ntile

(M

odèl

e)

Fréchet


respectivement en (1) et (2). Concernant l’approche semi-paramétrique, II est calculée pour différentes valeurs de k. Les résultats obtenus sont présentés dans le Tableau 3.

tABLEAu 2récApItuLAtIF DEs quAtrE MEILLEurs AjustEMEnts

test Kolmogorov-smirnov

Anderson-Darling Khi-carré

Statistique Rang Statistique Rang Statistique Rang

Fréchet 0,08936 1 0,53453 1 2,7546 2

Fréchet (3P)

0,09155 2 0,57525 2 2,1968 1

Log-Logistics (3P)

0,10094 3 0,80709 4 3,1404 3

Gen. Pareto 0,11212 4 4,8081 17 N/A

FIgurE 4EstIMAtEur DE HILL En FonctIon Du noMBrE DEs stAtIstIquEs D'orDrE k

Estimateur de Hill en fonction de k

0 10 20 30 40 50 60

1.5

1,3

1,1

0,9

0,7

0,5

0,3

0,1

-0,1


4. concLusIon

Dans cet article, nous avons donné un aperçu sur l’application de la théorie des valeurs extrêmes en réassurance. Deux approches d’es-timation de la prime en réassurance en excédent de sinistre ont été dégagées et comparées sur des données réelles provenant du marché de l'assurance. À titre de comparaison, l’estimation de la prime pure par l’approche semi-paramétrique est plus robuste dans le cas du traité de réassurance en excédent de sinistre. En effet, l’information sur l’indice de la valeur extrême se trouve dans la queue de distribu-tion. Donc, l’utilisation des grandes observations est indispensable, et ce n’est pas le cas dans l’approche non-paramétrique.

références

Beirlant, J., Goegebeur, Y., Segers, J., Teugels, J., Waal, D. D., and Ferro, C. (2004), Statistics of Extremes: Theory and Applications. Wiley, New York.

Beirlant, J., Teugels, J. L. and Vynckier, P. (1996), Practical Analysis of Extreme Values. Leuven University Press, Leuven. [119, 168, 296, 310, 344, 345, 351]

Cebrian, A., Denuit, M., & Lambert, Ph. (2003), Generalized Pareto fit to the society of Actuaries’ large claims database. North American Actuarial Journal 7, 18-36.

Denuit, M. et Charpentier, A. (2004), Mathématiques de l’assurance non-vie. Tome I : Principes fondamentaux de théorie du risque. Economica.

Embrechts, P., Klöppelberg, C. et Mikosch, T. (1997), Modelling Extremal Events for Insurance and Finance, Springer-Verlag, Berlin.

tABLEAu 3EstIMAtIons DE LA prIME purE

Estimateur de la

prime pure

semi-paramétrique (formule (2)) Non- paramétrique (formule (1))K=20 K=38 K=42 K=48

R=5000 1849,01 3513,119 3882,921 4437,624 4367,844

R=5800 1544,089 2933,769 3242,587 3705,813 4430,139

R=6000 1487,818 2815,454 3111,818 3556,363 4728,581

R=7000 1228,87 2334,853 2194,368 2949,288 4060,167

R=8000 20500 1985,381 2580,627 2507,489 3765,085


Feuerverger, A. and Hall, P. (1999), Estimating a tail exponent by modelling departure from a Pareto distribution. Annals of Statistics 27, 760-781.

Finkenstädt, B. & Rootzén, H., eds (2004), Extreme Values in Finance, Telecommunications and the Environment, Chapman and Hall, Boca Raton.

Fisher, R. A. and Tippett, L. H. C. (1928), Limiting forms of the frequency distribution of the largest or smallest member of a sample, Proceedings of the Cambridge Philosophical Society 24, 180-190.

Hill, B. M. (1975), A simple general approach to inference about the tail of a distribution. Ann. Statist. 3, 1163-1174.

Ladoucette, S. A. and Teugels, J. L. (2006), Reinsurance of large claims. J. Comput. Appl. Math. 186, no. 1, 163-190.

Mc Neil, A. J. (1997), Estimating the Tails of Loss Severity Distributions Using Extreme Value Theory. ASTIN Bulletin 27, 117-37.

Pickands, J . III. (1975), Statistical inference using extreme order statistics. Ann. Statist. 3, 119-131.

Resnick, S. I. (1987), Extreme Values, Regular Variation and Point processes. Springer-Verlag, New York.

Resnick, S. I. and Rootzén, H. (2000), Self-similar communication models and very heavy tails. Annals of Applied Probability 10, 753-778.

Rootzén, H., and Tajvidi. N. (1996), Extreme Value Statistics and Wind Storm Losses: A Case Study, Scandinavian Actuarial Journal, 70-94.

Vandewalle, B. and Beirlant, J. (2006), On univariate extreme value statistics and the estimation of reinsurance premiums. Insurance: Mathematics and Economics 38, 441-459.

Young, V. (2004), Premium Principles. Encyclopedia of Actuarial Science. Wiley, pp. 1322-1331.

Reproduced with permission of the copyright owner. Further reproduction prohibited without permission.

Download - Valeur extrême et l’estimation de la prime pure en traité ... · distribution de type-Pareto (ou loi limite est de Fréchet) est a priori la plus appropriée dans le contexte

Top Related