facteurs de risques et tarification rc automobile en ... · 3.4 simulation ... des affréteurs de...

72
EURIA – E URO -I NSTITUT D ’ACTUARIAT J EAN D IEUDONNÉ TÉLÉCOM BRETAGNE M ÉMOIRE DE FIN D ÉTUDES Facteurs de risques et tarification RC automobile en réassurance Auteur : Thomas P ÉTEUL Encadrant Télécom Bretagne : Philippe LENCA September 9, 2010 EURIA – UBO 6 avenue le Gorgeu – CS 93837 – 29238 BREST Cedex 3 Télécom Bretagne – Technopôle Brest-Iroise – CS 83818 – 29238 Brest Cedex 3

Upload: duongthuan

Post on 16-Sep-2018

213 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Facteurs de risques et tarification RC automobile en ... · 3.4 Simulation ... des affréteurs de se couvrir financièrement contre la perte en mer de bateaux et s ... L’entreprise

EURIA – EURO-INSTITUT D’ACTUARIAT JEANDIEUDONNÉ

TÉLÉCOM BRETAGNE

MÉMOIRE DE FIN D’ÉTUDES

Facteurs de risques et tarification RCautomobile en réassurance

Auteur :Thomas PÉTEUL

Encadrant Télécom Bretagne :Philippe LENCA

September 9, 2010

EURIA – UBO 6 avenue le Gorgeu – CS 93837 – 29238 BREST Cedex 3Télécom Bretagne – Technopôle Brest-Iroise – CS 83818 – 29238 Brest Cedex 3

Page 2: Facteurs de risques et tarification RC automobile en ... · 3.4 Simulation ... des affréteurs de se couvrir financièrement contre la perte en mer de bateaux et s ... L’entreprise

Résumé

À l’heure actuelle, la tarification des traités en excédent de sinistres (excess-of-loss)chez Secura, compagnie de réassurance, est basée sur un modèle où l’on estime d’unpart la fréquence au dessus d’un certain seuil et d’autre part la sévérité au-dessus dece même seuil.

Afin de pouvoir estimer de manière robuste les paramètres de ce modèle et detenir compte des patterns de développement, on utilise généralement un historiqued’une dizaine d’années de données observées.

Un des inconvénients de cette modélisation est qu’elle ne tient pas du toutcompte de l’évolution du portefeuille au cours de cette période de dix ans. Ainsi, sil’on suppose que l’on s’intéresse à un dossier RC automobile, ce modèle de tarifi-cation ne pourra en aucun cas récompenser une compagnie qui tente d’améliorer sasouscription en se focalisant sur des meilleurs risques.

Le but de ce mémoire est d’étudier la faisabilité, au regard des données dispo-nibles, de la mise en place d’une tarification qui prendrait compte des facteurs derisque auxquels sont soumises les compagnies.Dans un premier temps, nous avons cherché à s’affranchir de la contrainte de lataille des données, puis à ajuster un modèle linéaire généralisé pour répondre àcette problématique.

Mots clés : Réassurance, Facteurs de risque, Tarification, GLM, Excess-of-Loss

Page 3: Facteurs de risques et tarification RC automobile en ... · 3.4 Simulation ... des affréteurs de se couvrir financièrement contre la perte en mer de bateaux et s ... L’entreprise

Abstract

Today, the pricing of reinsurance excess of loss treaties at Secura, a reinsurancecompany, is done on a the basis of a model where we estimate separately the fre-quency over a threshold and the severity of claims over this threshold.

In order to robustly estimate the parameters of this model and to take account ofdevelopment patterns, we use generally ten years of historical data.

One of the liabilities of this modelling is we don’t take account of the evolutionof the portfolio during that long period. Therefore, if we are interested in a MTPLtreaty, this model of pricing will not reward a company who tried to improve itssubscribing policy by selecting best risks.

The main goal of this memoir is to study the doability of the introduction of apricing method that would take account of risk factors, considering the availabledata.First, we tried to get rid of the data size constraint, and then we adjusted a general-ized linear model in order to answer to this problem.

Keywords: Reinsurance, Risks factor, Pricing, GLM, Excess-of-Loss

Page 4: Facteurs de risques et tarification RC automobile en ... · 3.4 Simulation ... des affréteurs de se couvrir financièrement contre la perte en mer de bateaux et s ... L’entreprise

RemerciementsJe tiens à remercier l’ensemble de l’équipe de Secura Re pour sa gentillesse et sonaccueil en son sein à Bruxelles. Ce fut un plaisir de travailler avec eux dans un trèsbon cadre et dans la bonne humeur.Plus particulièrement, un grand merci à l’équipe du département Recherche et dé-veloppement de Secura, avec laquelle j’ai passé le plus clair de mon temps, et unepensée plus particulière pour Ariane Trivière avec qui j’ai pu travailler pendant lapériode de renouvellement, Samuel Mahy, mon encadrant tout au long du stage,pour sa grande disponibilité, son aide et ses conseils avisés et enfin Sophie Ladou-cette, directrice du département, pour son accueil, ses conseils et son encadrement.

1

Page 5: Facteurs de risques et tarification RC automobile en ... · 3.4 Simulation ... des affréteurs de se couvrir financièrement contre la perte en mer de bateaux et s ... L’entreprise

Table des matières

Introduction 4

1 L’entreprise : Secura Re 6

2 Principes généraux de tarification en assurance non vie 92.1 Rappels de base . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

2.1.1 Modèle collectif de risque . . . . . . . . . . . . . . . . . . 92.2 Antisélection et hétérogénéité . . . . . . . . . . . . . . . . . . . . . 10

2.2.1 Inégalité de Markov . . . . . . . . . . . . . . . . . . . . . 112.2.2 Inégalité de Bienaymé-Tchebycheff . . . . . . . . . . . . . 112.2.3 Loi des grands nombres . . . . . . . . . . . . . . . . . . . 11

2.3 Tarification a priori . . . . . . . . . . . . . . . . . . . . . . . . . . 122.4 Facteurs de risque . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

3 Traité en excédent de sinistres 143.1 Définition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143.2 Conséquences sur la modélisation . . . . . . . . . . . . . . . . . . 163.3 Agrégation de portefeuilles . . . . . . . . . . . . . . . . . . . . . . 173.4 Simulation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

4 Mise en œuvre théorique 184.1 Méthode retenue . . . . . . . . . . . . . . . . . . . . . . . . . . . 184.2 Génération d’un jeu de données . . . . . . . . . . . . . . . . . . . 19

4.2.1 Obtention des entrées . . . . . . . . . . . . . . . . . . . . . 204.2.2 Création du portefeuille . . . . . . . . . . . . . . . . . . . 20

4.3 Génération de la sinistralité . . . . . . . . . . . . . . . . . . . . . . 234.3.1 Paramètres en entrée . . . . . . . . . . . . . . . . . . . . . 234.3.2 Mode opératoire . . . . . . . . . . . . . . . . . . . . . . . 23

4.4 Évaluation du nombre de sinistres attendus . . . . . . . . . . . . . . 294.4.1 Sinistres moyens pondérés . . . . . . . . . . . . . . . . . . 294.4.2 Sinistres moyens instantanés . . . . . . . . . . . . . . . . . 29

4.5 Ajustement du modèle . . . . . . . . . . . . . . . . . . . . . . . . 29

5 Exemple de modélisation sur un portefeuille RC automobile 305.1 Présentation des données . . . . . . . . . . . . . . . . . . . . . . . 30

5.1.1 Exposition du portefeuille . . . . . . . . . . . . . . . . . . 305.1.2 Sinistralité constatée sur ce portefeuille . . . . . . . . . . . 31

2

Page 6: Facteurs de risques et tarification RC automobile en ... · 3.4 Simulation ... des affréteurs de se couvrir financièrement contre la perte en mer de bateaux et s ... L’entreprise

5.1.3 Données exploitables dans l’exemple . . . . . . . . . . . . 315.2 Type de modèles ajustés . . . . . . . . . . . . . . . . . . . . . . . 325.3 Distribution et fonctions de lien utilisées . . . . . . . . . . . . . . . 325.4 Distributions et liens retenus, analyse des modèles obtenus . . . . . 34

5.4.1 Modélisation face à un seul effet . . . . . . . . . . . . . . . 345.4.2 Modélisation face à deux effets . . . . . . . . . . . . . . . 355.4.3 Modélisation face à trois effets . . . . . . . . . . . . . . . . 41

5.5 Résultats . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

Conclusion 43

Annexes

A Outils mathématiques : du modèle linéaire aux modèles linéaires géné-ralisés (GLM) 46A.1 Rappels sur le modèle linéaire gaussien . . . . . . . . . . . . . . . 46

A.1.1 Définition . . . . . . . . . . . . . . . . . . . . . . . . . . . 46A.1.2 Mise en forme matricielle . . . . . . . . . . . . . . . . . . 47A.1.3 Estimation des paramètres . . . . . . . . . . . . . . . . . . 47A.1.4 Variante : moindres carrés pondérés . . . . . . . . . . . . . 48A.1.5 Intervalle de confiance, intervalle de prédiction . . . . . . . 49A.1.6 Modèle additif : principe . . . . . . . . . . . . . . . . . . . 49

A.2 Les modèles linéaires généralisés (GLM) . . . . . . . . . . . . . . 55A.2.1 Définition . . . . . . . . . . . . . . . . . . . . . . . . . . . 56A.2.2 Modèle de régression . . . . . . . . . . . . . . . . . . . . . 58A.2.3 Équations de vraisemblance . . . . . . . . . . . . . . . . . 59A.2.4 Résolution des Équations de vraisemblance . . . . . . . . . 59A.2.5 Évaluation de la qualité d’un modèle . . . . . . . . . . . . . 60A.2.6 Intervalle de confiance . . . . . . . . . . . . . . . . . . . . 61A.2.7 Analyse des résidus . . . . . . . . . . . . . . . . . . . . . . 61

A.3 Les modèles additifs généralisés (GAM) . . . . . . . . . . . . . . . 62A.4 Deux approches possibles pour ajuster un GAM . . . . . . . . . . . 62

A.4.1 Modèle additif sur pseudo-variables . . . . . . . . . . . . . 62A.4.2 Maximum de vraisemblance local . . . . . . . . . . . . . . 63

B Outils et données utilisés dans SAS 64B.1 Fonctionnement de GENMOD . . . . . . . . . . . . . . . . . . . . 64B.2 Tableaux des catégories utilisées pour les modèles GLM . . . . . . 65

B.2.1 Données réelles . . . . . . . . . . . . . . . . . . . . . . . . 65B.3 Données générées . . . . . . . . . . . . . . . . . . . . . . . . . . . 65

C Glossaire 67

Bibliographie 69

3

Page 7: Facteurs de risques et tarification RC automobile en ... · 3.4 Simulation ... des affréteurs de se couvrir financièrement contre la perte en mer de bateaux et s ... L’entreprise

Introduction

Bien qu’elle aie connu un véritable essor à partir du XVIIème siècle par la volontédes affréteurs de se couvrir financièrement contre la perte en mer de bateaux et s’estdéveloppée depuis lors, l’assurance a pris du temps à se mettre en forme. Le principede base de l’assurance existe pourtant depuis l’Antiquité : un individu qui chercheà se prémunir contre un aléa va verser une somme à quelqu’un pour se voir fournirune prestation (en argent ou en nature) dans le cas où l’aléa survient effectivement.

Un réassureur, tout comme un assureur, s’attache à prendre un risque à unecompagnie d’assurance, appelée cédante*, en échange d’une prime et à intervenirfinancièrement si l’événement associé à ce risque survient. Le calcul du montant decette prime est basé sur le principe fondamental en assurance, à savoir : « Engage-ment du réassureur = engagement de la cédante ». Tout le problème qui se pose estalors d’évaluer le plus justement possible cet engagement.

Or, tous les assureurs, pour un produit sensiblement similaire, peuvent avoirdes politiques de souscription très différentes, à cause par exemple de leur lignetarifaire, du marché concerné, du pays ou de la région dans lesquels le produit estproposé, de leur aversion au risque, ou de toute autre raison.

Dans le cadre de ce mémoire, nous nous concentrerons sur un type de traité* deréassurance, appelé excédent de sinistre. Ceci a souvent pour conséquence pour leréassureur de ne recevoir qu’une information parcellaire et incomplète de la part dela cédante : il n’aura que peu d’informations aussi bien sûr l’exposition* du porte-feuille que sa sinistralité, et malgré ce défaut d’informations, il devra évaluer le prixdu traité.

Le réassureur s’en sort généralement de deux façons : il dispose d’une part d’unmodèle de tarification basé sur le marché lorsqu’il manque d’informations. D’autrepart, avec l’expérience des années, il arrive à obtenir une assez bonne vision du por-tefeuille de la cédante et de son risque associé.

Cependant ces deux approches sont assez souvent trop sévères avec des cédantesdont lapolitique de souscription est meilleure que le marché ou évolue favorable-ment dans le temps, i.e. qui élimine les mauvais risques : celles-ci seront évaluéessur des risques qu’elles ne couvrent plus et de cette façon auront à payer un surcoûtpour cette couverture.Le but du présent mémoire est d’évaluer la possibilité d’obtenir un tarif d’expo-

4

Page 8: Facteurs de risques et tarification RC automobile en ... · 3.4 Simulation ... des affréteurs de se couvrir financièrement contre la perte en mer de bateaux et s ... L’entreprise

sition, c’est-à-dire basé sur les caractéristiques des risques présents dans le porte-feuille de la cédante.

Pour mener à bien cette étude, nous rappelerons tout d’abord les principes detarification en assurance, puis nous présenterons les contrats spécifiques que sontles traités en excédent de sinistres sur lesquels est basée cette étude. Ensuite nousétudierons un protocole de résolution du problème avant de présenter un exempled’application sur des données collectées au Royaume-Uni.

Le lecteur trouvera en outre en annexe les outils théoriques et pratiques néces-saires à la compréhension du raisonnement suivi tout le long de ce mémoire.

5

Page 9: Facteurs de risques et tarification RC automobile en ... · 3.4 Simulation ... des affréteurs de se couvrir financièrement contre la perte en mer de bateaux et s ... L’entreprise

Chapitre 1

L’entreprise : Secura Re

Secura est un réassureur belge ayant débuté ses activités en 1946, présent en EuropeOccidentale, principalement dans le Benelux et l’Europe du Sud. En 2008, son en-caissement de primes ajusté était de 217,5 millions d’euro.

CapitalSes deux actionnaires sont d’une part le groupe KBC Assurances – qui est présent enBelgique et fournit des services financiers à ses clients, aussi bien en banque qu’enassurances – avec 95,04% du capital et Dexia Insurance Belgium, avec 4,96% ducapital.

KBC Assurances

Dexia

FIGURE 1.1 – Répartition du capital entre les actionnaires

MarchésSecura est présente géographiquement en Europe ; elle couvre des traités souscritsdans les pays suivants : Belgique, Luxembourg, Pays-Bas, Italie, Portugal, Espagne,France, Royaume- Uni, Irelande, Allemagne, Autriche, Suisse et Grèce. Ainsi, en2008, près de 30% de l’encaissement ajusté de primes était généré dans les pays duBenelux, tandis que l’Europe du Sud représentait 56,8% du total, l’Europe du Nord7,6% et l’Europe Centrale 5,3%.

6

Page 10: Facteurs de risques et tarification RC automobile en ... · 3.4 Simulation ... des affréteurs de se couvrir financièrement contre la perte en mer de bateaux et s ... L’entreprise

FIGURE 1.2 – Les différents pays où Secura intervient en réassurance

Les couvertures proposées sont variées et Secura intervient sur différents typesde marché :

• Assurances vie et accident (14,2% en 2008) ;

• Traités Short Tail* en proportionnel et non proportionnel – couvrant parexemple l’incendie, le vol, la grêle (38,9% en 2008) ;

• Traités Long Tail* en proportionnel et non proportionnel – couvrant par exemplela responsabilité civile générale et automobile, ou les compensations pour ac-cidents du travail (43,6% en 2008) ;

• autres : aviation, crédit, transports – 3,3% en 2008.

ServicesSecura propose à ses clients différents services liés à son activité :

• développement de programmes de réassurance ;

• tarification de la réassurance ;

• cours sur la réassurance ;

7

Page 11: Facteurs de risques et tarification RC automobile en ... · 3.4 Simulation ... des affréteurs de se couvrir financièrement contre la perte en mer de bateaux et s ... L’entreprise

Benelux

Europe du Nord

Europe du Sud

Europe Centrale

Autres

FIGURE 1.3 – Répartition du chiffre d’affaires par zones géographiques

• support actuariel ;

• gestion de sinistres ;

• contact avec les universités – cours, présentation de la réassurance.

La note Standard & Poor’s du groupe KBC a été révisée à A en mars 2009. Parconséquent, la note S&P de Secura est également fixée à A depuis lors.

8

Page 12: Facteurs de risques et tarification RC automobile en ... · 3.4 Simulation ... des affréteurs de se couvrir financièrement contre la perte en mer de bateaux et s ... L’entreprise

Chapitre 2

Principes généraux de tarification enassurance non vie

Il nous a paru intéressant de rappeler les modèles sous-jacents à toute la théorie de latarification en assurance, car c’est dans ce cadre que la réassurance intervient : cettedernière a vocation à contrer les limites qui sont posées par ce cadre, en proposantdes solutions pour les risques « anormaux », i.e. qui sortent du cadre des hypothèsesde ces modèles.

De plus, la plupart des notions que nous rencontrerons dans ce chapitre serontà la base de notre travail, notamment en ce qui concerne la segmentation de porte-feuilles et les facteurs de risque, décrits dans ce chapitre. Précisons également quele modèle collectif de risque est aussi utilisé par l’entreprise Secura pour estimer lecoût d’un traité de réassurance en excès de sinistres (nous invitons le lecteur à lire àcet effet le chapitre suivant).

2.1 Rappels de baseLorsqu’un assureur constitue un portefeuille, il est confronté à plusieurs problèmesvis-à-vis de ses assurés :

• estimer la prime que chaque assuré va verser pour se couvrir ;

• estimer le montant total des sinistres que l’assureur va payer.

2.1.1 Modèle collectif de risqueL’assureur va donc en premier lieu chercher à estimer le montant total des sinistresS sur une période donnée – généralement un an – pour un portefeuille associé àune police d’assurance donnée. Il s’agit là du montant effectivement à la charge del’assureur, après application de franchises et autres clauses limitatives.Pour donner un prix à la couverture, l’assureur va donc chercher à substituer à lavariable aléatoire S une constante ν « la plus proche possible » de S. La distanceentre cette constante et S doit pénaliser les cas où ν est plus grand que S et ν est plus

9

Page 13: Facteurs de risques et tarification RC automobile en ... · 3.4 Simulation ... des affréteurs de se couvrir financièrement contre la perte en mer de bateaux et s ... L’entreprise

petit que S. L’écart quadratique moyen d2 pénalise toute sur- ou sous-évaluation deS :

d2(S, ν) = E[(S − ν)2

].

On cherche à minimiser cette distance :

d2(S, ν) = E[(S − ν)2

]= E

[(S − E [S] + E [S]− ν)2

]= E

[(S − E [S])2

]+ 2E [(S − E [S])]︸ ︷︷ ︸

=0

(E [S]− ν) + (E [S]− ν))2

= (E [S]− ν))2 + E[(S − E [S])2

]︸ ︷︷ ︸ne dépend pas de ν

En dérivant cette expression, on obtient :

arg minν

d2(S, ν) = E [S] .

Cette valeur est ce qu’on appelle la prime pure*, qui va servir à couvrir les sinistresdu portefeuille a priori.Dans le modèle collectif de risque, on considère que le nombre N de sinistres quisurviennent est indépendant du coût X d’un sinistre. Cette hypothèse n’est doncpas valable dans le cadre d’une catastrophe naturelle par exemple, où les sinistresne sont plus indépendants sur une même zone. Les sinistres sont considérés, pourun risque donné, comme étant indépendants et identiquement distribués.À partir de ces hypothèses, on peut écrire :

S =N∑i=1

Xi

. On en déduit la prime pure :

E [S] = E

[N∑i=1

Xi

]= E [N ]E [Xi] ,

soit, dit en français, l’espérance de la sinistralité annuelle peut s’obtenir en faisantle produit entre l’espérance du nombre de sinistres N et l’espérance du coût dusinistre,X , en supposant que tous lesXi sont indépendants et de même loi, et qu’ilssont aussi indépendant du nombre de sinistres N .Cette modélisation a plusieurs avantages : en effet, il est difficile de trouver une loisimple pour représenter la sinistralité S mais il est assez facile de modéliser desfréquences N et des coûts X .

2.2 Antisélection et hétérogénéitéL’assureur, ayant une estimation de l’argent E [S] qu’il aura à débourser pour cou-vrir ses assurés dans la période considérée, peut alors calculer la prime qu’il deman-dera à chacun d’entre eux.

10

Page 14: Facteurs de risques et tarification RC automobile en ... · 3.4 Simulation ... des affréteurs de se couvrir financièrement contre la perte en mer de bateaux et s ... L’entreprise

Pour cela, il utilise la loi des grands nombres, qui est justifiée par certains outilsmathématiques comme le théorème centrale limite1, mais qu’on peut démontrer àl’aide des inégalités de Markov et de de Bienaymé-Tchebycheff.

2.2.1 Inégalité de MarkovPropriété 1. Soit X une variable aléatoire quelconque, une fonction g : R → R+

et une constante a > 0. Nous avons alors :

Pr [g(X) > a] <E [g(X)]

a.

2.2.2 Inégalité de Bienaymé-TchebycheffL’inégalité de Bienaymé-Tchebycheff contrôle l’écart entre une variable aléatoireet sa moyenne. C’est une conséquence directe de l’inégalité de Markov.

Propriété 2. Soit X une variable aléatoire de moyenne µ et de variance σ2, on a :

Pr [|X − µ| > ε] <σ2

ε2.

Cette inégalité a pour conséquence que :

Pr [|S − E [S] | ≤ tσ] > 1− 1

t2⇔ Pr [|S − E [S] | > tσ] <

1

t2

Cela signifie qu’une variable aléatoire S dont la variance est finie ne peut pas trops’éloigner de sa moyenne.

2.2.3 Loi des grands nombresLa loi des grands nombres est une justification pertinente du mode de calcul de laprime pure associée à S.Supposons que l’assureur émet un grand nombre n de polices identiques et dési-gnons par Si, i = 1, . . . , n les montants de sinistre totaux en relation avec la iième

police au cours d’une période.

Propriété 3. Soient µ et σ2 la moyenne et la variance commune des Si. Notons S(n)

la charge moyenne de sinistre par police, i.e. :

S(n) =1

n

n∑i=1

Si.

On suppose que les variables aléatoires Si sont indépendantes et identiquementdistribuées (i.i.d.) et de variance finie. Alors la loi des grands nombres assure que :

S(n) proba−→n→∞

µ

1Toute somme de n variables aléatoires indépendantes et identiquement distribuées converge versune variable aléatoire gaussienne quand n tend vers l’infini.

11

Page 15: Facteurs de risques et tarification RC automobile en ... · 3.4 Simulation ... des affréteurs de se couvrir financièrement contre la perte en mer de bateaux et s ... L’entreprise

La loi des grands nombres permet donc d’affirmer, sous trois hypothèses (porte-feuille de grande taille, indépendance de montants de sinistre Si, distribution iden-tique des Si, d’où des hypothèses d’homogénéité sur les risques présents dans leportefeuille), que la charge moyenne de sinistre par police converge vers la primepure. Une idée simple est alors de demander, si le portefeuille comprend N assurés,une prime de P = E [S] /N à chacun. Ainsi, l’assureur récupère E [S] et il est àl’équilibre a priori.

Si les risques ne sont pas assez nombreux, semblables et indépendants, la loi desgrands nombres ne s’applique plus et il n’y a plus compensation entre sinistres etprimes.

Cependant, plusieurs phénomènes vont se manifester : dans cette configuration,les bons risques vont supporter une prime plus élevée que le risque qu’ils repré-sentent en réalité, tandis que les mauvais risques s’assureront à un tarif bien meilleurque le coût qu’ils portent.Le portefeuille est hétérogène, ce qui permet de couvrir les déficits des mauvaisrisques avec les bénéfices des bons risques. Mais les bons risques peuvent par lasuite estimer qu’ils paient trop cher la couverture qu’ils ont et décider de résilier auprofit d’une autre compagnie au tarif plus attractif (phénomène d’antisélection). Acontrario, les mauvais risques vont souscrire massivement cette police d’assurancequi leur est favorable. Au fil des périodes, E [S] va augmenter, faisant monter lavaleur de la prime P payée par chacun, faisant fuir les bons risques, etc.Le problème sous-jacent ici est bien celui d’une asymétrie d’information entre l’as-sureur et l’assuré : si l’assuré se sait risqué mais pas l’assureur, il a intérêt à souscrireà ce type de police. Ce faisant, il dégrade la statistique sinistre de l’assureur, ce quienclenche le cycle décrit plus haut.

L’assureur n’a pas les moyens de connaître très précisément le risque associéà chacun de ses assurés, soit que ce soit techniquement impossible, soit que cesoit légalement interdit. Mais il peut définir des profils de risque et associer unetarification à chaque profil.

2.3 Tarification a prioriEn pratique, même si tous les assurés ne sont pas identiques, on peut constater dessimilitudes de profils entre eux.L’assureur pourrait, ayant pratiqué un tarif « arbitraire », constater à la fin de l’annéele nombre de sinistres déclarés par l’assuré et comparer ce nombre à ce qu’il avaitprévu en début d’année. C’est une forme de tarification a posteriori, dans laquellele tarif est ajusté en fonction de la sinistralité constatée chez l’assurée.Au contraire, dans la tarification dite a priori, l’idée est de séparer les contrats (et lesassurés) en catégories, de telle sorte que dans chaque catégorie, les contrats puissentêtre considérés comme équivalents, i.e. porteurs d’un même risque. Ces catégoriesservent alors de base à l’élaboration d’un tarif qui sera plus adapté au portefeuille.Pour cela, l’actuaire dispose d’informations diverses, qu’on peut regrouper en trois

12

Page 16: Facteurs de risques et tarification RC automobile en ... · 3.4 Simulation ... des affréteurs de se couvrir financièrement contre la perte en mer de bateaux et s ... L’entreprise

catégories :

• les informations sur le contrat ;

• les informations sur l’assuré ;

• les informations sur le sous-jacent, i.e. le bien assuré.

Par exemple, dans le cas de l’assurance automobile, les informations sur l’assurépeuvent être son âge, son sexe, sa situation maritale, les informations sur le contratpeuvent être la sélection d’une assurance multi-risques ou risque spécifique, les in-formations sur le sous-jacent – le véhicule – peuvent être la puissance, la couleur,l’usage, etc. Autant de détails qui vont permettre de trouver des points de corréla-tion entre ces variables et la survenance de sinistres.

L’actuaire a alors besoin de créer des modèles pour étudier l’influence de cesvariables explicatives sur la fréquence des sinistres, d’une part, et sur le coût moyen,d’autre part.

2.4 Facteurs de risqueUn facteur de risque est une variable exogène liée soit à l’assuré, soit au bien assuré,soit à l’environnement. Chacune de ces variables permet de décrire une partie durisque porté par chaque police d’assurance.Typiquement, les assureurs en RC automobile constatent que les jeunes hommessont des risques plus lourds que les femmes de plus de cinquante ans, et en déduisentque l’âge et le sexe sont des facteurs qui vont influer sur le niveau de risque présentépar chaque assuré.

Ainsi dans le problème qui nous intéresse, les facteurs de risques seront nosvariables explicatives.

13

Page 17: Facteurs de risques et tarification RC automobile en ... · 3.4 Simulation ... des affréteurs de se couvrir financièrement contre la perte en mer de bateaux et s ... L’entreprise

Chapitre 3

Traité en excédent de sinistres

Nous allons décrire dans ce chapitre le produit sur lequel nous avons travaillé. Eneffet, tous les produits de réassurance ne s’abordent pas de la même façon et n’ontpas les mêmes implications, que ce soit en terme d’engagements, de données néces-saires et de tarifs. Nous ferons donc un bref rappel des différents types de produitsde réassurance avant de nous concentrer sur le type de produit utilisé pour la réas-surance de responsabilité civile automobile.

Il existe différents types de contrats – appelés traités – en réassurance, qu’onpeut classer selon qu’ils sont proportionnels (tous les éléments du risque (primeet sinistre) sont partagés proportionnellement entre l’assureur et le réassureur) oude façon non proportionnelle – l’intervention du réassureur n’a alors lieu qu’à par-tir d’un seuil préalablement défini en contrepartie d’une prime calculée de façon àcompenser le risque qu’il accepte.

On peut imaginer tout type de montage impliquant ces deux types de traités.Dans le cadre de ce mémoire, nous ne nous intéresserons qu’à des traités en excé-dent de sinistres.

Les traités en excédent de sinistres, ou XL (Excess of Loss) sont des traitésnon proportionnels. Ils impliquent en effet l’intervention du réassureur uniquementlorsqu’un sinistre a dépassé un montant fixé au début du contrat.

3.1 DéfinitionLe traité définit des tranches de réassurance, c’est-à-dire un minimum (appelé prio-rité*, noté P dans la suite) et un maximum (appelé limite*, qui peut être illimité,et noté L dans la suite). La différence entre la limite et la priorité est appelée lacapacité* du contrat (notée C).En pratique, la notation suivante est utilisée pour définir une tranche : C xs P . Ellecorrespond à une tranche ayant une priorité de P et une limite de L = P + C.Le réassureur intervient dès lors qu’un sinistre voit son montant toucher la plusbasse tranche définie dans le traité. Le réassureur verse alors à l’assuré la sommedépassant la priorité, jusqu’à ce que la limite soit atteinte. Les sommes en dessousde la priorité et au dessus de la limite sont à la charge de l’assureur. On parle de la

14

Page 18: Facteurs de risques et tarification RC automobile en ... · 3.4 Simulation ... des affréteurs de se couvrir financièrement contre la perte en mer de bateaux et s ... L’entreprise

Claim

Amount (millions)

1,0

2,0

3,0

4,0

5,0

1 2 3

FIGURE 3.1 – Répartition entre les différentes couches de couverture. Ce qui est enjaune reste en rétention chez l’assureur.

rétention* de l’assureur.

Exemple 1 (Illustration). Soit une cédante qui a un traité XL comme suit :

• une tranche entre 1 et 2 millions d’euro : 1M xs 1M ;

• une tranche entre 2 et 4 millions d’euro : 2M xs 2M.

Tous les sinistres de moins d’un million d’euro restent entièrement à la charge del’assureur.

• Supposons qu’il y ait un sinistre de 1,5 million d’euro : le premier millionreste en rétention chez l’assureur, et les 500 000 euro au dessus de la prioritésont payés par le réassureur.

• Supposons maintenant qu’il y ait un sinistre de 3,5 millions d’euro : le pre-mier million reste en rétention chez l’assureur, le deuxième million est entiè-rement pris en charge par le réassureur au titre de la première tranche, et les1 500 000 euro au dessus de la priorité de la seconde tranche sont payés parle réassureur. Au final, le réassureur verse 2,5 millions d’euro à l’assuré, etl’assureur 1 million.

• Supposons enfin qu’il y ait un sinistre de 5 millions d’euro : le réassureurpaye alors 3 millions : les 2 tranches sont entièrement consommées. L’assu-reur paye pour sa part 2 millions : le premier million sous la priorité de lapremière tranche et le dernier million au dessus de la limite de la secondetranche.

Le graphique (3.1) permet de se représenter ces trois sinistres et la façon dontleurs montants se répartissent entre l’assureur et le réassureur, par tranches decouverture.

15

Page 19: Facteurs de risques et tarification RC automobile en ... · 3.4 Simulation ... des affréteurs de se couvrir financièrement contre la perte en mer de bateaux et s ... L’entreprise

Ce type de traité a donc l’avantage, s’il est bien calibré, de limiter l’engagementmaximal de la cédante dans un contrat donné. Ainsi, dans l’exemple ci-dessus, siaucun sinistre connu à ce jour n’a dépassé 4 millions, la cédante voit a priori sonengagement limité pour chaque police à 1 million au pire, sauf événement excep-tionnel de grande ampleur.

Concernant le réassureur, il cherche à estimer d’une part, le nombre de sinistresqui toucheront les différentes tranches du programme et d’autre part, l’excédent desinistre attendu pour chaque tranche. Suivant le modèle collectif de risque présentéplus haut, nous modélisons les fréquences et les montants en faisant l’hypothèsequ’ils sont indépendants entre eux.

La modélisation qui suit ne portera donc que sur les fréquences.

3.2 Conséquences sur la modélisationNous avons vu que le réassureur, dans ces traités, n’intervient qu’à partir d’un cer-tain montant, la priorité. Les assureurs ne signalent donc au réassureur que les si-nistres touchant – ou pouvant toucher au cours de leur développement – le pro-gramme de réassurance. En effet, les petits sinistres (au regard de la priorité) n’in-téresseront pas le réassureur.L’assureur ne signale donc que les sinistres au delà d’un certain seuil, appelé prio-rité des statistiques, qui est inférieur à la priorité – typiquement, elle vaut 50% de lapriorité, mais ce n’est pas forcément le cas.Ceci a des conséquences pour le réassureur, car la cédante ne va rapporter qu’unepartie des sinistres et donc introduire un biais dans l’interprétation de sa sinistralité :

a) le portefeuille de sinistres est restreint comparé à la sinistralité globale de la cé-dante : quid des sinistres sous-évalués ? quid aussi des sinistres juste en dessousde la priorité des statistiques ?

b) on a des informations incomplètes sur les risques réels présents dans le porte-feuille ;

c) il est difficile d’ajuster des modèles sur des sous-ensembles de ce portefeuilledes sinistres : en effet, on dispose alors de très peu de données, et les fractionneren sous-ensemble donne alors des résultats non significatifs (par exemple, si onobserve un sous-ensemble avec 0 ou 1 sinistre).

De plus, nous cherchons ici à évaluer l’impact de facteurs de risques. On auraitpu agréger, à partir des données, les sous-ensembles non significatifs de sorte à ob-tenir des ensembles significatifs sur lesquels on peut ajuster un modèle. Cependant,ceci revient à ne pas évaluer l’influence de chaque facteur de risque en particulier.

Pour toutes ces raisons, nous avons cherché à nous affranchir de la limitation dela taille du portefeuille, de façon à disposer de sous-ensembles de taille acceptable

16

Page 20: Facteurs de risques et tarification RC automobile en ... · 3.4 Simulation ... des affréteurs de se couvrir financièrement contre la perte en mer de bateaux et s ... L’entreprise

sur lesquels on puisse appliquer un modèle.

Deux possibilités s’offraient à nous. D’une part l’utilisation données de plu-sieurs compagnies ensemble et d’autre part la création de toute pièce d’un jeu dedonnées via simulation.

3.3 Agrégation de portefeuillesLa bonne approche est de ne pas considérer une seule cédante, mais un groupe decédantes, de façon à augmenter d’une part l’exposition et d’autre part la sinistralité.

Cela suppose au préalable de disposer des mêmes données pour toutes les cé-dantes dans le groupe, dans un format compatible. Ainsi, si deux cédantes donneune variable âge sous forme de tranches, il faut qu’on ait les mêmes découpages.Autrement, il faudra regrouper de sorte à obtenir des sous-ensembles compatibles,ce qu’on cherchait justement à éviter.

Ensuite, il peut arriver que même en agrégeant toutes les cédantes dont nousavons les sinistres, la quantité de données demeure insuffisante.

Enfin, si le groupe de cédantes retenu présente des distorsions dans sa sinis-tralité par rapport au marché (par exemple, une sur-représentation des femmes enportefeuille, ou beaucoup de contrats portant sur des flottes de véhicules), on n’ob-tiendra pas non plus une représentation convenable de l’influence de chaque facteurde risques. Cela revient en effet à accorder plus d’importance à un facteur que cequi est observé en réalité.

Cette méthode paraît donc un peu fragile et surtout trop dépendante de donnéesauxquelles on n’a pas forcément accès pour atteindre le but attendu.

3.4 SimulationCette approche n’est pas aussi idéale que l’agrégation de portefeuilles, mais ellepermet de « contourner »le problème de la fiabilité et la quantité des données. Ellese base sur la simulation d’un jeu de données, calibré à partir des données de lacédante. Ainsi, il s’agit de reconstituer un portefeuille qui va présenter les caracté-ristiques de la cédante ou du marché, mais qui ne sera plus limité par la taille duportefeuille disponible.

Ainsi, à partir de statistiques tirées soit du portefeuille de la cédante, soit dumarché, on peut générer une exposition et une sinistralité de taille quelconque. Enparticulier, on peut générer un jeu de données plus important, sur lequel il sera alorsplus facile d’ajuster un modèle linéaire.

17

Page 21: Facteurs de risques et tarification RC automobile en ... · 3.4 Simulation ... des affréteurs de se couvrir financièrement contre la perte en mer de bateaux et s ... L’entreprise

Chapitre 4

Mise en œuvre théorique

Dans cette section nous décrirons notre cheminement pour répondre à la probléma-tique.

4.1 Méthode retenuePour réaliser la simulation de nos données, nous avons procédé par étapes, qui se-ront plus longuement décrites par la suite :

• tout d’abord, la création de l’exposition d’un portefeuille catégorisé à partirde statistiques ;

• ensuite, à partir de cette exposition, générer un profil de sinistralité par caté-gorie pour le portefeuille ;

• enfin, ajuster un modèle sur la sinistralité attendue.

Vocabulaire et notationsAvant d’aller plus loin, précisons le vocabulaire et les notations qui seront utiliséespar la suite.Il importe en premier lieu de distinguer facteur de risque et catégorie. On appellecatégorie une réalisation des facteurs de risque. Ceux-ci sont en effet des variablesaléatoires que l’on considérera comme étant discrètes.

Exemple 2 (Catégories). On suppose qu’on dispose de deux facteurs de risque : lesexe du conducteur (homme ou femme) et le type de contrat qu’il a choisi (RC seuleou assurance tous risques). Nous obtenons alors quatre catégories :

18

Page 22: Facteurs de risques et tarification RC automobile en ... · 3.4 Simulation ... des affréteurs de se couvrir financièrement contre la perte en mer de bateaux et s ... L’entreprise

Catégorie Sexe du conducteur Type de contrat

1 Homme RC seule

2 Homme Tous risques

3 Femme RC seule

4 Femme Tous risques

À partir de cette définition des catégories, on peut parler des variables globales,c’est-à-dire qui porteront sur l’union toutes les catégories. Par exemple, l’expositionglobale sera la somme des expositions de chaque catégorie.On utilisera comme mesure d’exposition au risque le nombre de polices qui pré-sentent les caractéristiques de cette catégories, on la notera ek. Cette mesure d’ex-position sera également définie par année de souscription, notée i.

Comme nous travaillons sur une branche à développement long, il importe desuivre les années de développement. L’indice j désignera donc qu’on fait référenceà l’année de développement j.Enfin, chaque catégorie sera désignée par un indice k.

Exemple 3 (Exemples de notation). Ainsi :

• ei =∑

k ei,k désignera l’exposition globale pour l’année de souscription i.

• Ni,j désignera le nombre de sinistres survenus lors de la i-ème année de sous-cription en j-ème année de développement.

4.2 Génération d’un jeu de donnéesPour réaliser une exposition par catégorie, nous avons besoin de plusieurs para-mètres en entrée :

• l’exposition globale pour chaque année de souscription ei ;

• un ordre d’idée de la répartition de chaque facteur de risque dans le porte-feuille.

Ce dernier point signifie qu’on a besoin d’une estimation de la répartition du porte-feuille à simuler a priori.

Exemple 4 (Répartition). Si on reprend notre exemple présenté plus haut, on pour-rait avoir :

Facteur de risque Réalisation Répartition

Sexe du conducteurHomme 0.49

Femme 0.51

Type de contratRC seule 0.05

Tous risques 0.95

19

Page 23: Facteurs de risques et tarification RC automobile en ... · 3.4 Simulation ... des affréteurs de se couvrir financièrement contre la perte en mer de bateaux et s ... L’entreprise

Il s’agit bien de la répartition du portefeuille dans l’exposition, et n’a rien àvoir avec la sinistralité.

4.2.1 Obtention des entréesExposition Nous donnons l’exposition que nous désirons, pour chaque annéed’exposition. Typiquement, elle sera différente de celle du portefeuille observé, vuqu’on cherche à obtenir une plus grande sinistralité. Le tableau saisi se présentesous la forme suivante :

UY Exposure Exemple2000 e2000 10 000

2001 e2001 11 000

2002 e2002 9 000

2003 e2003 11 000

2004 e2004 13 000

2005 e2005 14 000

On peut donc suivre la tendance du portefeuille dont on dispose si on a l’informa-tion sur suffisamment d’années, ou créer une tendance (augmentation ou diminutionmécanique de l’exposition, stabilité de l’exposition).

Répartition Pour ce qui est de la répartition, il convient de faire une étude préa-lable du portefeuille ou du marché. Cela donnera une idée des proportions de chaqueréalisation dans les variables aléatoires.

On pourrait ainsi calculer des proportions pour chaque année de souscription etles appliquer directement au portefeuille. Nous avons choisi de prendre une propor-tion moyenne et de faire un tirage aléatoire autour de cette moyenne.

4.2.2 Création du portefeuilleConcrètement, nous avons procédé de la façon suivante :

(i) pour chaque année de souscription i, nous avons effectué un tirage aléatoirepour la répartition de chaque variable aléatoire. Ceci est obtenu par un tiraged’une variable Poisson-distribuée1 d’espérance la proportion voulue.

Exemple 5. Si nous reprenons le même exemple que précédemment :

1le choix d’une loi de Poisson pour modéliser des proportions peut être discutable, car il existed’autres lois ayant l’intervalle [0, 1] pour support.

20

Page 24: Facteurs de risques et tarification RC automobile en ... · 3.4 Simulation ... des affréteurs de se couvrir financièrement contre la perte en mer de bateaux et s ... L’entreprise

Facteur de risque Réalisation Répartition Nom

Sexe du conducteurHomme P(49)/100 PropH,i

Femme P(51)/100 PropF,i

Type de contratRC seule P(5)/100 PropRC,i

Tout risque P(95)/100 PropTR,i

(ii) Nous voulons que la somme des tirages soit unitaire pour chaque variablealéatoire. Nous normalisons donc les résultats obtenus pour chaque variablealéatoire.

Exemple 6. Si dans l’exemple précédent, un tirage de P(95)/100 est supé-rieur à 1 (cet événement a une probabilité non nulle), alors on aura une visionfaussée de notre univers. Mettons que P(95)/100 donne PropTR,i = 1, 01 etP(5)/100 donne PropRC,i = 0, 04. Alors, après normalisation, on aura :

PropTR,i =1, 01

1, 05= 0, 962 et PropRC,i =

0, 04

1, 05= 0, 038.

On obtient ainsi pour chaque facteur de risque un vecteur pour chaque annéede souscription. L’obtention d’une catégorie k est le produit d’une réalisationde chaque facteur de risque.

(iii) Pour chaque année i, on fait le produit tensoriel des vecteurs colonnes desfacteurs de risque.

Définition 1 (Produit tensoriel). Le produit tensoriel est un produit de ma-trices particulier, qui se définit comme suivant :Si A ∈Mm,n est une matrice n×m etB ∈Mq,r une matrice q×r, on définitle produit tensoriel de A par B, noté A⊗B, par :

C = A⊗B =

A1,1B · · · A1,nB

... . . . ...

Am,1B · · · Am,nB

C est une matrice mq × nr.

Le produit tensoriel est une opération linéaire. Notons également que dans lecas général, A⊗B 6= B ⊗ A.

Ici, nous faisons le produit tensoriel de vecteurs colonnes.

Exemple 7.(PropH,i

PropF,i

)=

(0, 47

0, 53

),

(PropRC,i

PropTR,i

)=

(0, 038

0, 962

)sont nos deux vecteurs obtenus après normalisation. Nous effectuons le pro-duit tensoriel et obtenons un seul vecteur colonne, de dimension 2 ∗ 2 = 4× 1que nous représentons ci-dessous :

21

Page 25: Facteurs de risques et tarification RC automobile en ... · 3.4 Simulation ... des affréteurs de se couvrir financièrement contre la perte en mer de bateaux et s ... L’entreprise

Catégorie Répartition

1 PropH,i ∗ PropRC,i = 0, 01786

2 PropH,i ∗ PropTR,i = 0, 45214

3 PropF,i ∗ PropRC,i = 0, 02014

4 PropF,i ∗ PropTR,i = 0, 50986

(iv) Il ne nous reste plus qu’à répartir l’exposition de l’année i pour obtenir lapopulation de chaque catégorie k :

ei,k = ei · Propk,i

Au final, on obtient une matrice de dimension k × i :

e1,1 · · · e1,j · · · e1,i

... . . . ......

el,1 · · · el,j...

... . . . ...

ek,1 · · · ek,j · · · ek,i

Exemple 8. Si nous reprenons notre exemple, donnons tout d’abord notretableau de répartition par année et par catégorie :

Année de souscriptionCat. 2000 2001 2002 2003 2004 2005

1 0,01786 0,026064 0,02401 0,02806 0,0235 0,2256

2 0,45214 0,453936 0,46599 0,43194 0,4465 0,45744

3 0,02014 0,002836 0,02499 0,03294 0,0265 0,02444

4 0,50986 0.491764 0.48501 0,50706 0,5035 0,49556

Et nous obtenons alors le tableau d’exposition par catégorie et par année desouscription :

Année de souscriptionCat. 2000 2001 2002 2003 2004 2005

1 179 287 216 309 306 316

2 4 521 4 993 4 194 4 751 5 804 6 404

3 201 311 225 362 345 342

4 5 099 5 409 4 365 5 578 6 545 6 938

Total 10 000 11 000 9 000 11 000 13 000 14 000

22

Page 26: Facteurs de risques et tarification RC automobile en ... · 3.4 Simulation ... des affréteurs de se couvrir financièrement contre la perte en mer de bateaux et s ... L’entreprise

Les expositions ont ici été arrondies pour avoir des entiers, mais ce n’est pasnécessaire (notre exposition n’a en effet aucune raison d’être entière). La lignetotale est bien le vecteur d’exposition globale que nous avions présenté plushaut.

Cette succession d’étape est suffisante pour générer un jeu de données. Cepen-dant, on peut désirer obtenir une stabilisation du portefeuille. Nous avons donc in-troduit un "bootstraping" de la matrice E = (el, j), l = 1, · · · , k, j = 1, · · · , i desorte d’obtenir des E?

1 , E?2 , · · · , E?

N , où N est le nombre d’itérations du bootstrap.La matrice E finale est alors :

E =1

n

N∑n=1

E?n =

1

n

∑Nn=1(e1,1)n · · ·

∑Nn=1(e1,j)n · · ·

∑Nn=1(e1,i)n

... . . . ......∑N

n=1(el,1)n · · ·∑N

n=1(el,j)n...

... . . . ...∑Nn=1(ek,1)n · · ·

∑Nn=1(ek,j)n · · ·

∑Nn=1(ek,i)n

Cette opération permet de réduire les effets de chance ou malchance qui pourraientintervenir lors du tirage aléatoire. Nous avons donc obtenu une exposition par caté-gorie pour toutes les années de souscription pour notre portefeuille. À partir de là,nous pouvons donc générer la sinistralité2.

4.3 Génération de la sinistralité

4.3.1 Paramètres en entréeNous avons plusieurs paramètres différents en entrée, dont l’utilité sera expliquéepar la suite :

(i) les expositions globales ei ;

(ii) l’exposition en année de quotation eQY ;

(iii) les expositions par catégorie ei,k ;

(iv) une suite de lj , coefficients de développement ;

(v) une suite de pj ∈ [0, 1] pour une loi binômiale ;

(vi) une estimation de la fréquence de sinistre fk dans chaque catégorie.

4.3.2 Mode opératoireLe principe est de générer des triangles IBNR* propres à chaque catégorie, puis deles développer pour obtenir une sinistralité en ultime. Il y a plusieurs façons de lesdévelopper ; nous ne présenterons que celle mise en œuvre.

2La génération de l’exposition peut ne pas être nécessaire et on peut utiliser les données de lacédante directement.

23

Page 27: Facteurs de risques et tarification RC automobile en ... · 3.4 Simulation ... des affréteurs de se couvrir financièrement contre la perte en mer de bateaux et s ... L’entreprise

Génération de triangles par catégorie Prenons une catégorie k. Nous avonspour cette catégorie une exposition par année de souscription ei,k.On considère que la fréquence de sinistre ne dépend que de la catégorie k. On ob-tient un fk à partir d’une analyse des données ou du marché.

On considère qu’il existe un pattern de développement des sinistres commun àtoutes les catégories lj .En effet, s’il est possible de développer individuellement le triangle de chaque ca-tégorie, cela entraînerait de sérieux doutes sur la consistance de tels développementsi les triangles sont peu fournis. Les résultats risquent par conséquent d’être trèsinstable.

Cependant, certains sinistres présents dans les triangles IBNR seront de « fauxIBNR » – c’est-à-dire que ces sinistres ont été sur-évalués par l’assureur au momentde leur déclaration mais a posteriori on constate qu’ils n’auraient jamais dû appa-raître dans ce triangle – et il faut les supprimer de la modélisation. Nous faisonsdonc une modélisation à l’aide d’une succession de lois binômiales, de paramètresde succès respectifs pj .

Nous générons alors trois triangles distincts. Dans le premier, le nombre de si-nistres sont générés suivant une loi de Poisson. Dans le second, on modélise les loisbinômiales négatives à partir du troisième, somme des deux triangles précédents.Le premier triangle a la forme suivante :

0 1 · · · 9 10

1997 ak,1997,0 ak,1997,1 · · · ak,1997,9 ak,1997,10

1998 ak,1998,0 ak,1998,1 · · · ak,1998,9

......

... · · ·2006 ak,2006,0 ak,2006,1

2007 ak,2007,0

Chaque élément ak,i,j suit une loi de Poisson P(ei,k · fk · lj). L’antidiagonale dutableau représente la LKS (Last Known Situation ou dernière situation connue). Eneffet, chaque nombre situé sur l’antidiagonale est le nombre de sinistres rattachés àl’année de survenance tel qu’on le connaît l’année 2007.

Le deuxième triangle a la forme suivante :

0 1 · · · 9 10

1997 0 bk,1997,1 · · · bk,1997,9 bk,1997,10

1998 0 bk,1998,1 · · · bk,1998,9

......

... · · ·2006 0 bk,2006,1

2007 0

24

Page 28: Facteurs de risques et tarification RC automobile en ... · 3.4 Simulation ... des affréteurs de se couvrir financièrement contre la perte en mer de bateaux et s ... L’entreprise

où chaque bk,i,j suit une loi binômiale Bin(ck,i,j−1, pj). On considère que lessinistres sont retirés à la fin de l’année écoulée, soit au début de l’année suivante,ce qui explique le vecteur nul en année de développement 0. Les ck,i,j , élémentscumulés du triangle final, sont obtenus en soustrayant les bk,i,j aux ak,i,j . On obtientalors le triangle final par catégorie :

0 1 · · · 9 10

1997 ck,1997,0 ck,1997,1 · · · ck,1997,9 ck,1997,10

1998 ck,1998,0 ck,1998,1 · · · ck,1998,9

......

... · · ·2006 ck,2006,0 ck,2006,1

2007 ck,2007,0

Ici on a :

ck,i,j =

ak,i,0 si j = 0

ck,i,j−1 + max (0, ak,i,j − bk,i,j) si j 6= 0.

Espérance et variance des ck,i,j On travaille pour une catégorie k et une annéede survenance i fixées, de sorte que : ck,i,j = cj , ak,i,j = aj et bk,i,j = bj . Poursimplifier, on a : aj ∼ P(ei,k · fk · lj) ∼ P($j), bj ∼ Bin(ck,i,j−1, pj).

On a alors :

Pr [Y = y] =∞∑n=0

Pr [Y = y|X = n] Pr [X = n]

=∞∑n=0

(e−λ

λn

n!

)py(1− p)y n!

y!(n− y)!

=∞∑n=0

e−λ(λp)y(λ(1− p))n−y

y!(n− y)!

=e−λ(λp)y

y!

∞∑n=0

(λ(1− p))n−y

(n− y)!

=e−λ(λp)y

y!eλ(1−p)

=(λp)y

y!e−λp

Pr [Y = y] ∼ P(λp)

On en déduit directement la variance de Y qui suit une loi de Poisson : λp.En appliquant ce résultat avec les variables X = aj , Y = ck,i,j et Y |X = bj , on endéduit que le nombre de sinistres suit une loi de Poisson.

25

Page 29: Facteurs de risques et tarification RC automobile en ... · 3.4 Simulation ... des affréteurs de se couvrir financièrement contre la perte en mer de bateaux et s ... L’entreprise

Obtention du triangle global Le triangle global est obtenu en sommant les tri-angles de chaque catégorie :

0 1 · · · 9 10

1997∑Nk

k=1 ck,1997,0

∑Nk

k=1 ck,1997,1 · · ·∑Nk

k=1 ck,1997,9

∑Nk

k=1 ck,1997,10

1998∑Nk

k=1 ck,1998,0

∑Nk

k=1 ck,1998,1 · · ·∑Nk

k=1 ck,1998,9

......

... · · ·2006

∑Nk

k=1 ck,2006,0

∑Nk

k=1 ck,2006,1

2007∑Nk

k=1 ck,2007,0

L’antidiagonale du tableau représente la LKS globale, dernière situation connue,qu’on se propose d’extrapoler.

Estimateur de vraisemblance par catégories

Propriété 4. L’estimateur du maximum de vraisemblance pour la régression dePoisson pour des données groupées est le même que pour des données individuelles.Si on poseLind(β) la vraisemblance obtenue sur des données individuelles etLcat(β)celle obtenue après avoir regroupé les données par catégorie. On montre que :

Lind(β) ∝ Lcat(β).

En effet, si v1, · · · ,vq sont les q suites possibles pour les xi et si on définit dj =∑i|xi=vj

di et nj =∑

i|xi=vjni :

Lind(β) =n∏i=1

exp (−λi)λnii

ni!

=

q∏j=1

∏i|xi=vj

exp (−λi)λnii

ni!

∝q∏j=1

exp

− ∑i|xi=vj

λi

[exp (βtvj)]nj

=

q∏j=1

exp

− exp (βtvj)∑

i|xi=vj

di

[exp (βtvj)]nj

∝q∏j=1

exp(− exp (βtvj)dj

)[exp (βtvj)dj]nj

nj!

donc Lind(β) ∝ Lcat(β)

Cela signifie que si les vraisemblances sont proportionnelles, alors elles ont lemême estimateur du maximum de vraisemblance.

26

Page 30: Facteurs de risques et tarification RC automobile en ... · 3.4 Simulation ... des affréteurs de se couvrir financièrement contre la perte en mer de bateaux et s ... L’entreprise

Cette propriété justifie donc la construction par catégories que nous venons defaire et le fait de travailler avec des catégories plutôt qu’avec des individus. Il estplus simple de travailler avec les catégories directement – moins de données à traiteret à manipuler, pas de problème d’aggrégation.

Méthode de Chain Ladder Pour extrapoler ce triangle global, nous utilisons laméthode de Chain Ladder.Celle-ci repose sur le calcul de facteurs de développement qui sont appliqués depuisla LKS et de proche en proche jusqu’à obtenir la situation ultime.

Il existe plusieurs façons d’obtenir des facteurs de développement, mais nousutilisons ici la version la plus "simple". Ainsi, pour passer de l’année de dévelop-pement j à l’année suivante j + 1, nous aurons un facteur ψj→j+1, obtenu commesuit :

ψj→j+1 =

∑2007−ji=1997 ci,j+1∑2007−(j+1)i=1997 ci,j

.

On peut alors faire le développement du triangle global :

0 1 · · · 9 10

1997 c1997,0 c1997,1 · · · c1997,9 c1997,10

1998 c1998,0 c1998,1 · · · c1998,9 c1998,9 · ψ9→10

......

...... · · ·

2006 c2006,0 c2006,1 c2006,1 · ψ1→2

2007 c2007,0 c2007,0 · ψ0→1

On continue successivement l’opération jusqu’à obtenir le triangle inférieurcomplet.

0 1 · · · 9 10

1997 c1997,0 c1997,1 · · · c1997,9 c1997,10

1998 c1998,0 c1998,1 · · · c1998,9 c?1998,10

......

... · · · ......

2006 c2006,0 c2006,1 · · · c?2006,9 c?2006,10

2007 c2007,0 c?2007,1 · · · c?2007,9 c?2007,10

On a ici :

ci,j =

ci,j si i+ j 6 imax

c?i,j =

(j−1∏

l=imax−i+1

ψl→l+1

)· ci,imax−i+1 si i+ j > imax

27

Page 31: Facteurs de risques et tarification RC automobile en ... · 3.4 Simulation ... des affréteurs de se couvrir financièrement contre la perte en mer de bateaux et s ... L’entreprise

Sinistres ultimes par catégorie Nous avons obtenu à présent le nombre globalde sinistres ultimes pour chaque année de développement. Cependant, nous n’avonspas d’indication sur comment ces sinistres ultimes se répartissent entre les diffé-rentes catégories.Nous avons donc fait dans un premier temps l’hypothèse qu’on retrouve la mêmeproportion de sinistres en ultime qu’en LKS. Cela signifie que toutes les catégoriesprésentent le même pattern de développement entre la LKS et l’ultime.

Ainsi, nous avons calculé un vecteur k × i qui contient le ratio ρk,i = ck,i,j/ci,jpour chaque catégorie k et pour chaque année de souscription i sur l’antidiagonale(on a j = imax−i+1). Nous avons alors obtenu les sinistres ultimes par catégorie :

Ucat = % ·DU

avec :

• Ucat la matrice Nk × imax contenant les ultimes par catégorie k et par annéei ;

• % = (ρk,i), k = 1, · · · , Nk , i = 1, · · · , imax les ratios par catégorie k etannée i ;

• DU est la matrice diagonale imax × imax dont les coefficients diagonauxsont les ultimes globaux, i.e. :

DU =

c1997,10 0 · · · 0

0 c?1998,10 · · · 0...

... . . . ...

0 0 · · · c?2007,10

Ucat contient donc Nk lignes de la forme :

(Ucat)k = (c?k,1997,10, c?k,1998,10, · · · , c?k,2007,10)

(Ucat)k = (U?k,1997, U

?k,1997, · · · , U?

k,1997)

où c?k,i,10 = ρk,i · c?i,10.

Stabilisation des résultats Ici encore, comme dans lors de la génération des ca-tégories, nous avons introduit un « bootstrap » pour stabiliser les résultats. Si on faitNB tirages, on extrapole NB triangles globaux et on obtient NB vecteurs ultimespar catégorie. Les nombres ultimes retenus sont alors les moyennes de ces tirages,i.e. :

(Ucat)k =

(1

NB

NB∑n=1

(U?k,1997)n,

1

NB

NB∑n=1

(U?k,1997)n, · · · ,

1

NB

NB∑n=1

(U?k,1997)n

).

On peut également inférer des écarts-types et des intervalles de confiance sur lesnombres obtenus grâce à cette méthode si on choisit NB suffisamment grand. C’esten effet un bon estimateur de l’espérance et de la variance de (Ucat)k.

28

Page 32: Facteurs de risques et tarification RC automobile en ... · 3.4 Simulation ... des affréteurs de se couvrir financièrement contre la perte en mer de bateaux et s ... L’entreprise

4.4 Évaluation du nombre de sinistres attendusMaintenant qu’on a obtenu une sinistralité extrapolée, on veut évaluer la sinistralitéde l’année à venir, notée QY .

4.4.1 Sinistres moyens pondérésLa méthode ici consiste en un lissage du nombre de sinistres sur toute la période.Concrètement, on calcule un λk :

λk =

∑2007i=1997 U

?k,i∑2007

i=1997 ek,i

C’est sur ce λk que nous ajustons alors un modèle GLM.

4.4.2 Sinistres moyens instantanésL’idée est ici de vouloir ajuster un modèle « par année ». Pour cela, nous calculonsun λk,i par année de souscription i et par catégorie k. Ainsi :

λk,i =U?k,i

ek,i

4.5 Ajustement du modèleL’ajustement d’un modèle linéaire généralisé (GLM) permet de mesurer quel est lepoids de chaque réalisation de chaque facteur de risque pour expliquer la sinistralitéobservée.

Il est possible de faire cela dans SAS, avec la procédure GENMOD.

29

Page 33: Facteurs de risques et tarification RC automobile en ... · 3.4 Simulation ... des affréteurs de se couvrir financièrement contre la perte en mer de bateaux et s ... L’entreprise

Chapitre 5

Exemple de modélisation sur unportefeuille RC automobile

5.1 Présentation des donnéesNous avons utilisé un jeu de données d’une compagnie d’assurance au Royaume-Uni. En effet, dans ce pays, les compagnies d’assurance transmettent aux réassu-reurs des données assez complètes concernant les sinistres survenus dans leurs por-tefeuille.

Il s’agit d’un portefeuille de responsabilité civile automobile, appelée MTPL(Motor Third Parties Liabilities). Dans ce pays et contrairement à ce qui se fait enFrance par exemple, la police d’assurance n’est pas attachée au véhicule, mais à lapersonne.

Nous disposions à cet effet de deux documents : d’une part, l’exposition de lacompagnie et d’autre part sa sinistralité « lourde », i.e. au dessus de la priorité desstatistiques, avec leurs développements entre 1997 et 2007.

5.1.1 Exposition du portefeuilleL’assureur envoie pour chaque année une feuille Excel contenant plusieurs tableauxcroisés, avec à chaque fois le nombre d’assurés d’une part, et la prime reçue d’autrepart :

• le premier tableau donne le type de police en fonction du type de véhicule,pour les flottes de véhicule d’une part et pour les voitures individuelles d’autrepart ;

• le deuxième tableau donne le « No Claim Bonus » de l’assuré en fonction dutype de police ;

• le troisième tableau donne le type de police en fonction du sexe et de l’âge del’assuré.

30

Page 34: Facteurs de risques et tarification RC automobile en ... · 3.4 Simulation ... des affréteurs de se couvrir financièrement contre la perte en mer de bateaux et s ... L’entreprise

En effet, l’assuré peut souscrire trois types de couverture pour son automobile : «Comprehensive » (assurance tous risques, comprenant aussi bien la responsabilitécivile que les dommages matériels), « Third Part Only » (assurance responsabilitécivile uniquement) et « Third Part Fire & Theft » (assurance responsabilité civile,incendie et vol).L’âge des assurés est donné par classes, avec des classes d’une année pour les plusjeunes (entre 17 et 25 ans), et des classes d’âge plus ou moins larges entre 26 et 90ans (on a ainsi 26 à 30 ans, 31 à 50 ans, 51 et plus). Il existe une classe supplémen-taire, « any driver » pour laquelle l’assuré ne donne pas son âge (c’est le cas pourune couverture pour une flotte de véhicules, par exemple).Il y a différents types de véhicules assurés : « Motor Cars » (voitures individuelles),« Light Commercial Vehicles » (fourgonnettes de commerce), « Heavy CommercialVehicles » (poids lourds), « Buses, coaches etc. » (bus, autocars), « Taxis, private &public hire » (taxis, véhicules de location), « Self-drive hire vehicles », « Tankers,hazardous » (camions-citerne, transport de matières dangereuses), « Motor cycles »(moto), « Motor Trade Road Risks », « All others » (le reste).Enfin, le « No Claim Bonus » est un bonus accordé aux assurés présents dans leportefeuille en fonction de la durée depuis laquelle ils n’ont pas eu de sinistre.

Nous ne disposons malheureusement pas d’une liste détaillée avec chaque as-suré, ses caractéristiques et son exposition annuelle. De plus, nous n’avons pas lacorrélation entre les éléments des différents tableaux. Nous avons donc consciencede travailler avec des données incomplètes.

5.1.2 Sinistralité constatée sur ce portefeuilleÀ l’inverse, les données de sinistralité se présente sous la forme d’une liste, com-prenant l’année de souscription, la référence du sinistre, le nom de l’assuré, la datedu sinistre, le sexe et l’âge du conducteur, l’âge de l’assuré, la couverture dont ildispose, la catégorie de son véhicule, s’il s’agit d’une police portant sur une flotteou non, le nombre de sinistrés, et les développements du sinistre, en trois parties(payé, en réserve, au total).Comme dit plus haut, seuls les sinistres dépassant la priorité des statistiques nousest rapportée.

5.1.3 Données exploitables dans l’exempleNous constatons que les données ne sont pas sous le même format, et que nous nepouvons donc pas utiliser toute l’information disponible dans les déclarations desinistre.Par exemple, le « No Claim bonus » est totalement inexploitable. En effet, il esttotalement impossible de faire la relation entre l’assuré sinistré et le bonus dont ilbénéficie.

Si la sinistralité fait une distinction entre assuré et conducteur, celle-ci n’existe

31

Page 35: Facteurs de risques et tarification RC automobile en ... · 3.4 Simulation ... des affréteurs de se couvrir financièrement contre la perte en mer de bateaux et s ... L’entreprise

pas dans l’exposition. En comparant les données, on constate que dans plus de 90%des cas, l’assuré et le conducteur ont même âge, et on peut faire l’hypothèse assezréaliste que le conducteur est l’assuré.Le nombre de sinistrés dans un même sinistre a été éliminé car les accidents faisantintervenir plusieurs assurés peuvent devenir des événements et ne peuvent pas êtretraités comme de simples sinistres individuels à ce titre.

Au final, nous disposons de cinq éléments exploitables, disponibles à la foisdans le tableau des expositions et dans le tableau des sinistres de la cédante :

• le sexe du conducteur ;

• l’âge du conducteur (associé à celui de l’assuré) ;

• la couverture choisie ;

• le type de véhicule ;

• flotte ou véhicule individuel.

Cependant, certaines données sont incomplètes : pour certains sinistres, nous nedisposons pas de l’information sur le conducteur (âge et sexe) : il est presqu’impos-sible de savoir si l’assuré est dans la classe « any driver » ou si l’information n’apas été communiquée.

Une fois les données traitées et rassemblées, nous pouvons commencer à ajusterun modèle GLM dessus.

5.2 Type de modèles ajustésOn ajuste un modèle sur le nombre de sinistres par catégorie λk en fonction de latranche d’âge, du sexe du conducteur, de la couverture assurantielle qu’il a choisie,du fait que ce soit une flotte de véhicule ou non, de la catégorie du véhicule et d’unλk,i.On le ramène ensuite à l’exposition pour obtenir :

λk = ei,k · λk,adj = ei,k · g−1(xtkβ)

5.3 Distribution et fonctions de lien utiliséesNous avons sélectionné une liste de distributions et de fonctions liens à utiliser pourmodéliser la sinistralité attendue.

32

Page 36: Facteurs de risques et tarification RC automobile en ... · 3.4 Simulation ... des affréteurs de se couvrir financièrement contre la perte en mer de bateaux et s ... L’entreprise

Distribution Lien

Poissonlog

identité

Normalelog

identité

Gamma

log

identité

inverse

carré inverse

Inverse gaussienne

carré inverse

identité

log

inverse

Toutes ces distributions ne sont pas équivalentes et vont donner des résultatsplus ou moins sévères. On observe ainsi certaines distributions qui prédiront unesinistralité plus sévère que le résultat « avant GLM ». Inversement, d’autres serontplus clémentes.De plus, le développement des triangles va n’attribuer aucun sinistre à certainescatégories, soit que leur exposition est très faible, soit qu’elles présentent, à l’obser-vation, une sinistralité très faible voire nulle.

Dans ces cas-là, plutôt que de chercher à ajuster un zéro, nous regroupons lescatégories avec une sinistralité nulle avec la catégorie la plus proche en terme de ca-ractéristiques, c’est-à-dire celle dont tous les paramètres sont identiques sauf un. Ily a donc a priori plusieurs possibilités pour regrouper plusieurs catégories, mais ongarde à l’esprit le fait qu’on veut maximiser le nombre de réalisations pour conduireces regroupements.Schématiquement : supposons qu’on ait :

Obs. A B C exposure lambda

i 1 2 3 x 0

j 1 2 4 y z

On peut alors décider de fusionner les observations i et j, en respectant leur exposi-tion pour conserver la même sinistralité.

Obs. A B C exposure lambda

i& j 1 2 3& 4 x+ y yzx+y

En faisant cela, nous ne réduisons pas nécessairement le nombre de paramètres,mais nous obtenons des données qui seront plus adaptées à la modélisation. De fait,

33

Page 37: Facteurs de risques et tarification RC automobile en ... · 3.4 Simulation ... des affréteurs de se couvrir financièrement contre la perte en mer de bateaux et s ... L’entreprise

certaines distributions (Gamma et inverse gaussienne) ne peuvent pas s’ajuster surdes observations ayant une variable à expliquer nulle et les éliminent purement etsimplement lors de l’ajustement du modèle.

5.4 Distributions et liens retenus, analyse des modèlesobtenus

Dans un premier temps, nous avons regardé quelles étaient les distributions effecti-vement utilisables parmi toutes celles dont nous disposions.En effet, plusieurs modèles ne sont pas définis, soit que la fonction inverse « g−1

» n’est pas définie, soit qu’une estimation du paramètre moyen est invalide, entraî-nant de fait l’arrêt de la procédure. Le tableau ci-dessous récapitule les distributionshors-jeu. Par conséquent, nous n’avons pas cherché à exploiter de résultats à partirde ces distributions.

Distribution Lien

Poisson identité

Gammaidentité

inverse

carré inverse

Inverse gaussiennecarré inverse

identité

inverse

Nous avons fait la modélisation à partir de données réelles, issues de l’extra-polation directe d’un triangle global pour une cédante donnée et une modélisationà partir de données simulées pour cette cédante. Les résultats que nous présentonsconcernent donc ces deux jeux de données.Les données de cette cédante sont un peu problématiques, dans la mesure où on nedispose pas de la répartition précise des individus en fonction des différents effets.

5.4.1 Modélisation face à un seul effetOn observe la même chose tant pour le jeu réel que pour le jeu simulé : commetoutes nos variables explicatives sont discrètes, la réponse du modèle par rapport àun seul effet est en escalier avec p paliers possibles correspondant aux p paramètres,i.e. aux p réalisations de l’effet.Quelque soit la distribution et le lien choisis, l’ajustement est trop grossier et ce typede modèles ne rend pas bien compte de la réalité. Notamment, cela ne prend pas encompte les interactions qui peuvent intervenir entre différents effets.Il faut donc plus de paramètres pour mieux représenter les données.

34

Page 38: Facteurs de risques et tarification RC automobile en ... · 3.4 Simulation ... des affréteurs de se couvrir financièrement contre la perte en mer de bateaux et s ... L’entreprise

5.4.2 Modélisation face à deux effets5.4.2.1 Modèle Normale – Identité

Ce modèle est en réalité mauvais, car il donne des estimations négatives ! En effet,certains paramètres ont des valeurs négatives, et la somme de plusieurs paramètrespeut conduire à une estimation de lambda négative pour certaines catégories. Ornous ne cherchons à obtenir strictement que des lambdas positifs : cela n’a pas desens de parler d’un nombre de sinistres négatif.Par conséquent, nous décidons de ne plus utiliser ce modèle.

5.4.2.2 Modèle Poisson – Log

On obtient différents résultats suivant les effets retenus. Cependant, ceux-ci donnentdes informations quant à la significativité de certains paramètres dans le modèle.Ainsi, pour l’âge, on observe que la tranche d’âge 26/30 ans ne semble pas signifi-cative.

L’étude des résidus permet de détecter quels sont les catégories qui sont le moinsbien ajustées et essayer de comprendre quelle(s) information(s) manque(nt) pour unmeilleur ajustement.

Les numéros correspondent aux catégories concernées. La correspondance entreun numéro et la catégorie représentée est donnée dans l’annexe [?].La droite bleue correspond à un ajustement parfait : c’est la courbe qu’on aurait ob-tenue si le modèle rendait parfaitement compte des données. La droite noire corres-pond à la pente moyenne du modèle et permet de voir rapidement le comportementglobal du modèle : si la droite noire est au-dessus de la droite bleue, alors le modèlesous-estime la sinistralité ; si elle est en-dessous, c’est le contraire, et l’estimationde la sinistralité sera plus sévère que la sinistralité observée.

Comme on peut le voir sur les figures 5.1,5.2 et 5.3, l’ajustement dépend forte-ment des effets retenus : ce ne sont pas les mêmes catégories qui sont le moins bienajustées à chaque fois.

Données réelles Le modèle Age/Sexe montre que la classe homme est mal ajus-tée. On constate graphiquement qu’en effet, ce sont les catégories qui concernentles hommes qui sont le moins bien expliquées.On fait le même constat avec le modèle Sexe/Cover.Pour le modèle Age/Cover, on constate que les polices Comp. sont mal ajustées.Les tranches d’âge ont l’air satisfaisantes ; cependant on constate, en analysant lesparamètres, que la tranche 26/30 ans n’est pas significative (une p-value à 5% de0.88) – on fait le même constat avec le modèle Age/Sexe (p-value de 0.56).

Ces résultats amènent donc à s’interroger sur la pertinence du découpage a priorides tranches d’âge.

35

Page 39: Facteurs de risques et tarification RC automobile en ... · 3.4 Simulation ... des affréteurs de se couvrir financièrement contre la perte en mer de bateaux et s ... L’entreprise

Nous pouvons comparer la déviance de chaque modèle avec la loi de Chi-carréassociée :

Effets Degrés de liberté Déviance χ2

Age | Sexe 4 4,02 3,82

Age | Cover 3 2,05 4,38

Sexe | Cover 2 4,35 3,50

Avec ce critère, on constate que les modèles Age/Sexe et Sexe/Cover ne sont pasbien ajustés (on considère qu’on modèle est bien ajusté si la déviance est inférieureau quantile d’ordre 1 − α de la loi de χ2 à k degrés de libertés). Seul le modèleAge/Cover semble satisfaisant et plutôt bien ajusté.

Données simulées

Effets Degrés de liberté Déviance χ2

Age | Sexe 4 25,03 2,58

Age | Cover 3 12,56 1,17

Sexe | Cover 2 1,90 24,27

Le modèle sur données simulées ne donne donc pas les mêmes résultats quele modèle sur données réelles. Alors qu’avec les données réelles, le « meilleur »modèle – au sens de la déviance – était le modèle Age/Cover, ici nous constatonsque le meilleur modèle serait Sexe/Cover.

Résidus Les résidus de déviance de ce modèle sont quasi homoscédastiques. Ce-pendant, on observe des outliers pour les modèles Age|Cover et Sexe|Cover quimontrent bien que certaines catégories sont mal ajustées. Le modèle Age|Sexe sembleêtre plus homoscédastique.Cette représentation permet de repérer les catégories qui voient leur sinistralité va-rier fortement et nous amène à nous interroger sur les raisons de ces variations.

Modèle Normale – Log

Nous constatons dans les deux cas – données réelles ou simulées – que suivant lecritère de la déviance, ces modèles ne donnent pas de résultats satisfaisants en termed’ajustement.

Données réelles

Effets Degrés de liberté Déviance χ2

Age | Sexe 4 2322 43,12

Age | Cover 3 2595 80,86

Sexe | Cover 2 3622 1343

36

Page 40: Facteurs de risques et tarification RC automobile en ... · 3.4 Simulation ... des affréteurs de se couvrir financièrement contre la perte en mer de bateaux et s ... L’entreprise

FIGURE 5.1 – Comparaison graphique entre sinistralité avant et après GLM – Mo-dèle Poisson Log – Effets Âge et Sexe

Données simulées

37

Page 41: Facteurs de risques et tarification RC automobile en ... · 3.4 Simulation ... des affréteurs de se couvrir financièrement contre la perte en mer de bateaux et s ... L’entreprise

FIGURE 5.2 – Comparaison graphique entre sinistralité avant et après GLM – Mo-dèle Poisson Log – Effets Âge et Couverture

Effets Degrés de liberté Déviance χ2

Age | Sexe 4 3707 506

Age | Cover 3 4209 962

Sexe | Cover 2 3379 168

38

Page 42: Facteurs de risques et tarification RC automobile en ... · 3.4 Simulation ... des affréteurs de se couvrir financièrement contre la perte en mer de bateaux et s ... L’entreprise

FIGURE 5.3 – Comparaison graphique entre sinistralité avant et après GLM – Mo-dèle Poisson Log – Effets Âge et Couverture

Résidus

39

Page 43: Facteurs de risques et tarification RC automobile en ... · 3.4 Simulation ... des affréteurs de se couvrir financièrement contre la perte en mer de bateaux et s ... L’entreprise

Modèle Gamma – Log

Nous constatons dans les deux cas – données réelles ou simulées – que suivant lecritère de la déviance, ces modèles ne donnent pas de résultats satisfaisants en termed’ajustement.

Données réelles

Effets Degrés de liberté Déviance χ2

Age | Sexe 4 5218 642

Age | Cover 3 5762 920

Sexe | Cover 2 5035 459

Données simulées

Effets Degrés de liberté Déviance χ2

Age | Sexe 4 4972 121

Age | Cover 3 5518 62

Sexe | Cover 2 7276 2424

Ce modèle est un peu à l’opposé du précédent et présente un durcissement dela sinistralité dans presque toutes les catégories. Ici encore, comme à chaque foisqu’on utilise un lien log, les intervalles de confiance ne sont pas très représentatifs.

Modèle Inverse Gaussienne – Log

Nous constatons dans les deux cas – données réelles ou simulées – que suivant lecritère de la déviance, ces modèles ne donnent pas de résultats satisfaisants en termed’ajustement.

Données réelles

Effets Degrés de liberté Déviance χ2

Age | Sexe 4 5172 1099

Age | Cover 3 6301 2102

Sexe | Cover 2 4223 149

Données simulées

Effets Degrés de liberté Déviance χ2

Age | Sexe 4 5223 71

Age | Cover 3 5423 69

Sexe | Cover 2 7065 1919

40

Page 44: Facteurs de risques et tarification RC automobile en ... · 3.4 Simulation ... des affréteurs de se couvrir financièrement contre la perte en mer de bateaux et s ... L’entreprise

5.4.3 Modélisation face à trois effetsDonnées réelles Données simulées

Modèle DF Déviance χ2 Déviance χ2

Poisson Log 1 0.33 3.7 0.76 24.27

Normale Log 1 6345 4022 6012 2294

Gamma Log 1 6528 1309 7381 2409

IGauss Log 1 6676 1504 8681 3457

Nous constatons, suivant le critère de la déviance, que nos données sont bienplus adaptées à une étude suivant une loi de Poisson. Ce résultat n’est a priori guèresurprenant dans le cas des données simulées, car nous savions a priori que nos don-nées suivraient une loi de Poisson, mais il « confirme » que nous pouvons considérerque les données réelles suivent une loi de Poisson elles aussi.

5.5 RésultatsOn obtient donc un résultat probant pour le cas d’une modélisation de Poisson, quiest conforme à la structure de données.Dans les autres cas, le modèle n’est pas convaincant et diverge facilement.

Cependant, deux défauts majeurs se sont présentés :

• la qualité et la quantité des données étaient insuffisantes pour générer un mo-dèle représentant au mieux la réalité observée ;

• la lourdeur du processus mis en œuvre par rapport aux résultats obtenus.

41

Page 45: Facteurs de risques et tarification RC automobile en ... · 3.4 Simulation ... des affréteurs de se couvrir financièrement contre la perte en mer de bateaux et s ... L’entreprise

FIGURE 5.4 – Comparaison graphique entre sinistralité avant et après GLM – Mo-dèle Poisson Log – Effets Âge, Couverture et Sexe

42

Page 46: Facteurs de risques et tarification RC automobile en ... · 3.4 Simulation ... des affréteurs de se couvrir financièrement contre la perte en mer de bateaux et s ... L’entreprise

Conclusion

L’objet de ce mémoire était de déterminer s’il était possible d’utiliser une méthodeGLM pour réaliser un tarif sur un traité de réassurance. C’est donc un sujet explo-ratoire, pour lequel la littérature est quasi inexistante.

Nous avons pu voir que le problème de la tarification a priori est essentiellementcelui de la qualité et de la quantité des données disponibles sur les contrats.

Nous avons donc choisi de jouer sur le tableau de la quantité de données endécrivant une méthode de simulation d’un jeu de données à partir des données exis-tantes. Cela a demandé d’étudier les données, les mettre en forme, les nettoyer aubesoin et en tirer les informations nécessaires à la génération du jeu de données.Nous aurions aimé pouvoir jouer sur l’autre versant du problème, la qualité des don-nées, mais nous ne disposions pas d’éléments permettant de s’engager dans cettevoie : c’est la limite des données initiales – restreintes à une seule compagnie etpour lesquelles des corrélations manquaient – qui nous a bloqué.

Par la suite, nous avons étudié les variables explicatives en vue de la construc-tion d’un modèle GLM.La méthode proposée dans ce mémoire, basée sur l’ajustement d’un modèle linéairegénéralisé permet de contourner les limites imposées par le modèle linéaire clas-sique et d’utiliser des distributions plus adaptées aux données (comme la distribu-tion de Poisson) pour approcher plus justement la sinistralité d’une petite compa-gnie et par conséquent lui proposer un tarif plus adapté à son portefeuille.

Elle donne de bons résultats a priori, mais est assez lourde à mettre en œuvrede façon quasi automatique : il y a une grosse partie de paramétrisation à faire enamont de l’ajustement de GLM qui dépend des données de la compagnie.

Il faudrait cependant en vérifier la validité en ajustant plusieurs modèles pluscomplets, c’est-à-dire avec plus de facteurs de risques. On obtient en effet danscette étude des résultats intéressants mais qui pourraient gagner à utiliser plus d’in-formation.Le deuxième point nécessaire est d’éprouver les limites de cet outil en le confron-tant aux données d’autres compagnies. Cela permettrait de vérifier sa robustesse,mais aussi sa portabilité : le traitement et la mise en forme des données prend eneffet une part non négligeable de temps.

43

Page 47: Facteurs de risques et tarification RC automobile en ... · 3.4 Simulation ... des affréteurs de se couvrir financièrement contre la perte en mer de bateaux et s ... L’entreprise

Ensuite, la validité du modèle utilisé se verra confirmée ou infirmée avec letemps. Il ne faut cependant pas perdre de vue le fait que cela reste un modèleet qu’il ne tient pas compte des risques « groupés », c’est-à-dire des événementsqui introduisent une sur-sinistralité ou des changements dans les règles légales quipeuvent influencer la sinistralité. Dans ce dernier cas, il y a assez sûrement debonnes chances que le passé ne reflète plus exactement le futur.

Cependant, ce processus de réduction reste basé sur la répartition de l’actuaireet lui rend toute sa place de décideur en lui permettant de poser et de tester seshypothèses : il est en effet libre de choisir de regrouper les catégories. Il convientpourtant de nuancer ce propos en se rappelant qu’on cherche à « isoler » le poidsde chaque effet dans le modèle GLM, donc si les catégories sont bien choisies audépart, cela ne devrait avoir aucune incidence sur le résultat final. En pratique, on apu constater que ce n’était pas le cas, notamment à cause de l’effet décrit au para-graphe précédent.

Bien qu’encore assez expérimentales parmi les actuaires, d’autres méthodesnécessitant peu de paramétrisation peuvent être employées pour résoudre ce pro-blème : les arbres de décision avec lesquels on peut répartir facilement les popula-tions d’individus en des groupes homogènes ou les réseaux de neurones, qui sontbasés sur l’apprentissage statistique. Ces deux méthodes permettent d’établir desscores et donc peuvent être utilisées pour calculer la sinistralité attendue.

Il peut être intéressant d’étudier la faisabilité d’un tarif de réassurance à l’aided’une de ces deux méthodes, quand bien même ce sera une fois de plus la quantitéet la qualité des données qui seront primordiales pour les utiliser.

44

Page 48: Facteurs de risques et tarification RC automobile en ... · 3.4 Simulation ... des affréteurs de se couvrir financièrement contre la perte en mer de bateaux et s ... L’entreprise

Annexes

45

Page 49: Facteurs de risques et tarification RC automobile en ... · 3.4 Simulation ... des affréteurs de se couvrir financièrement contre la perte en mer de bateaux et s ... L’entreprise

Annexe A

Outils mathématiques : du modèlelinéaire aux modèles linéairesgénéralisés (GLM)

Dans cette section, nous présenterons les outils à la disposition de l’actuaire pouranalyser les données (portefeuilles et sinistres) et en extraire un modèle. Comme lesméthodes actuelles se basent sur les résultats obtenus sur base du modèle linéairegaussien, nous le présenterons en premier lieu, puis nous étendrons ses résultatsdans le cadre des modèles linéaires généralisés.

A.1 Rappels sur le modèle linéaire gaussien

A.1.1 DéfinitionDans ce type de modèle, on essaie d’expliquer les variations de variables continuesY1, · · · , Yn, appelées variables à expliquer ou encore réponses, à l’aide de variablesexplicatives résumées dans les vecteurs x1, · · · ,xn en exprimant chaque Yi en fonc-tion de xi :

Yi = β0 +

p∑j=1

βjxi,j + εi avec εi ∼ N (0, σ2), i = 1, · · · , n (A.1)

Soit, écrit autrement :

Yi ∼ N

(β0 +

p∑j=1

βjxi,j, σ2

), i = 1, · · · , n

Ce modèle suppose donc que les hypothèses suivantes sont vérifiées :

• les variables aléatoires sont gaussiennes ;

• le score Y est linéaire ;

• l’homoscédasticité est vérifiée.

46

Page 50: Facteurs de risques et tarification RC automobile en ... · 3.4 Simulation ... des affréteurs de se couvrir financièrement contre la perte en mer de bateaux et s ... L’entreprise

Les observations sont donc supposées suivre une fonction affine des variables ex-plicatives avec une variance constante, fixée à σ2.Même si ce modèle impose de sérieuses limitations, il reste important car bonnombre des techniques sont applicables pour d’autres modèles qui en sont déri-vés, comme les modèles linéaires généralisés.

A.1.2 Mise en forme matricielleLe modèle linéaire est tout à fait adapté à une forme matricielle, et l’équation (A.1)peut se réécrire à l’aide de matrices :

Y = X · β + ε (A.2)

où Y est un vecteur n × 1 reprenant les variables à expliquer, β est un vecteur deparamètres de taille (p+ 1)× 1,

X =

1 xt1

1 xt2...

...

1 xtn

=

1 x1,1 x1,2 · · · x1,p

1 x2,1 x2,2 · · · x2,p

......

... . . . ...

1 xn,1 xn,2 · · · xn,p

est une matrice de taille n × (p + 1) reprenant les variables explicatives et ε ∼N (0, σ2 · 1) est un vecteur de taille n× 1 reprenant les erreurs.X est supposée de rang p+ 1, i.e.X tX est inversible.Tout le problème ici est d’estimer β, i.e. d’ajuster la droite.

A.1.3 Estimation des paramètresL’estimation des paramètres peut être obtenue par la méthode du maximum de vrai-semblance.

A.1.3.1 Estimation de β

Supposons qu’on dispose de réalisations y1, · · · , yn des variables Y1, · · · , Yn, lafonction de vraisemblance associée est alors :

L(β, σ|y) =1

(2π)n2 σn

n∏i=1

exp

(− 1

2σ2(yi − xtiβ)2

)=

1

(2π)n2 σn

exp

(− 1

2σ2(y −Xβ)t(y −Xβ)

).

Pour maximiser L(β, σ|y), il faut trouver le maximum global de la fonctionquelque soit σ, i.e. il faut résoudre :

∂L(β, σ|y)

∂β= 0.

47

Page 51: Facteurs de risques et tarification RC automobile en ... · 3.4 Simulation ... des affréteurs de se couvrir financièrement contre la perte en mer de bateaux et s ... L’entreprise

Pour simplifier le calcul, et comme la fonction logarithme est concave strictementcroissante, on utilise plutôt la log-vraisemblance :

L(β, σ|y) = ln (L(β, σ|y))

= −n2

ln(σ2)− 1

2σ2(y −Xβ)t(y −Xβ)− n

2ln(2π).

On a alors :

∂L(β, σ|y)

∂β= 0 ⇔ −2X tY + 2X tXβ = 0

⇔ X tY = X tXβ

⇔ β = (X tX)−1X tY .

À partir de là, on peut définir une prédiction Y de Y , où :

Y = Xβ = X(X tX)−1X tY .

On peut donc estimer l’erreur d’ajustement du modèle :

ε = Y − Y .

A.1.3.2 Estimation de σ

PosonsH = (X tX)−1X t.

Propriété 5. Le vecteur aléatoire Y est un estimateur sans biais de la moyenne deY et de matrice de variance-covariance σ2H . Le vecteur ε des résidus estimés estcentré et de matrice de variance-covariance σ2(I−H). De plus, ces deux vecteurssont non-corrélés.

On a :

E

[n∑i=1

εi

]= E

[Y tY − β

tX tXβ

]= E

[Y t(I −H)Y

]= Tr(σ2(I −H)) = σ2(n− p− 1)

On en déduit un estimateur sans biais de la variance σ2 tel que :

σ2 =1

n− p− 1

n∑i=1

ε2i

A.1.4 Variante : moindres carrés pondérésDans ce modèle, les observations Y1, · · · , Yn admettent la représentation :

Yi = β0 +

p∑j=1

βjxi,j + εi ou εi ∼ N (0, σ2/ωi) (A.3)

48

Page 52: Facteurs de risques et tarification RC automobile en ... · 3.4 Simulation ... des affréteurs de se couvrir financièrement contre la perte en mer de bateaux et s ... L’entreprise

où ωi est un poids associé à l’observation i, avec comme condition posée sur lasomme des ωi :

∑ni=1 ωi = 1.

Le modèle s’écrit alors sous forme matricielle comme dans le cas précédent, à l’ex-ception d’ε : ε ∼ N (0, σ2W ) où

W =

1/ω1 0 · · · 0

0 1/ω2 · · · 0...

... . . . ...

0 0 · · · 1/ωn

.

On montre à l’aide du maximum de vraisemblance comme auparavant que :

β = (X tWX)−1X tWY . (A.4)

De même on peut définir Y = X(X tWX)−1X tWY et l’erreur d’ajustementdu modèle ε = Y − Y .

A.1.5 Intervalle de confiance, intervalle de prédictionPour estimer la qualité d’un modèle, un des éléments de mesure est l’utilisation desintervalles de confiance, qui donnent l’ensemble des valeurs possibles de chaqueparamètre à un certain niveau α.Mathématiquement, cela donne :

Pr[βj − σtn−p−1,α/2 ≤ βj ≤ βj + σtn−p−1,α/2

]= 1− α.

Avec tn−p−1,1−α/2 est le quantile d’ordre 1−α/2 associé à la loi de Student à n−p−1degrés de libertés (n observations et p+ 1 paramètres).En effet, chaque composante βj de β suit une loi normale de moyenne βj et devariance σ2(X tX)−1

jj . Si σ2 est connu, alors on définit l’intervalle de confiance auniveau α pour βj par l’ensemble des ξ ∈ R tels que :

|βj − ξ| ≤ σ√

(X tX)−1jj zα/2

où zα/2 est le quantile d’ordre 1− α/2 associé à la loi N (0, 1).Si σ2 est inconnu, on utilise l’estimateur σ et on a l’intervalle de confiance donnépar l’ensemble des ξ ∈ R tels que :

|βj − ξ| ≤ σ√

(X tX)−1jj tn−p−1,1−α/2.

A.1.6 Modèle additif : principeDans certains cas, on peut être amené à considérer certaines variables dont l’inter-vention dans le modèle ne sera pas forcément linéaire. Par exemple, l’âge de l’assuréou du véhicule en assurance automobile sont a priori non linéaires : deux personnesqui ont 20 et 50 ans n’auront pas le même comportement sur la route, mais est-ce

49

Page 53: Facteurs de risques et tarification RC automobile en ... · 3.4 Simulation ... des affréteurs de se couvrir financièrement contre la perte en mer de bateaux et s ... L’entreprise

la même différence entre deux personnes de 49 et 51 ans par exemple ? Si on notex1, · · · , xp les variables explicatives, on peut donc introduire pour ces variables desfonctions fi telles que :

y =

p∑i=1

fi(xi) + ε (A.5)

On voit bien que si toutes les fonctions fi sont affines, alors on retrouve le modèlelinéaire.

A.1.6.1 Ajustement du modèle additif

Il existe plusieurs méthodes pour ajuster un modèle additif. Présentons d’abord lesméthodes pour le cas d’un seul régresseur puis nous l’étendrons à plusieurs.

Cas d’un unique régresseur Dans ce modèle on suppose qu’on ajuste un en-semble d’observations (xi, yi), où xi et yi sont des variables continues. L’équation(A.5) devient : yi = f(xi) + εi et on cherche directement la forme de f .Il existe plusieurs techniques pour estimer f , comme par exemple la méthode deLoess.

Méthode de Loess Cette méthode consiste à approximer localement f par unedroite. On sélectionne les v plus proches voisins de x afin d’estimer f(x) sur cevoisinage V(x). Plus formellement, on dispose de n observations (xi, yi) :

(i) on détermine l’ensemble V(x) ;

(ii) on calcule la distance ∆(x) séparant x de son voisin dans V(x) le plus éloigné,i.e.

∆(x) = maxxi∈V(x)

|x− xi| ;

(iii) on assigne à chaque élément de V(x) un poids ωi(x) = K(|x−xi|∆(x)

). La fonc-

tion K doit vérifier :

(a) K > 0 ;

(b) K(u) = 0 pour u > 1 ;

(c) K est non croissante sur [0, 1].

Par exemple, K telle que :

K(u) =

(1− u3)3 si u ∈ [0, 1[

0 sinon

donne plus de poids aux points les plus proches de x.

50

Page 54: Facteurs de risques et tarification RC automobile en ... · 3.4 Simulation ... des affréteurs de se couvrir financièrement contre la perte en mer de bateaux et s ... L’entreprise

(iv) f(x) est obtenue par la régression des yi sur les xi, xi ∈ V(x), à l’aide desajustements des moindres carrés pondérés.

Cette approche fournit donc une réponse de la forme :

f(xi) =n∑j=1

hi,jyj (A.6)

où les hi,j dépendent des xi.

Ici, on cherche à ajuster yi = β0(xi) + β1(xi)xi. On détermine β0(xi) et β1(xi) enminimisant : ∑

k∈V

ωk(xi) (yk − β0(xi)− β1(xi)xk)2

ce qui donne :

yi =n∑k=1

hk(xi)yk

où hk(xi) ne dépend pas des yj mais uniquement des régresseurs.Si on s’intéresse à la réponse pour une valeur x non observée, le modèle pour

estimer f(x) est donc :

yi = β0(x) + β1(x)xi + εi, xi ∈ V(x)

et on a finalement f(x) = β0(x) + β1(x)x.

Extension à plusieurs régresseurs La méthode de Loess peut être immédiate-ment étendue à plusieurs régresseurs. Cependant, le modèle obtenu ne sera pas ad-ditif mais sera de la forme :

yi = f(xi,1, · · · , xi,p) + εi

Il suffit d’approcher localement la fonction f des variables explicatives par un hy-perplan et ensuite de procéder comme dans le cas d’un unique régresseur...

Méthode du maximum de vraisemblance pénalisée et splines cubiques Unefaçon d’estimer f est de minimiser la fonction objectif, définie par :

O(f) =n∑i=1

(yi − f(xi))2 + λ

∫u∈R

(f ′′(u))2du. (A.7)

On remarque pour la loi normale que :

L(y, f(xi)) =n∏i=1

1√2πσ2

exp−(yi − f(xi))2

2σ2

51

Page 55: Facteurs de risques et tarification RC automobile en ... · 3.4 Simulation ... des affréteurs de se couvrir financièrement contre la perte en mer de bateaux et s ... L’entreprise

et en passant à la log vraisemblance :

L(y, f(xi)) = −n2

log σ2 − n

2log 2π +

1

2σ2

n∑i=1

(yi − f(xi))2

soit :

σ2L(y, f(xi)) + nσ2 log σ2 + nσ2 log 2π =n∑i=1

(yi − f(xi))2

On suppose que σ2 → 0 et donc :

σ2L(y, f(xi)) =σ2→0

n∑i=1

(yi − f(xi))2

Cette fonction objectif peut se voir comme une log-vraisemblance normale péna-lisée : on ajoute à la log-vraisemblance (première partie de (A.7)) un terme sanc-tionnant l’irrégularité de l’estimateur (en mesurant la concavité de f ) avant de lamaximiser.On appelle λ

1+λle paramètre de lissage.

Si λ→∞, pour que O(f) reste finie il faut que f ′′ = 0 : on retrouve une droite derégression comme solution : le paramètre de lissage est proche de 1.Si λ → 0, le paramètre de lissage est proche de 0 : la pénalisation disparaît et onobtient une interpolation parfaite (si les xi sont distincts).

Définition 2. Soient une série de points ((x0, y0), · · · , (xn, yn)). Un spline cubiquesk(x) est une suite de polynômes d’interpolation de degré 3 vérifiant :

sk(x) = sk,0 + sk,1(x− xk) + sk,2(x− xk)2 + sk,3(x− xk)3, x ∈ [xk, xk+1]

sk(xk) = yk, ∀ksk(xk+1) = sk+1(xk+1), ∀ks′k(xk+1) = s′k+1(xk+1), ∀ks′′k(xk+1) = s′′k+1(xk+1), ∀k.

Supposons x1 < · · · < xn. La solution fλ de la minimisation de (A.7) est unspline cubique dont les nœuds sont x1, · · · , xn. La minimisation de (A.7) peut seramener à la minimisation de :

(y − f)t(y − f) + λf tKf (A.8)

où y = (y1, · · · , yn)t, f = (f(x1), · · · , f(xn))t et K = DtC−1D avec D une

52

Page 56: Facteurs de risques et tarification RC automobile en ... · 3.4 Simulation ... des affréteurs de se couvrir financièrement contre la perte en mer de bateaux et s ... L’entreprise

matrice tridiagonale de dimension (n− 2)× n définie par :

D =

1∆1−(

1∆1

+ 1∆2

)1

∆20 0 · · · 0

0 1∆2

−(

1∆2

+ 1∆3

)1

∆30 · · · 0

0 0 1∆3

−(

1∆3

+ 1∆4

)1

∆4· · · 0

......

......

... . . . ...

0 0 0 0 0 · · · 1∆n−1

0 0 0 0 0 · · · −(

1∆n−2

+ 1∆n−1

)0 0 0 0 0 · · · 1

∆n−2

où ∆i = xi+1 − xi et C est une matrice de taille (n− 2)× (n− 2) donnée par :

C =1

6

2(∆1 + ∆2) ∆2 0 · · · 0 0

∆2 2(∆2 + ∆3) ∆3 0 · · · 0...

...... . . . ...

...

0 0 0 · · · 2(∆n−3 + ∆n−2) ∆n−2

0 0 0 · · · ∆n−2 2(∆n−2 + ∆n−1)

.

La solution fλ peut alors être obtenue en annulant le gradient de l’expression (A.8) :

−2(y − f) + 2λKf = 0

soit : fλ = (I + λK)−1y.

Extension à plusieurs régresseurs On utilise pour cela la méthode du backfitting.On dispose à présent d’observations (xi, yi), où xti = (xi,1, · · · , xi,p) et le modèleconsidéré est :

yi = c+

p∑i=1

fj(xi,j) + εi, avec εi ∼ N (0, σ2).

Pour estimer les fj , on procède par itérations : le principe consiste, étant donnéeune première estimation fk des fk de réestimer fj en ajustant les résidus obtenus àpartir des fk, k 6= j, aux valeurs du j ième régresseur xi,j , i.e. les r(j)

i tels que :

r(j)i = yi − c−

∑k 6=j

fk(xi,k).

Soit dit autrement, l’idée sous-jacente à cet algorithme est :

∀j,E

[Y − c−

∑k 6=j

fk(Xk)|Xj

]= E [rj|Xj] = fj(Xj)

53

Page 57: Facteurs de risques et tarification RC automobile en ... · 3.4 Simulation ... des affréteurs de se couvrir financièrement contre la perte en mer de bateaux et s ... L’entreprise

de sorte que les résidus r(j)i reflètent la part du comportement de la variable dépen-

dante attribuable au j ième régresseur xi,j .

Soit f tj = (fj(xj,1), fj(xj,2), · · · , fj(xj,n)) le vecteur des évaluations de fj pourles valeurs observées du j ième régresseur. Par souci d’identifiabilité de la constantec, on pose son estimateur tel que : c = y. L’algorithme se déroule alors de la façonsuivante :

Initialisation : c← y, f(0)

j ← 0, j ∈ [|1, p|].

Cycle : pour r = 1, 2, · · · et j = 1, · · · , p, mettre à jour f (r)j grâce à :

f(r+1)

j ←Hλj

(y − (y, · · · , y)t −

∑k<j

f(r+1)

k −∑k>j

f(r)

k

)

avecHλj la matrice de lissage appliquée au résidu partiel obtenu en soustrayantde l’observation y son anticipation calculée à l’aide de tous les régresseurs, à l’ex-ception du j ième.

Arrêt : Itérer le cycle ci-dessus tant que la somme des carrés des résidus(y − (y, · · · , y)t −

p∑j=1

f(r+1)

j

)t(y − (y, · · · , y)t −

p∑j=1

f(r+1)

j

)

décroît.

54

Page 58: Facteurs de risques et tarification RC automobile en ... · 3.4 Simulation ... des affréteurs de se couvrir financièrement contre la perte en mer de bateaux et s ... L’entreprise

A.2 Les modèles linéaires généralisés (GLM)Pendant longtemps, les actuaires se sont limités à utiliser le modèle linéaire gaus-sien pout quantifier l’impact de variables explicatives sur les phénomènes d’intérêt(fréquence, coût, probabilité de survenance d’événements assurés, etc.).Cependant, la complexité des problèmes statistiques auxquels sont confrontés lesactuaires s’est accrue. En particulier, la réalité n’est pas toujours normalement dis-tribuée. Il est alors crucial d’adopter des modèles qui prennent mieux en compte laréalité de l’assurance que ne le fait le modèle gaussien.

L’approche linéaire gaussienne présente plusieurs limites :

• la densité de probabilité doit être (approximativement) gaussienne ;

• le score doit être linéaire ;

• on doit vérifier également l’hypothèse d’homoscédasticité.

Même s’il est possible de s’affranchir de certaines de ces contraintes en transfor-mant au préalable la variable réponse à l’aide de fonctions bien choisies, travailleravec l’approche linéaire présente plusieurs désavantages, comme par exemple :

• l’actuaire travaille sur une échelle artificielle ;

• il est difficile de revenir aux données initiales après transformation.

Les modèles linéaires généralisés (ou Generalized Linear Models (GLM)) sontidéalement adaptés à l’analyse de données qui ne suivent pas une loi gaussienne. Cetype de données est fréquemment rencontré en assurance.Ce type de modèle est utilisé depuis la fin du XXème siècle par les actuaires.En effet, on cherche à modéliser des coûts (à valeurs dans R+), des nombres desinistres (à valeurs dansN) ou des indicatrices (à valeurs dans 0, 1), pour lesquelsd’autres lois que la loi normale sont adaptées (exemple : une loi de Poisson pour lesnombres de sinistre, ou une loi binomiale pour une indicatrice).

La modélisation va différer des modèles linéaires gaussiens par deux aspectsimportants :

• cela permet en effet de s’affranchir de l’hypothèse de normalité, qui est unecontrainte forte qu’imposait le modèle linéaire, voire même de spécifier unedistribution explicitement non normale ;

• on conserve cependant le lien linéaire entre la réponse moyenne et les va-riables explicatives.

55

Page 59: Facteurs de risques et tarification RC automobile en ... · 3.4 Simulation ... des affréteurs de se couvrir financièrement contre la perte en mer de bateaux et s ... L’entreprise

A.2.1 DéfinitionLes techniques GLM s’appliquent à toute distribution faisant partie de la familleexponentielle (Linear Exponential Family (LEF)), i.e. toute fonction de densité deprobabilité de la forme :

f(y|θ, φ) = exp

(yθ − b(θ)a(φ)

+ c(y, a(φ))

), y ∈ S (A.9)

où :

• S ⊂ R ou N ;

• θ est le paramètre naturel ;

• φ est le paramètre de dispersion ;

• généralement a(φ) = φ/ω, où le poids ω vaut 1 si ce sont des données indi-viduelles et ω = k si y est la moyenne de k observations individuelles.

Certaines lois de probabilité qui se mettent sous la forme (A.9) n’ont pas de para-mètre de dispersion (i.e. φ = 1 ; c’est notamment le cas pour la loi de Poisson) : laprime pure ne dépend alors que de θ.

Exemple 9 (Loi de Poisson). Si on considère la loi de Poisson de paramètre λ,P(λ), on a :

f(y|λ) = exp (−λ)λy

y!= exp (y lnλ− λ− ln y!)

d’où on tire : θ = lnλ, a(φ) = 1, b(θ) = exp θ) = λ, c(y, φ) = c(y) =− ln y! .

Propriété 6. Le vecteur ∂∂θ

ln fθ(X) est centré, i.e. :

E[∂

∂θln fθ(X)

]= 0.

En effet, dans le cas continu : ∫x∈R

fθ(x)dx = 1

donc pour chaque i = 1, . . . , p, on a :

0 =∂

∂θi

∫x∈R

fθ(x)dx

=

∫x∈R

∂θifθ(x)dx

=

∫x∈R

(∂

∂θiln fθ(x)

)fθ(x)dx

= E[∂

∂θiln fθ(X)

].

56

Page 60: Facteurs de risques et tarification RC automobile en ... · 3.4 Simulation ... des affréteurs de se couvrir financièrement contre la perte en mer de bateaux et s ... L’entreprise

Propriété 7. Pour une variable aléatoire Y dont la densité de probabilité est de laforme (A.9), on a :

E [Y ] = b′(θ) et V [Y ] = b′′(θ) · a(φ).

En effet :

∂θln f(y|θ, φ) =

∂θ

(yθ − b(θ)a(φ)

+ c(y, a(φ))

)=

y − b′(θ)a(φ)

.

D’où :

E[∂

∂θln f(y|θ, φ)

]=

E [Y ]− b′(θ)a(φ)

= 0

et donc :E [Y ] = b′(θ), car a(φ) 6= 0

car ce vecteur ∂∂θ

ln f(y|θ, φ) est centré.

On a par la suite :

V[∂

∂θln f(y|θ, φ)

]= E

[(∂

∂θln f(y|θ, φ)

)2]

= E

[(Y − b′(θ)a(φ)

)2]

=V [Y ]

a(φ)2.

Or :

V[∂

∂θln f(y|θ, φ)

]=

∫y∈S

(∂

∂θln f(y|θ, φ)

)2

f(y|θ, φ)dy

=

∫y∈S

∂θln f(y|θ, φ)

∂θf(y|θ, φ)dy

=

∫−y∈S

(− ∂2

∂θ2ln f(y|θ, φ)

)f(y|θ, φ)dy

= E[− ∂2

∂θ2ln f(y|θ, φ)

]=

b′′(θ)

a(φ).

D’où on tire : V [Y ] = b′′(θ) · a(φ).

Exemple 10 (Loi de Poisson). Pour la loi de Poisson, E [X] = b′(θ) = exp θ = λet V [X] = b′′(θ)a(φ) = b′′(θ) = exp θ = λ.

Les GLM sont constitués de trois éléments :

57

Page 61: Facteurs de risques et tarification RC automobile en ... · 3.4 Simulation ... des affréteurs de se couvrir financièrement contre la perte en mer de bateaux et s ... L’entreprise

(i) des variables à expliquer Y1, · · · , Yn ;

(ii) un vecteurβ = (β0, · · · , βn)t de dimension (p+1) et des variables explicativesX = (x1, · · · ,xn)t, où chaque xi est un vecteur de dimension (p + 1) : lamatriceX est supposée de rang (p+ 1), i.e.X tX est inversible ;

(iii) une fonction de lien g telle que :

g(µi) = xtiβ où µi = E [Yi]

soit E [Yi] = g−1(xtiβ)

qui lie le prédicteur ηi = xtiβ à la moyenne µi de Yi.

Exemple 11 (Fonctions de lien). Il existe plusieurs fonctions de lien. Voici quelquesexemples usuels :

• lien identité : y = µ+ ε et g : µ→ µ ;

• lien logarithme : y = expµ+ ε et g : µ→ lnµ ;

• lien logit : y = 11+exp−µ + ε et g : µ→ ln µ

1−µ .

Exemple 12 (Loi de Poisson). Pour la loi de Poisson, E [X] = b′(θ) = g−1(xtiβ) =expxtβ = λ : le lien canonique est donc la fonction logarithme.

De fait, on peut représenter le modèle de la façon suivante :

Y = µ︸︷︷︸composante systematique

+ ε︸︷︷︸composante aleatoire

Y = g−1(xtβ) + ε

A.2.2 Modèle de régressionLa linéarité au sens des GLM signifie que les coefficients βj sont linéaires et non pasles variables explicatives. Supposons que l’on dispose de variables indépendantesmais non nécessairement identiquement distribuées Y1, · · · , Yn dont la densité estde la forme (A.9). La loi jointe de Y1, · · · , Yn est alors :

f(y|θ, φ) =n∏i=1

f(yi|θi, φ)

= exp

(∑ni=1 (yiθi − b(θi))

a(φ)+

n∑i=1

c(yi, φ)

)

58

Page 62: Facteurs de risques et tarification RC automobile en ... · 3.4 Simulation ... des affréteurs de se couvrir financièrement contre la perte en mer de bateaux et s ... L’entreprise

A.2.3 Équations de vraisemblanceEn pratique, les coefficients de régression β0, · · · , βn et le paramètre de dispersionφ sont inconnus et doivent être estimés à partir des données. On utilise l’estimateurdu maximum de vraisemblance pour déterminer β. Ayant fixé a priori une loi pourmodéliser le système, il s’agit de maximiser la log-vraisemblance :

L (θ(β)|y, φ) =n∑i=1

ln f(yi|θi, φ)

=n∑i=1

yiθi − b(θi)a(φ)

+n∑i=1

c(yi, φ).

On a toujours : b′(θi) = µi = g−1(xtiβ) d’où : θi = b′−1 g−1(xtiβ)De fait, φ n’intervient pas dans la résolution de cette équation. En effet, pour trouverle maximum de vraisemblance, on cherche l’annulation de la dérivée.

∂L (θ(β)|y, φ)

∂β=

n∑i=1

yiθi − b′(θi)a(φ)

= 0⇔n∑i=1

yiθi − b′(θi) = 0

car a 6= 0.

A.2.4 Résolution des Équations de vraisemblanceLes estimateurs du maximum de vraisemblance βj des paramètres βj sont solutionsdu système :

Uj(β) =∂

∂βjL (θ(β)|y) = 0. (A.10)

Généralement, il n’y a pas de solutions explicites pour ce système d’équations,et elles doivent être résolues numériquement.Cependant, on remarque, si on note β l’estimateur du maximum de vraisemblancede β et qu’on prend un β? proche de β, qu’un développement de Taylor au premierordre nous donne :

U(β) = 0 ≈ U (β?) +H(β?)(β − β?)

où U =

(∂

∂βjL (θ(β)|y)

)j

etH =

(∂2

∂βj∂βkL (θ(β)|y)

)j,k

i.e.β ≈ β? −H−1(β?)U(β?)

d’où on en tire une relation de récurrence pour estimer β. Cette méthode est appeléela méthode de Raphson-Newton et consiste à approximer l’estimateur β de β paritérations à partir du gradient et du hessien de la log-vraisemblance (premier etsecond moments), à l’aide de la formule :

β(r+1)

= β(r)−H−1(β

(r)) ·U(β

(r))

59

Page 63: Facteurs de risques et tarification RC automobile en ... · 3.4 Simulation ... des affréteurs de se couvrir financièrement contre la perte en mer de bateaux et s ... L’entreprise

A.2.5 Évaluation de la qualité d’un modèleL’ajustement d’un modèle revient à substituer dans la pratique les valeurs obser-vées yi par les moyennes évaluées µi, avec évidemment µi 6= yi en général. Lesécarts entre les µi et les yi peuvent avoir deux origines : soit ils sont dus au hasard,soit le modèle a une mauvaise spécification et n’ajuste pas convenablement les don-nées. Plusieurs statistiques permettent alors d’évaluer la qualité d’ajustement d’unmodèle.

A.2.5.1 Déviance

On note L(.|y) la vraisemblance par rapport aux observations y. Le modèle deréférence est le modèle saturé, pour lequel on a ∀i, yi = µi, c’est-à-dire que lemodèle reproduit parfaitement les données. On note la vraisemblance de ce modèleL(y|y).Si on note L(µ|y) la vraisemblance d’un modèle ajusté, on dit que le modèle décritbien les données lorsque L(µ|y) ≈ L(y|y) et, au contraire, il le décrit mal lorsqueL(µ|y) ≪ L(y|y). On définit alors le rapport de vraisemblance Λ par

Λ =L(y|y)

L(µ|y)

et la déviance réduite D par :

D = 2 ln Λ = 2(lnL(y|y)− L(µ|y))

Une valeur élevée de D laisse penser que le modèle est de faible qualité.La déviance non-réduite D? est donnée par D? = φD, où φ est le paramètre dedispersion de la distribution utilisée.

On évalue souvent la qualité de l’ajustement du modèle avec la déviance, enraison de son lien étroit avec la vraisemblance. Même si intuitivement, une petitevaleur de la déviance signifie que le modèle est bien ajusté, on utilise un critèrequantitatif pour mesurer la qualité : en effet, si le modèle décrit bien les données,alors la déviance suit approximativement une loi Khi-deux à n − p − 1 degrés deliberté, i.e. D ∼ χ2

n−p−1. En pratique, on juge un modèle de mauvaise qualité si ladéviance observée Dobs est grande, i.e. si :

Dobs > χ2n−p−1,1−α

où χ2n−p−1,1−α est le quantile d’ordre 1 − α de la loi Khi-deux à n − p − 1 degrés

de liberté.

A.2.5.2 Statistique de Pearson

Une autre statistique disponible est la statistique de Pearson, définie par :

S2P =

n∑i=1

ωi(yi − µi)2

V [Yi].

60

Page 64: Facteurs de risques et tarification RC automobile en ... · 3.4 Simulation ... des affréteurs de se couvrir financièrement contre la perte en mer de bateaux et s ... L’entreprise

A.2.6 Intervalle de confianceComme β est approximativement de loi normale, η = xtiβ l’est aussi. La variancede η est alors donnée par :

V [η] = xtiΣxi

et on peut alors donner une approximation de l’intervalle de confiance au niveau1− α grâce à la méthode de Wald :

ICi,1−α =

[exp

(xtiβ ± zα/2

√xtiΣxi

)]où zα/2 est le quantile d’ordre 1− α de la loi normale N (0, 1).

A.2.7 Analyse des résidusL’évaluation de la déviance ou de la statistique de Pearson donne une indicationglobale de l’ajustement d’un modèle. Cependant en étudiant les résidus, il est pos-sible de repérer d’où proviennent les écarts entre le modèle et les observations, etainsi améliorer le modèle si c’est nécessaire.Les résidus sont basés sur une distance entre l’observation yi et la valeur préditeµi. Deux types de résidus sont généralement utilisés dans le cadre des GLM : lesrésidus de Pearson et les résidus de déviance.

A.2.7.1 Résidus de Pearson

Ils sont définis par :

rPi =

√ωi(yi − µi)√

V [µi].

On note que :n∑i=1

(rPi)2

= S2P

c’est-à-dire que le résidu rPi peut se voir comme la racine carrée de la contributionde la iième observation dans la statistique de Pearson.

A.2.7.2 Résidus de déviance

La déviance D donnait une mesure de la qualité de l’ajustement par le modèle.On suppose ici que chaque observation yi participe à la déviance globale avec unequantité di, i.e. que :

D =n∑i=1

di.

On définit alors les résidus de déviance par :

rDi = sgn(yi − µi)√di

61

Page 65: Facteurs de risques et tarification RC automobile en ... · 3.4 Simulation ... des affréteurs de se couvrir financièrement contre la perte en mer de bateaux et s ... L’entreprise

de sorte que

n∑i=1

(rDi)2

=n∑i=1

(sgn(yi − µi)

√di

)2

=n∑i=1

(√di

)2

= D.

A.3 Les modèles additifs généralisés (GAM)Les modèles additifs généralisés (Generalized Additive Model (GAM))sont une ex-tension des modèles GLM. Tout comme les modèles additifs ont permis de prendreen compte des effets non linéaires de certaines variables explicatives lorsque les va-riables à expliquer étaient gaussienne, les GAM permettent de faire de même pourles modèles de régression de Poisson, Binomial et Gamma.Dans cette approche, nous remplaçons la forme linéaire :

Yi = β0 +X1 · β1 +X2 · β2 + · · ·+Xp · βp

par une forme additive :

Yi = α + f1(X1) + f2(X2) + · · ·+ fp(Xp).

Souvent, les fonctions fj sont des éléments d’un espace de fonctions de dimensionfinie et peuvent la plupart du temps être identifiées, comme dans le cas gaussien,comme des splines de lissage approchant les données.

A.4 Deux approches possibles pour ajuster un GAMIl existe plusieurs méthodes pour parvenir à ajuster un tel modèle.

A.4.1 Modèle additif sur pseudo-variablesCette méthode est calquée sur l’estimation des paramètres β d’un GLM à l’aide del’ajustement d’un modèle linéaire à des pseudo-observations (les résidus) à l’aided’une méthode des moindres carrés pondérés.Ici les pseudo-observations sont définies par :

z(k)i = η

(k)i +

yi − µ(k)i

D(k)i

où µ(k)i = g−1(η

(k)i ) avec η(k)

i = c+∑p

j=1 f(k)j (xi,j) et D(k)

i = ∂∂ηg−1(η

(k)i ).

Á chaque pseudo-observation z(k)i est associée un poids π(k)

i défini par :

π(k)i =

(D

(k)i

σ(k)i

)2

avec σ(k)i =

√√√√φV[g−1

(k)i

)]ωi

La technique utilisée pour estimer les fonctions fj est la même que celle utiliséepour les modèles additifs, i.e. l’algorithme de backfitting adapté à la situation.

62

Page 66: Facteurs de risques et tarification RC automobile en ... · 3.4 Simulation ... des affréteurs de se couvrir financièrement contre la perte en mer de bateaux et s ... L’entreprise

Initialisation : c← g(y), f(0)

j ← 0, j ∈ [|1, p|].

Cycle : pour k = 1, 2, · · · , on construit les pseudo-observations z(k)i et on leur

associe les poids π(k)i .

On ajuste alors les z(k)i à c+

∑pj=1 fj(xi,j) à l’aide d’un modèle additif, i.e. :

(i) on initialise c← z(k) et f(0)

j ← f(k)

j

(ii) on réévalue

f(k+1)

j ←Hλj

(zk − (z(k), · · · , z(k))t −

∑s<j

f(k+1)

s −∑s>j

f(k)

s

)

(iii) réitérer (ii) tant que la somme des carrés des résidus décroît.

Arrêt : les variations dans les fk deviennent négligeables.

A.4.2 Maximum de vraisemblance localCeci est l’extension aux GAM de la méthode de Loess. On a alors recours à desajustements locaux dans des GLM par maximum de vraisemblance.Plus précisément, exactement comme avec la méthode de Loess, on détermine unvoisinage V(x) et des poids ωi(x). Il s’agit alors de résoudre les équations de vrai-semblance

X tΩ(x)(y − µ(β(x))

)= 0

où la matrice Ω(x) est diagonale et reprend les poids ωi(x).

63

Page 67: Facteurs de risques et tarification RC automobile en ... · 3.4 Simulation ... des affréteurs de se couvrir financièrement contre la perte en mer de bateaux et s ... L’entreprise

Annexe B

Outils et données utilisés dans SAS

B.1 Fonctionnement de GENMODModèle ajusté SAS cherche à établir le score η = Xβ, où β est un vecteurinconnu à ajuster (c’est le vecteur des paramètres) et X est une matrice contenantles observations xi :

X =

1 x1

1 x2

......

1 xn

=

1 x1,1 · · · x1,p

1 x2,1 · · · x2,p

...... . . . ...

1 xn,1 · · · xn,p

S’il y a surparamétrisation de X , i.e. que la matrice X n’est pas libre, alors on

retire les colonnes liées en les mettant à 0, l’information qu’elles contiennent étantdéjà présente dans une autre colonne.Pour coder les variables discrètes, SAS utilise plusieurs méthodes. Ainsi, la plupartdu temps, un facteur de risque avec quatre réalisations possibles sera codé sur troiscolonnes.

Exemple 13 (Codage). On dispose d’une variable aléatoire discrète A prenant lesvaleurs 1, 3, 5, 7. Un codage possible est :

A A1 A3 A5

1 1 0 0

3 0 1 0

5 0 0 1

7 -1 -1 -1

Dans cet exemple, 7 est la valeur Intercept. Cela signifie qu’il faut ajuster troisparamètres β1, β3 et β5 pour représenter cette variable aléatoire.

En tout il faut donc au moins 1 +∑l

i=1(ni − 1) paramètres pour représenterle modèle, où ni est le nombre de réalisations du facteur i. Le paramètre en pluscorrespond à l’intercept.

64

Page 68: Facteurs de risques et tarification RC automobile en ... · 3.4 Simulation ... des affréteurs de se couvrir financièrement contre la perte en mer de bateaux et s ... L’entreprise

Enfin, pour chaque observation, SAS peut calculer une valeur prédite µi =g−1(xti · β).

B.2 Tableaux des catégories utilisées pour les modèlesGLM

??

B.2.1 Données réelles

Obs AgeLevel DriverGender Cover expoQY lamb

1 17−20 Female Comp 0.942 0.05989

2 17−20 Male Comp 3.747 0.24340

3 21−25 Female Comp 4.039 0.01254

4 21−25 Male Comp 15.721 0.13772

5 26−30 Female Comp 10.828 0.01015

6 26−30 Male Comp 27.757 0.04052

7 31+ Female Comp 99.344 0.01507

8 31+ Male Comp 271.636 0.03393

9 17−20 Both TPO+TF 11.317 0.01459

10 21−25 Female TPO+TF 3.556 0.00139

11 21−25 Male TPO+TF 18.301 0.00137

12 26−30 Female TPO+TF 4.194 0.00131

13 26−30 Male TPO+TF 17.841 0.00293

14 31+ Both TPO+TF 166.481 0.00090

15 any Male anyCov 33.295 0.00677

B.3 Données générées

Obs AgeLevel DriverGender Cover expoQY lamb

1 17−20 Female Comp 27.038 0.00962

2 17−20 Male Comp 17.585 0.08875

3 21−25 Female Comp 4.795 0.01651

4 21−25 Male Comp 4.286 0.15831

5 26−30 Both Comp 9.148 0.07169

6 31+ Female Comp 52.867 0.02332

65

Page 69: Facteurs de risques et tarification RC automobile en ... · 3.4 Simulation ... des affréteurs de se couvrir financièrement contre la perte en mer de bateaux et s ... L’entreprise

Obs AgeLevel DriverGender Cover expoQY lamb

7 31+ Male Comp 35.486 0.22371

8 17−20 Female TPO+TF 80.719 0.00126

9 17−20 Male TPO+TF 51.634 0.01029

10 21−25 Both TPO+TF 27.253 0.00871

11 26−30 Both TPO+TF 27.706 0.00857

12 31+ Female TPO+TF 175.744 0.00077

13 31+ Male TPO+TF 119.959 0.00566

14 any Both anyCov 65.781 0.00223

66

Page 70: Facteurs de risques et tarification RC automobile en ... · 3.4 Simulation ... des affréteurs de se couvrir financièrement contre la perte en mer de bateaux et s ... L’entreprise

Annexe C

Glossaire

Notation Description PageList

Capacité Aussi appelée portée, c’est le montant couvertdans une tranche d’un programme de réassu-rance.

14

Cédante Une cédante est une compagnie d’assurance quitransmet une partie du risque qu’elle a souscrit àun réassureur.

4

Exposition On appelle expostion du portefeuille sa composi-tion en terme de risque.

4

Limite Montant haut de la tranche de réassurance à par-tir duquel le réassureur n’intervient plus sur unprogramme.

14

Long Tail Toute branche de réassurance dont les délaisde réglement sont longs, i.e. supérieur à un an.L’exemple typique est la responsabilité civile au-tomobile.

7

Prime pure montant qui représente le coût du risque couvert,tel que calculé par les méthodes actuarielles surla base de statistiques relatives à ce risque.

10

Priorité Montant bas de la tranche de réassurance à partirde laquelle un réassureur intervient dans un pro-gramme.

14

67

Page 71: Facteurs de risques et tarification RC automobile en ... · 3.4 Simulation ... des affréteurs de se couvrir financièrement contre la perte en mer de bateaux et s ... L’entreprise

Notation Description PageList

Rétention Tout coût d’un sinistre restant à la charge d’un as-sureur après application d’un programme de ré-assurance.

15

Short Tail Toute branche de réassurance dont les délais deréglement sont courts, généralement inférieurs àun an. On trouve par exemple les incendies, lesdommages matériels dans cette catégorie.

7

Traité Un traité est un contrat d e réassurance, liant unecédante et un réassureur. C’est lui qui détermi-nera tous les conditions du transfert de risque etc’est à lui qu’on se réfèrera en cas de litige.

4

Triangle IBNR Un triangle IBNR (Incurred But Not Reported)est un tableau qui recense le nombre de sinistressurvenus chaque année, en prenant en compte lefait que tout sinistre peut ne pas être déclaré lorsde sa survenance, mais parfois plusieurs annéesaprès.

23

68

Page 72: Facteurs de risques et tarification RC automobile en ... · 3.4 Simulation ... des affréteurs de se couvrir financièrement contre la perte en mer de bateaux et s ... L’entreprise

Bibliographie

[BENETEAU, 2006] BENETEAU, G. (2006). MODELE DE PROVISIONNE-MENT SUR DONNEES DETAILLEES EN ASSURANCE NON-VIE.

[Brezger et Lang, 2006] BREZGER, A. et LANG, S. (2006). Generalized structuredadditive regression based on Bayesian P-splines. Computational statistics & dataanalysis, 50(4):967–991.

[Carayon, 1996] CARAYON, M. (1996). Comparaison du logiciel Glim4 et de laprocédure GENMOD du logiciel SAS pour les modèles linéaires généralisés.

[Charpentier, 2008] CHARPENTIER, A. (2008). Le provisionnement en assurancenon-vie.

[Denuit et Charpentier, 2005] DENUIT, M. et CHARPENTIER, A. (2005). Mathé-matiques de l’assurance non-vie – Tome 2 : tarification et provisionnement. Eco-nomica.

[Firth et al., 1991] FIRTH, D., HINKLEY, D., REID, N. et SNELL, E. (1991). Sta-tistical Theory and Modelling : in Honour of Sir David Cox, FRS.

[Haberman et Renshaw, 1996] HABERMAN, S. et RENSHAW, A. (1996). Genera-lized linear models and actuarial science. The Statistician, 45(4):407–436.

[Mack, 1994] MACK, T. (1994). Which stochastic model is underlying the chainladder method ?* 1. Insurance : mathematics and economics, 15(2-3):133–138.

[Renshaw et Verrall, 1998] RENSHAW, A. et VERRALL, R. (1998). A stochasticmodel underlying the chain-ladder technique. British Actuarial Journal, 4(4):903–923.

[Schmitter, 2004] SCHMITTER, H. (2004). The sample size needed for the calcu-lation of a GLM tariff. ASTIN bulletin, 34(1):249–262.

[Stokes et al., 2000] STOKES, M., DAVIS, C. et KOCH, G. (2000). Categoricaldata analysis using the SAS system. SAS publishing.

69