notes de cours 02 - freejcleger.math.free.fr/maths/2017/docs/2017-ndc-02... · 2018-08-29 · 3...

55
Lycée Pierre-Gilles de Gennes BCPST2 Mathématiques 2017-2018 Notes de cours 02 Modélisation et modèles probabilistes Table des matières 1 Modélisation en probabilités 1 1.1 Qu’est ce que modéliser ......................................... 1 1.2 Et les probabilités ? ........................................... 4 1.3 Modèles probabilistes- la pratique, révisions .............................. 4 1.4 Des exemples fondamentaux de modèles ................................ 19 2 Modèles probabilistes généraux- la théorie 31 2.1 L’axiomatique de KOLMOGOROV ................................... 31 2.2 Variables aléatoires réelles, nombre fini de valeurs ........................... 37 2.3 V.a. uniforme sur [0, 1] ......................................... 39 3 Variables aléatoires réelles, espérance 42 3.1 Espérance et v.a.r intégrables ...................................... 42 3.2 Variables de carré intégrable ...................................... 44 3.3 Indépendance .............................................. 50 3.4 Probabilités conditionnelles ....................................... 52 1 Modélisation en probabilités 1.1 Qu’est ce que modéliser Le point de départ La physique, la chimie, la biologie, etc...sont des sciences qui cherchent à modéliser mathématiquement un certain nombre de phénomènes. Le point de départ est grosso modo toujours le même 1. On cherche à identifier les caractéristiques « visibles »du phénomène. Ces caractéristiques peuvent être quan- titatives ou qualitatives. 2. Certaines de ces caractéristiques peuvent être mesurables ou observables. En effectuant une expérience, on pourra évaluer ces caractéristiques sur l’expérience donnée. 3. D’autres caractéristiques peuvent être des paramètres de l’expérience. On peut, au fil des expériences, varier un ou plusieurs de ces paramètres et, à chaque fois, évaluer les caractéristiques observables. 4. Convenons d’appeler ces caractéristiques les variables de la modélisation du phénomène observé. Voici quelques questions qu’un humain aurait pu se poser il y a 10000 ans — En calorimétrie : je dispose de deux bols d’eau, l’une de la neige tout juste fondue, l’autre tout juste portée à ébullition. Je les mélange. Puis-je boire le tout sans me brûler ?

Upload: others

Post on 17-Jan-2020

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Notes de cours 02 - Freejcleger.math.free.fr/maths/2017/docs/2017-ndc-02... · 2018-08-29 · 3 Là, c’est de la physique! Balistique Pour le problème de la sagaie, les variables

Lycée Pierre-Gilles de Gennes BCPST2Mathématiques 2017-2018

Notes de cours 02Modélisation et modèles probabilistes

Table des matières

1 Modélisation en probabilités 11.1 Qu’est ce que modéliser . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.2 Et les probabilités ? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41.3 Modèles probabilistes- la pratique, révisions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41.4 Des exemples fondamentaux de modèles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

2 Modèles probabilistes généraux- la théorie 312.1 L’axiomatique de KOLMOGOROV . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 312.2 Variables aléatoires réelles, nombre fini de valeurs . . . . . . . . . . . . . . . . . . . . . . . . . . . 372.3 V.a. uniforme sur [0, 1] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

3 Variables aléatoires réelles, espérance 423.1 Espérance et v.a.r intégrables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 423.2 Variables de carré intégrable . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 443.3 Indépendance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 503.4 Probabilités conditionnelles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52

1 Modélisation en probabilités

1.1 Qu’est ce que modéliser

Le point de départLa physique, la chimie, la biologie, etc...sont des sciences qui cherchent à modéliser mathématiquement un

certain nombre de phénomènes.Le point de départ est grosso modo toujours le même

1. On cherche à identifier les caractéristiques « visibles »du phénomène. Ces caractéristiques peuvent être quan-titatives ou qualitatives.

2. Certaines de ces caractéristiques peuvent être mesurables ou observables. En effectuant une expérience, onpourra évaluer ces caractéristiques sur l’expérience donnée.

3. D’autres caractéristiques peuvent être des paramètres de l’expérience. On peut, au fil des expériences, varierun ou plusieurs de ces paramètres et, à chaque fois, évaluer les caractéristiques observables.

4. Convenons d’appeler ces caractéristiques les variables de la modélisation du phénomène observé.

Voici quelques questions qu’un humain aurait pu se poser il y a 10000 ans— En calorimétrie : je dispose de deux bols d’eau, l’une de la neige tout juste fondue, l’autre tout juste portée à

ébullition. Je les mélange. Puis-je boire le tout sans me brûler ?

Page 2: Notes de cours 02 - Freejcleger.math.free.fr/maths/2017/docs/2017-ndc-02... · 2018-08-29 · 3 Là, c’est de la physique! Balistique Pour le problème de la sagaie, les variables

2

— En balistique : je lance une sagaie vers le mammouth que j’aimerais manger. Parfois je loupe (trop court outrop long), parfois je réussis. J’aimerais réussir à coup sûr.

— En halieutique : dans ce lac, quand je lance mon filet, j’en retire deux sortes de poissons. Certaines années, uneespèce herbivore semble très majoritaire, d’autres années, c’est l’autre espèce carnivore qui est majoritaire.Pourquoi ?

Pour aborder scientifiquement ces questions, on a besoin de deux concepts : nombre et quantité.Le concept de nombre est très ancien et notre ancêtre mangeur de mammouth pouvait très probablement se figurer

le troisième problème en termes très similaires (compter le nombre d’animaux).Concernant les quantités, il est clair que dans le premier problème on peut distinguer que dans un bol il y a plus

d’eau que dans le second ou que l’eau froide est plus froide que l’eau chaude. Il n’y a pas de nombres en jeu. Lesgrecs (et peut-être avant eux les égyptiens ou d’autres dont on a perdu la trace) ont établi un pont entre ces deuxconcepts en inventant les unités de mesure.

On peut dire que le stade d’Olympie est long comme 600 pieds d’HERCULE ou que le rapport entre l’aire d’uncercle et l’aire du carré ayant pour côté le rayon de cercle, c’est un nombre, est la moitié du rapport entre le périmètrede ce cercle et le périmètre du carré.

Bref, en se servant d’une quantité étalon, on peut évaluer, par des nombres, les quantités de même nature.Cela implique que les résultats numériques issus de la modélisation d’une situation physique ne sont interpré-

tables qu’avec leur unité de mesure associée. Un changement d’unité se traduit par un changement des résultatsnumériques.

CalorimétrieConcernant le premier problème, il a fallu quelques centaines d’années pour que les concepts de température et

de quantité de chaleur reçue ou donnée émergent.— On a vu comment les longueurs (les aires, les volumes) peuvent être évalués en les comparant à une longueur

(aire, volume) étalon.— Il en est de même pour « quantité de matière », ça se mesure de façon élémentaire, par exemple, en comparant

à la balance avec des poids étalonnés. En se donnant une échelle de comparaison, on identifie la massemesurée à un nombre m.

— la température, ça se mesure, à l’origine, par un système de comparaison avec une matière pouvant se dilater.C’est le principe du thermomètre : une variation de température se mesure par une variation de longueur dela matière du thermomètre. De la sorte, on identifie la température mesurée à un nombre T .

Maintenant que l’on sait mesurer, on peut faire des expériences : dans notre cas, on peut faire varier les massesd’eau froide et d’eau chaude dans notre mélange, varier leurs températures et mesurer la température finale. On adonc 5 variables

m0,m1, T0, T1, Tf

respectivement la masse d’eau froide (m0), celle d’eau chaude (m1), leurs températures initiales (T0 et T1) et latempérature finale du mélange (T ).

On peut constater, expérimentalement, que grosso modo, T semble être la moyenne pondérée de T0 et T1 aveccomme coefficients m0 et m1.

T ∼ m0

m0 +m1.T0 +

m1

m0 +m1.T1

Une telle relation, affine en T0 et T1, est assez facile à constater sur des tables de mesures.Cette constatation n’est pas une explication ! Une explication doit ressortir d’un niveau plus élémentaire et décrire

le mécanisme par lequel on aboutit à cet équilibre.Si on introduit le concept de quantité de chaleur reçue ou donnée par un corps au cours d’une transformation, la

relation obtenue s’explique alors par l’établissement d’un bilan : ce qui a été donné par l’un a été reçu par l’autre etau final, on a un équilibre.

Un tel principe d’échange est suffisamment simple pour être considéré comme explicatif. Mais on pourrait poserla question plus avant : c’est quoi exactement la quantité de chaleur ? comment se produit l’échange, etc...

Page 3: Notes de cours 02 - Freejcleger.math.free.fr/maths/2017/docs/2017-ndc-02... · 2018-08-29 · 3 Là, c’est de la physique! Balistique Pour le problème de la sagaie, les variables

3

Là, c’est de la physique !

BalistiquePour le problème de la sagaie, les variables sont certainement la direction initiale du lancer, la puissance avec

laquelle celui-ci est effectué et la distance parcourue par la sagaie.Je laisse les spécialistes de mécanique établir que, en terrain plat, si la sagaie, de masse m, est lancée avec un

angle initial (en radians) de α0, une énergie cinétique initiale E0 alors la distance parcourue 1 est

d =E0 sin(2α0)

m.g

On peut douter 2 qu’une telle relation soit directement visible sur une expérience en faisant varier les paramètresE0 et α0.

Cette relation est issue d’une modélisation très élaborée qui fait appel au calcul différentiel, aux concepts deforce, d’accélération, etc...

Une fois la relation connue, on peut par contre, vérifier sa validité sur une expérience ad-hoc pour laquelleles 4 quantités E0, α0, m et d sont effectivement mesurables. Il s’agit de vérifier que le quotient E0 sin(2α0)

m.d estessentiellement constant, valant g.

HalieutiqueDans ce problème, on n’a pas besoin de concepts physiques extrêmement élaborés. On peut se contenter, à chaque

pêche, de consigner les proportions de chaque espèce, disons A et B, qui doivent donc être des variables du modèle.Une variable importante fait son apparition, c’est le temps. Supposons que nous le mesurions en jours, que nous

fassions une pêche par jour, et que nous notions t le jour.Il y a probablement une relation entre A et B au jour t+ 1 et A et B au jour t. Ceci se traduit par le fait que A et

B sont fonctions de t et qu’ils satisfont une relation de récurrence du typeAt+1 = fonction(At, Bt)Bt+1 = fonction(At, Bt)

On peut bien tracer, à partir de données réellles, des graphiques donnant A et B en fonctions de t. Il est douteuxque l’on puisse se servir de ces graphiques pour construire une « formule » donnant A et B en fonction de t ;

FIGURE 1: Les données de VOLTERRA. Donner, en Python, une représentation graphique de ces données 3.

En résuméModéliser, c’est déterminer un ensemble de variables intéressantes du phénomène étudié, c’est ensuite trouver

quelles relations entre variables sont adéquates pour décrire le phénomène, sur une base rationnelle (quels échangesentre les deux populations, quel taux de reproduction, de quoi dépend-il, etc...) ou sur une base empirique.

C’est aussi être conscient des hypothèses simplificatrices qui ont été faites.Finalement, il y a toujours une étape de confrontation critique des résultats du modèle avec le phénomène réel.

1. Si la vitesse initiale est v0, la formule est d =v20 sin(2α0)

2.g, g étant l’accélération de la pesanteur, as usual

2. personnellement, je n’imagine pas voir/deviner autre chose qu’une relation affine

Page 4: Notes de cours 02 - Freejcleger.math.free.fr/maths/2017/docs/2017-ndc-02... · 2018-08-29 · 3 Là, c’est de la physique! Balistique Pour le problème de la sagaie, les variables

4

1.2 Et les probabilités ?

Le hasard (et donc le calcul des probabilités) peut intervenir de différentes manières dans un processus de modé-lisation/confrontation.

Cela signifie que l’on peut considérer certaines variables du modèle comme des variables aléatoires, i.e. desvariables issues du hasard.

1. On peut croire que le hasard existe réellement dans la nature et donc, certaines variables du modèle seront paressence aléatoires.

2. Même si l’on n’y croit pas, on peut considérer comme aléatoires certaines variables que l’on ne peut contrôlerou mesurer précisément.

Les probabilités interviennent aussi dans le traitement statistique des résultats d’expérience et donc la confrontationdu modèle à la réalité.

Reprenons nos exemples— Calorimétrie. Dans l’expérience proposée, on a la relation

T =m0

m0 +m1.T0 +

m1

m0 +m1.T1

On peut se demander, par exemple, ce qui se passe pour T , i.e. comment T varie lorsque l’on a une indétermi-nation sur m0. Si l’on sait que lors de l’expérience m0 est distribuée d’une certaine façon autour d’une valeurcentrale m0, on peut se demander si, et comment, T est distribuée autour d’une certaine valeur centrale T .

— Balistique. Imaginons notre lanceur de sagaie atteint de la maladie de PARKINSON. On peut imaginer queson angle de jet ainsi que l’énergie initiale varient toutes les deux et sachant cela, on peut se demander leschances qu’il a d’atteindre(succès) ou pas(échec) une cible ayant une certaine largeur. Cela peut se mesurerexpérimentalement en itérant suffisamment l’expérience pour évaluer la proportion de succès. 4

— Enfin, pour un modèle d’évolution de population, le hasard intervient assez naturellement lorsque l’on consi-dère le phénomène au niveau individuel. Chaque animal va avoir une certaine descendance, une certaine façonde rencontrer ou pas son prédateur ou sa proie suivant un scénario qui lui est propre. Le modèle déterministene peut-être que l’expression de la tendance centrale d’un modèle microscopique probabiliste sous-jacent.

1.3 Modèles probabilistes- la pratique, révisions

Ce que comporte un modèleUn modèle probabiliste pour un système physique ou biologique, c’est, d’abord

1. Une famille de variables aléatoires, souvent numériques, les variables du modèle, X1,...Xn,...,Y1,...,Z,... quidécrivent l’état du système

2. La donnée des relations qu’elles entretiennent entre elles : y a-t-il des relations issues de la physique, de labiologie ? sont elles indépendantes ?...

3. des hypothèses portant sur les distributions de certaines de ces variables, p.ex les X1,...Xn,..

Par exemple, dans le problème du lanceur de sagaie tremblotant, les variables primitives du système sont α0,l’angle initial et E0, l’énergie initiale. m, la masse de la sagaie est une constante, tout comme g. La variable intéres-sante est d la distance à laquelle atterrit la sagaie.

Les variables α0 et E0 sont aléatoires (on verra des exemples), on peut supposer–ou pas–qu’elles sont indépen-dantes. La variable d est elle aussi aléatoire, elle dépend, via la formule de α0 et E0.

L’événement intéressant, c’est de savoir si la sagaie touche le mammouth ou pas, autrement dit, si la bête estentre les distances d− et d+, est-ce que d ∈ [d−, d+] ?

D’un point de vue probabiliste, « d ∈ [d−, d+] » est un événement et on cherche à connaitre sa probabilité.

4. On pourrait aussi se demander l’effet du vent sur le résultat final. Vent que l’on ne maîtrise pas et que l’on pourrait modéliser de façonprobabiliste, c’est compliqué !

Page 5: Notes de cours 02 - Freejcleger.math.free.fr/maths/2017/docs/2017-ndc-02... · 2018-08-29 · 3 Là, c’est de la physique! Balistique Pour le problème de la sagaie, les variables

5

Événements, probabilité, distributionsUn événement, c’est le fait qu’une (ou plusieurs) variable soit localisée, ou pas, dans une zone (numérique) don-

née, c’est aussi une combinaison logique de tels faits. Typiquement si X , Y sont des variables du modèle, à valeursréelles, I , J sont des intervalles de R, le fait que X appartienne à I est un événement, le fait que simultanémentX ∈ I et Y ∈ J l’est aussi.

Un événement est donc donné par une proposition logique faisant intervenir la localisation des valeurs prises parles variables du modèle.

On calcule des probabilités d’événements. P(X ∈ I) désignera la probabilité que la valeur prise par la variableX appartienne à l’intervalle I . C’est un nombre entre 0 et 1 décrivant la proportion d’états du système, de cas defigure, qui mènent au résultat X ∈ I .

1. Un/l’ événement certain c’est quand dans tous les cas de figure, la proposition logique décrivant l’événementest vérifiée. Sa probabilité est 1 = 100%.

2. Un événement quasi-certain 5 ou presque sûr c’est un évenement de probabilité est 1 = 100%.

3. Un/l’ événement impossible c’est quand dans tous les cas de figure, la proposition logique décrivant l’événe-ment est fausse. Sa probabilité est 0 = 0%.

4. Un événement quasi-impossible ou négligeable c’est un évenement de probabilité est 0 = 0%.

Les probabilités d’événements doivent satisfaire à des règles logiques « naturelles ».

1. Si un événement A implique un événement B, la probabilité de A doit être inférieure à celle de B car laproportion de cas de figure où A est réalisé est inférieure à la proportion de cas de figures où B est réalisé.

2. Si deux événements A et B sont incompatibles au sens où aucune configuration du système vérifiant A vérifieB et vice-versa, la probabilité de leur alternative (A ou B est vrai) est la somme de leurs probabilités.

3. Enfin, deux événements A et B sont indépendants, si la probabilité de leur conjonction (A et B est vrai) est leproduit de leurs probabilités.

Connaître la famille de nombres P(X ∈ I) où I décrit l’ensemble des intervalles de R c’est connaître la distri-bution de X ou la loi de X .

Une telle distribution peut-être une donnée de la modélisation ou un résultat recherché dans le traitement mathé-matique du modèle.

EspéranceL’espérance d’une variable numérique X doit être comprise comme la moyenne des valeurs prises par X lorsque

que l’on moyenne sur tous les états possibles du système.Le mot espérance provient de la théorie des jeux : si dans un jeu (par exemple pile ou face), le succès A rapporte

une somme donnée alors que l’échec non(A) ne rapporte rien, l’espérance de gain pour ce jeu estMontant à gagner× probabilité de gagner

En formules, si A est un événement, on note 11A la variable aléatoire valant 1 si l’événement A survient, 0 sinon.Elle représente le gain du joueur si le montant à gagner est de 1. On a

E(11A) = P(A)

Si le montant à gagner en cas de succès est s, le gain du joueur est donné par la v.a.r s.11A, son espérance est

E(s.11A) = s.P(A) = s.E(11A)

Si un jeu a trois issues possibles, marquées par la famille complète d’événements incompatiblesA1,A2,A3, avecune somme sk à gagner en cas de survenue de l’événement Ak alors l’espérance de gain est

5. Terminologie BCPST

Page 6: Notes de cours 02 - Freejcleger.math.free.fr/maths/2017/docs/2017-ndc-02... · 2018-08-29 · 3 Là, c’est de la physique! Balistique Pour le problème de la sagaie, les variables

6

Montant s1× probabilité de A1 + Montant s2× probabilité de A2+..

En formules si S est le gain de ce joueur, on a

S = s1.11A1 + s2.11A2 + s3.11A3

et

E(S) = s1.P(A1) + s2.P(A2) + s3.P(A3)

= s1.E(11A1) + s2.E(11A2) + s3.E(11A3)

Retours sur les calculs de premières annéeLa théorie que vous avez vue en première année est bâtie sur la considération de

1. Un ensemble Ω fini, un événement A étant une partie quelconque de Ω

2. Une suite finie de poids 6 (pω)ω∈Ω vérifiant

∀ω ∈ Ω, 0 ≤ pω ≤ 1 et∑ω∈Ω

pω = 1

permettant de définir la probabilité d’un événement A par la formule

P(A) :=∑ω∈A

pω =∑ω∈Ω

11ω∈Apω

3. et surtout de considérer qu’une variable aléatoire X à valeurs dans 7 X est une application X : Ω→ XCe cadre rattache la théorie des probabilités aux mathématiques « standard ». Il permet de ne traiter que le cas où unnombre fini de variables prenant un nombre fini de valeurs interviennent.

Dans ce cadre, si X , Y sont deux v.a.r, I , J deux intervalles, l’événement (X ∈ I) est une partie de Ω, c’est lapartie

X ∈ I := ω ∈ Ω, X(ω) ∈ I = X−1(I)

Sa négation est l’événement (X 6∈ I), i.e

X 6∈ I := ω ∈ Ω, X(ω) 6∈ I= ω ∈ Ω, X(ω) ∈ I

L’événement (X ∈ I et Y ∈ J), c’est la partie

X ∈ I et Y ∈ J := ω ∈ Ω, X(ω) ∈ I et Y (ω) ∈ J= ω ∈ Ω, (X(ω), Y (ω)) ∈ I × J

Les opérations logiques d’alternative ( ou ), de conjonction ( et ) et de négation (.) recherchées pour les éve-nements probabilistes se traduisent respectivement d’un point de vue ensembliste par les opérations de réunion,d’intersection ou de complémentaire. A titre d’exemples : si X , Y sont deux v.a.r, I , J deux intervalles,

X ∈ I ou Y ∈ J = X ∈ I ∪ Y ∈ JX ∈ I et Y ∈ J = X ∈ I ∩ Y ∈ J

X 6∈ I = X ∈ I

On a le résultat suivant :

6. un « germe » de probabilité sur Ω7. Si X = R, on parle de variable aléatoire réelle, en abrégé v.a.r.

Page 7: Notes de cours 02 - Freejcleger.math.free.fr/maths/2017/docs/2017-ndc-02... · 2018-08-29 · 3 Là, c’est de la physique! Balistique Pour le problème de la sagaie, les variables

7

Théorème 1 (Existence de modèles probabilistes finis). Soit x1, . . . , xK , K éléments distincts d’un ensemble X ,p1, . . . , pK ∈ [0, 1] tels que

∑Kk=1 pk = 1 alors il existe un ensemble (fini) Ω, une probabilité P sur P(Ω) et une

application X : Ω→ X tels que∀k ∈ 1, . . . ,K , P(X = xk) = pk

Définition 2 (v.a. uniforme sur un ensemble fini). Soit x1, . . . , xK , K éléments distincts d’un ensemble X , X unev.a. à valeurs dans X . Si

∀k ∈ 1, . . . ,K , P(X = xk) =1

K

On dit que X est distribuée suivant la loi uniforme sur xk, k ∈ 1, . . . ,K. On note ce fait

X ∼ Uxk, k∈1,...,K

1. Une telle variable est (presque sûrement) à valeurs dans xk, k ∈ 1, . . . ,K.2. Du théorème précédent, on déduit qu’étant donné un ensemble fini xk, k ∈ 1, . . . ,K, il existe un en-

semble fini Ω, une probabilité P et une v.a. X définie sur Ω telle que

X ∼ Uxk, k∈1,...,K

3. Ici, Ω, P dépendent de l’ensemble fini donné a priori . On verra, à la suite du théorème 14 et des méthodesde simulation (informatique) de variables finies, que l’on peut étendre la théorie à des ensembles Ω de sorte àobtenir un espace Ω (muni d’une probabilité P) universel.

Lorsque l’on modélise un expérience probabiliste, il est primordial de spécifier ce qui est tiré au sort de façonprimitive et de bien poser les lois (très souvent une loi uniforme).

Exercice 1.— Une urne contient N boules numérotées de 1 à N . On tire, sans remise (ou simultanément, ce quirevient au même) n boules et on note X le plus grand des numéros tirés.1. Donner un ensemble raisonnable dans lequel X prend ses valeurs.2. En calculant par dénombrements, donner la loi de X .3. Déterminer l’espérance de X .

Exercice 2.— Un groupe de trois chasseurs dispose d’une seule sagaie (de massem = 1kg), la cible est un troupeaude bisons à une distance entre 20 et 30m.

Leurs forces sont variées, le plus malingre, resp. le moyen, resp. le plus fort développe au lancer une énergie de200J, resp. 400J, resp. 800J.

Ils tirent au sort le lanceur et celui-ci tire sa sagaie avec (au hasard), l’un des angles π8 , π4 et 3π

8 .Quelle est la probabilité de toucher un animal ? Quelle est la loi de la distance à laquelle la sagaie est lancée ? Et

si le plus fort a deux fois plus chances d’être choisi que chacun des autres ?Indication:On rappelle qu’avec une énergie de lancer E, un angle de tir α, le point d’impact est à distance d = E. sin(2α)

m.g

Évacuer Ω des calculsLa nature exacte de Ω n’intervient pas dans un calcul probabiliste. Seules les distributions (et les quantités

associées) des v.a. interviennent et nous intéressent.Supposons que X soit une variable aléatoire ne pouvant prendre que les valeurs réelles x1, x2 et x3 où x1 <

x2 < x3. On suppose que l’on connaît les trois probabilités suivantes :

p1 := P(X = x1), p2 := P(X = x2) et p3 := P(X = x3)

les événements X = x1, X = x2 et X = x3 sont mutuellement incompatibles : on rejette le fait que dansun cas de figure donné, la valeur prise par X soit à la fois x1 et x2. Il y a plusieurs (une infinité si l’on y réfléchit)modèles probabilistes finis possibles

Page 8: Notes de cours 02 - Freejcleger.math.free.fr/maths/2017/docs/2017-ndc-02... · 2018-08-29 · 3 Là, c’est de la physique! Balistique Pour le problème de la sagaie, les variables

8

— Le plus simple : Ω = x1, x2, x3 ⊂ R, P définie sur P(Ω) par le système de poids (x1, p1), (x2, p2) et(x3, p3) et enfin X : Ω→ R définie par ∀ω ∈ Ω, X(ω) = ω.

— Variante à numerotation : Ω = 1, 2, 3, P définie sur P(Ω) par le système de poids (1, p1), (2, p2), (3, p3)et enfin X : Ω→ R définie par ∀ω ∈ Ω, X(ω) = xω.

— Variante inutilement compliquée : Ω = 1, 2, 3 × 0, 1, P définie sur P(Ω) par le système de poids((1, 0), p1/3), ((2, 0), p2/3), ((3, 0), p3/3), ((1, 1), 2p1/3), ((2, 1), 2p2/3) et ((3, 1), 2p3/3) et enfin X :Ω→ R définie par ∀ω = (ω1, ω2) ∈ Ω, X(ω) = xω1 .

On peut, dans chaque cas, dessiner les événements X = x1, X = x2 et X = x3. L’alternative de ces troisévénements est certaine : X doit prendre une valeur et, par hypothèse, c’est l’une des trois valeurs x1, x2 ou x3. Enconclusion, on doit avoir

p1 + p2 + p3 = P(X = x1) + P(X = x2) + P(X = x3)

= P((X = x1) ou (X = x2) ou (X = x3)) = 1

Si I est un intervalle quelconque de R, la probabilité P(X ∈ I) se calcule comme suit car l’événement X ∈ Iest l’alternative des trois événements incompatibles X = x1 et X ∈ I, X = x2 et X ∈ I et X = x3 et X ∈I.

P(X ∈ I) = P(X = x1 et X ∈ I) + P(X = x2 et X ∈ I)

+P(X = x3 et X ∈ I)

Si, par exemple x1, x2 ∈ I et x3 6∈ I , on a, par redondance,

X = x1 et X ∈ I = X = x1, X = x2 et X ∈ I = X = x2,

et X = x3 et X ∈ I est impossible et donc

P(X ∈ I) = P(X = x1 et X ∈ I)︸ ︷︷ ︸p1

+P(X = x2 et X ∈ I)︸ ︷︷ ︸p2

+

P(X = x3 et X ∈ I)︸ ︷︷ ︸0

= p1 + p2

On a en général

P(X ∈ I) =

3∑i=1

11xi∈IP(X = xi)

Simulation informatique, interprétation fréquentielleEn Python, sous numpy, on dispose 8 d’un certain nombre de fonctions (regroupées dans le module numpy.random)

permettant d’obtenir la valeur d’une v.a. ayant une certaine distribution. Voirhttps://docs.scipy.org/doc/numpy/reference/routines.random.html Dans les simu-

lations que nous affectuerons, trois fonctions Python sont particulièrement pratiques

1. np.random.randint(n) qui retourne un entier aléatoire uniforme entre 0 et n-1

2. np.random.choice(liste,p=None) qui retourne un des éléments de la liste tiré uniformément(avec probabilité donnée par p si p est une liste de même taille que liste).

8. après importation par import numpy as np

Page 9: Notes de cours 02 - Freejcleger.math.free.fr/maths/2017/docs/2017-ndc-02... · 2018-08-29 · 3 Là, c’est de la physique! Balistique Pour le problème de la sagaie, les variables

9

3. np.random.rand() qui retourne un nombre réel de l’ensemblekN , k ∈ 0, . . . , N − 1

. Le nombre

entier N est si grand que l’on considère que cette fonction retourne un nombre réel tiré uniformément sur[0, 1[.

Nous verrons plus tard 9 que la troisième fonction suffit pour simuler tout type de variable aléatoire : c’est la plusfondamentale des trois.

Il est important de noter que chaque appel à l’une de ces fonctions Python produit une valeur indépendante desautres appels.

Dans les situations physiques que nous cherchons à modéliser, en un certain sens, le tirage au sort ne se produitqu’une fois.

Si je lance une pièce, le résultat de l’expérience est modélisé par la v.a. X dont les valeurs possibles sont Pile etFace. Le fait de dire

P(X = Pile) =1

2= P(X = Face)

est une façon d’affirmer que l’on croit la pièce est équilibrée et que le tirage s’est effectué dans de bonnes conditions.Il est clair cependant que si l’on ne fait qu’UN tirage, on ne peut être sûr de ceci. Une façon de consolider cette

croyance est de procéder à un grand nombre de tirages semblables et de constater que grosso modo, Pile et Facesont sortis en quantités comparables. On calcule, sur un grand (disons N = 1000) nombre de tirages la fréquenced’apparition de Pile :

fPile =nbre de Pile

N

Le nombre fPile est compris entre 0 et 1 et, concernant, la fréquence d’apparition de Face, on a

fFace =nbre de Face

N=

1

2− f(Pile)

Si le nombre fPile est suffisamment proche 10 de 12 , on pourra alors être convaincu que l’hypothèse

P(X = Pile) =1

2= P(X = Face)

est raisonnable.On peut noter que cette procédure revient à considérer N variables X1, . . . XN ayant même distribution que X ,

indépendantes, à effectuer UN tirage de chacune de ces variables, et, une fois les résultats consignés, à calculer lesfréquences d’apparition.

En Python, si on convient d’associer Face à 0 et Pile à 1, la fonction np.random.randint(2) simule untirage de pièce « équilibrée » et la première boucle for du programme Python 1 remplit une liste de N tiragessuccessifs et indépendants.

La technique d’accumulateur autour de la deuxième boucle for évalue la fréquence d’apparition de Pile. Cettefréquence est imprimée à l’écran à l’issue du calcul.

Listing 1: python/PF-simple.pyimport numpy as npN=1000liste=[]for i in range(N):

liste.append(np.random.randint(2))fPile=0.0for res in liste:

fPile+=resfPile=fPile/Nprint("N=",N,";fréquence de Pile= ",fPile)

9. c’est un thème récurrent du cours10. De combien est une question traitée dans le chapitre de statistiques

Page 10: Notes de cours 02 - Freejcleger.math.free.fr/maths/2017/docs/2017-ndc-02... · 2018-08-29 · 3 Là, c’est de la physique! Balistique Pour le problème de la sagaie, les variables

10

Supposons maintenant que l’on veuille simuler informatiquement une v.a.r X telle que

P(X = 0) = 0.1, P(X = 0.5) = 0.6 et P(X = 1.1) = 0.3

On utilise alors np.random.choices([0,0.5,1.1],p=[0.1,0.6,0.3]).Comment vérifier, en tout cas, grosso modo que cette fonction Python fait bien ce qu’on attend d’elle ?

1. On peut comme précédemment, sur un grand nombre d’expériences, calculer les fréquences d’apparition dechaque résultat possible.

2. On peut aussi, après avoir consigné dans une liste les résultats de ces expériences, afficher un histogramme decette série statistique avec « bins » bien choisis.

La commande plt.hist(x,bins=[...],normed=True) affiche l’histogramme de la série statistique x liéau « bins ». Les bins déterminent les frontières d’intervalles contigus I de l’axe des abscisses et l’aire du rectangleau dessus de chaque intervalle est la fréquence d’apparition de l’événement x ∈ I , i.e. la proportion d’éléments dela liste x appartenant à l’intervalle I .

Listing 2: python/tirage-3-val-simple.pyimport numpy as npimport matplotlib.pyplot as plt

N=1000liste=[]x=[0,0.5,1.1] #Valeurs possiblespx=[0.1,0.6,0.3] #Proba d’apparition associéefor i in range(N):

liste.append(np.random.choice(x,p=px))

plt.hist(liste,bins=[-0.25,0.25,0.75,1.25],normed=True)plt.show()

plt.hist(liste,bins=[-0.01,0.01,0.49,0.51,1.09,1.11],normed=True)plt.show()

0.4 0.20.0 0.2 0.4 0.6 0.8 1.0 1.2 1.4x

0.0

0.2

0.4

0.6

0.8

1.0

1.2

1.4

h=p/`

(I)

0.2 0.0 0.2 0.4 0.6 0.8 1.0 1.2x

0

5

10

15

20

25

30

35

FIGURE 2: Deux histogrammes d’une simulation de N=1000 valeurs de X , bins de largeur 0.5 autour des valeurspossibles, bins de largeur 0.02. La somme des aires des rectangles vaut 1.

Page 11: Notes de cours 02 - Freejcleger.math.free.fr/maths/2017/docs/2017-ndc-02... · 2018-08-29 · 3 Là, c’est de la physique! Balistique Pour le problème de la sagaie, les variables

11

Un apparté sur les bins et les histogrammesComme le montre la figure 3, le choix de bons « bins » est crucial pour la compréhension d’une série statistique

d’une v.a discrète. Les rédacteurs du rapport G2E (figure 4) ont mieux compris ce problème.

FIGURE 3: Un histogramme des résultats de l’épreuve de Synthèse-Biologie AV 2015.

FIGURE 4: Un histogramme des résultats de l’épreuve de Biologie G2E 2016.

Représentation graphique d’une distribution et transformations.Pour représenter graphiquement une distribution de v.a. réelle X , on place une barre (fléchée) de hauteur P(X =

xk) au dessus de chaque valeur xk pouvant être prise par X . c.f. figures 5 et 6Une telle représentation est réminiscente de la présentation précédente en histogramme de données statistiques.Une barre fléchée de hauteur p doit être lue comme représentant un rectangle de hauteur infinie, de largeur nulle

mais d’aire p. (Une telle chose n’existe pas vraiment)

Exercice 3.— Représenter graphiquement la distribution d’une variable X suivant la loi binomiale B(4, 1

2

), puis

la distribution de Y = X − 2 et enfin celle de Z = Y 2 − 2.

La fonction de répartition d’une v.a. réelle

Page 12: Notes de cours 02 - Freejcleger.math.free.fr/maths/2017/docs/2017-ndc-02... · 2018-08-29 · 3 Là, c’est de la physique! Balistique Pour le problème de la sagaie, les variables

12

0.0 0.5 1.1x

0.1

0.6

0.3p

0.00 0.25 1.21y

0.1

0.6

0.3

FIGURE 5: Une variable aléatoire X , sa distribution et la distribution de Y = X2.

1.1 0.0 1.1x

0.1

0.6

0.3

p

0.00 1.21y

0.6

0.4

FIGURE 6: Idem que pour la fig. 5. Noter que P(Y = 1.21) = P(X = −1.1) + P(X = 1.1)

Soit X une variable aléatoire réelle. Sa fonction de répartition FX est la fonction FX : R → [0, 1] ⊂ R définiepar la formule

∀x ∈ R, FX(x) = P(X ≤ x) = P(X ∈ ]−∞, x])

Les figures 7 et 8 montrent les graphes des fonctions FX et FY . Noter le « saut » de ces fonctions aux valeurs prisespar les variables avec probabilité > 0.

La fonction de répartition FX d’une v.a.réelle X caractérise la distribution de X .Une telle fonction est croissante sur R, continue à droite en tout point de R, de limite 0 en −∞, de limite 1 en

+∞.Dans le cas d’un v.a. ne prenant qu’un nombre fini de valeurs, elles est constante par morceaux.

L’espéranceSi X est une v.a prenant un nombre fini de valeurs réelles distinctes, x1, . . . , xK , on a

X =

K∑k=1

xk11X=xk

Page 13: Notes de cours 02 - Freejcleger.math.free.fr/maths/2017/docs/2017-ndc-02... · 2018-08-29 · 3 Là, c’est de la physique! Balistique Pour le problème de la sagaie, les variables

13

0.0 0.5 1.1x

0.1

0.7

1.0

p

0.00 0.25 1.21y

0.1

0.7

1.0

FIGURE 7: Une variable aléatoire X , Y = X2, distributions et fonctions de répartition.

1.1 0.0 1.1x

0.1

0.7

1.0

p

0.00 1.21y

0.6

1.0

FIGURE 8: Idem que pour la fig. 7.

et son espérance est

E(X) =

K∑k=1

xkP(X = xk)

Si X est constante, X = λ ∈ R alorsE(X) = λ

L’espérance est une opération linéaire :

1. Si X , Y sont deux v.a. réelles prenant chacune un nombre fini de valeurs alors Z = X + Y est aussi une v.a.réelle prenant un nombre fini de valeurs et on a (additivité de l’espérance)

E(X + Y ) = E(X) + E(Y )

2. Si X , est une v.a. réelle, λ ∈ R une constante alors W = λ.X est aussi une v.a. réelle prenant un nombre finide valeurs et on a

E(λ.X) = λ.E(X)

Page 14: Notes de cours 02 - Freejcleger.math.free.fr/maths/2017/docs/2017-ndc-02... · 2018-08-29 · 3 Là, c’est de la physique! Balistique Pour le problème de la sagaie, les variables

14

3. Plus généralement, Si X1, . . . , Xn sont des v.a. réelles prenant un nombre fini de valeurs, λ1, . . . , λn ∈ R, desconstantes alors Z =

∑ni=1 λi.Xi est aussi une v.a. réelle prenant un nombre fini de valeurs et

E(Z) = E(

n∑i=1

λi.Xi) =

n∑i=1

λi.E(Xi)

Exercice 4.—1. Donner l’espérance d’une v.a. uniforme sur 0, . . . , n, d’une v.a uniforme sur 1, . . . , n.2. Donner l’espérance d’une v.a. uniforme sur l’ensemble des entiers naturels pairs inférieurs à 500, (on remarqueraque c’est le double d’une v.a. uniforme sur 0, . . . , 250, d’une v.a. uniforme sur l’ensemble des entiers naturelsimpairs inférieurs à 501 (se ramener au cas précédent en retranchant 1).

Exercice 5.— Une urne contient n jetons numérotés de 1 à n ; On effectue deux tirages avec remise ; Soit X le plusgrand des deux numéros tirés, Y le plus petit.1. Etablir une modélisation sensée de cette expérience. Quelles sont les v.a. naturelles ? Quelles sont leurs distribu-tions ? Comment sont-elles l’une par rapport à l’autre ?2. Donner la loi du couple (X,Y ).3. Donner les lois de X et Y . Donner leurs espérances.4. Donner la loi de Z = X − Y . On donnera d’abord un ensemble raisonnable de valeurs pouvant être prises par Z.Espérance ? Variance ?

La formule de transfertSi X est une v.a. à valeurs dans X := xk, k ∈ 1, . . . ,K et h : X → R est une fonction quelconque. La

variable Y = h(X) définie par∀ω ∈ Ω, Y (ω) = h(X(ω))

est une variable prenant les valeurs réelles h(x1), . . . , h(xK). On a la formule de transfert

E(h(X)) =K∑k=1

h(xk)P(X = xk)

Elle permet de calculer l’espérance d’une fonction réelle quelconque de X . La donnée de la formule de transfertgénérique, avec une fonction h quelconque, est équivalente à la donnée de la distribution de X .

Démonstration. (HP) LesK nombres h(x1), . . . , h(xK) n’ont aucune raison d’être distincts. Il forment un ensemblefini que nous notons y1, . . . , yL. Par convention, dans cette écriture les y` sont distincts. A chacun de ces y`correspond l’ensemble des xk tels que h(xk) = y`.

On a, par définition de l’espérance d’une v.a prenant un nombre fini de valeurs,

E(Y ) =

L∑`=1

y`.P(Y = y`)

Mais, pour chaque `, on a

P(Y = y`) =∑

k∈1,...,K,h(xk)=y`

P(X = xk) =K∑k=1

11h(xk)=y`P(X = xk)

Page 15: Notes de cours 02 - Freejcleger.math.free.fr/maths/2017/docs/2017-ndc-02... · 2018-08-29 · 3 Là, c’est de la physique! Balistique Pour le problème de la sagaie, les variables

15

On a donc

E(h(X)) =

L∑`=1

K∑k=1

y`.11h(xk)=y`P(X = xk)

=K∑k=1

L∑`=1

11h(xk)=y`h(xk)P(X = xk)

=K∑k=1

(L∑`=1

11h(xk)=y`

)︸ ︷︷ ︸

=1

h(xk)P(X = xk)

=

K∑k=1

h(xk)P(X = xk)

Ce qui est la formule de transfert annoncée.Un complément. La formule de transfert est à la base d’une démonstration de l’additivité de l’espérance de v.a.r

réelles, via la formation d’un couple de v.a. Supposons que X soit à valeurs dans X = xk, k ∈ 1, . . . ,K ⊂ R,que Y soit à valeurs dans Y = y`, ` ∈ 1, . . . , L ⊂ R, et posons Z = (X,Y ) et h : R2 → R la fonction« somme » définie par

∀(x, y) ∈ R2, h(x, y) = x+ y

La v.a. Z est à valeurs dans Z = X × Y = (xk, y`), k ∈ 1, . . . ,K , ` ∈ 1, . . . , L ⊂ R2, ensemblecomportant K.L éléments et on a, en démarrant par la formule de transfert pour Z et en utilisant ensuite les règlesusuelles sur les sommes (doubles),

E(X + Y ) = E(h(Z)) =∑z∈Z

h(z)P(Z = z)

=∑k,l

h(xk, y`)P((X,Y ) = (xk, y`)) =∑k,l

(xk + y`)P(X = xk et Y = y`)

=∑k,l

xkP(X = xk et Y = y`) +∑k,l

y`P(X = xk et Y = y`)

=∑k

xk

(∑`

P(X = xk et Y = y`)

)︸ ︷︷ ︸

P(X=xk)

+∑`

y`

(∑k

P(X = xk et Y = y`)

)︸ ︷︷ ︸

P(Y=y`)

= E(X) + E(Y )

Exercice 6.—1. Soit X une v.a. réelle ne prenant qu’un nombre fini de valeurs distinctes x1, . . . , xK. Montrer que pour toutx ∈ R,

FX(x) = P(X ≤ x) =

K∑k=1

11xk≤x)P(X = xk) =∑

k:xk≤xP(X = xk)

Page 16: Notes de cours 02 - Freejcleger.math.free.fr/maths/2017/docs/2017-ndc-02... · 2018-08-29 · 3 Là, c’est de la physique! Balistique Pour le problème de la sagaie, les variables

16

2. Montrer que si de plus, les valeurs prises par X sont positives, on a

E(X) =

∫ +∞

0P(X > x) dx =

∫ +∞

0(1− FX(x)) dx

Variance et covariance

1. Si X est une v.a.r prenant un nombre fini de valeurs, sa variance V(X) est, par définition,

V(X) = E((X − E(X))2)

2. Si X,Y sont deux v.a.r prenant un nombre fini de valeurs, leur covariance Cov(X,Y ) est, par définition,

Cov(X,Y ) = E((X − E(X)).(Y − E(Y )))

En développant et en utilisant la linéarité de l’espérance, on obtient, les formules de KOENIG–HUYGUENS

1.V(X) = E(X2)− E(X)2

2.Cov(X,Y ) = E(X.Y )− E(X).E(Y )

La formule de transfert donne alors, en supposant X à valeurs dans xk, k ∈ 1, . . . ,K ⊂ R, Y à valeurs dansy`, ` ∈ 1, . . . , L ⊂ R, en posant

mx = E(X) =K∑k=1

xkP(X = xk), my = E(X) =L∑`=1

y`P(X = y`),

V(X) =K∑k=1

(xk −mx)2P(X = xk) =K∑k=1

x2kP(X = xk)−m2

x

Cov(X,Y ) =K∑k=1

L∑`=1

(xk −mx)(y` −my)P(X = xk, Y = y`) =K∑k=1

L∑`=1

xk.y`P(X = xk, Y = y`)−mx.my

Pour cela, on note que Z = (X,Y ) est une v.a. prenant un nombre fini de valeurs dans R2. On a appliqué laformule de transfert avec h(Z) = h(X,Y ) = (X −mx).(Y −my). Et, pour la toute dernière formule, appliqué laformule de transfert avec h(Z) = h(X,Y ) = X.Y .

Exercice 7.—1. Retrouver la formule (n+1)2−1

12 donnant la variance d’une variable uniforme sur 0, . . . , n. Donner la varianced’une v.a. uniforme sur 1, . . . , n.

Indication:On rappelle que

n∑k=1

k =n.(n+ 1)

2et

n∑k=1

k2 =n.(n+ 1).(2n+ 1)

6

2. Donner la variance d’une v.a. uniforme sur l’ensemble des entiers naturels pairs inférieurs à 500, d’une v.a. uni-forme sur l’ensemble des entiers naturels impairs inférieurs à 501.

Exercice 8.— Si X est une v.a.r prenant un nombre fini de valeurs entières, on définit, pour t ∈ R,

f(t) = E(tX)

Page 17: Notes de cours 02 - Freejcleger.math.free.fr/maths/2017/docs/2017-ndc-02... · 2018-08-29 · 3 Là, c’est de la physique! Balistique Pour le problème de la sagaie, les variables

17

1. Déterminer f dans le cas où X suit

a. La loi uniforme sur 0, . . . , n.b. La loi binomiale B (n, p).

Vérifier que f est une fonction polynômiale. (Elle s’appelle la fonction génératrice de X).Indication:On pourra commencer par écrire la formule de transfert calculant E(h(X)) pour une fonction h adéquate.

2. Justifier que, en général, f est polynômiale, détermine entièrement la loi de X et que E(X) = f ′(1), E(X(X −1)) = f ′′(1).3. Retrouver par ce biais espérance et variance d’une loi binomiale.4. Retrouver par ce biais espérance et variance de la loi uniforme du a. Indication:On pourra écrire le DL2 en 1 de f5. Retrouver par ce moyen le fait que si X ∼ B (nx, p), Y ∼ B (ny, p), X et Y sont indépendantes alors

X + Y ∼ B (nx + ny, p) .

Probabilités conditionnellesEvaluer la probabilité conditionnelle d’un événement A relativement à un événement B, c’est évaluer la pro-

portion de configurations satisfaisant à la fois les événements A et B parmi celles satisfaisant l’événement B. Enformule, si P(B) > 0,

P(A|B)︸ ︷︷ ︸probabilité de A sachant B

:=P(A et B)

P(B)

Une remarque de notation 11 importante : «A sachant B » ou « (A|B) » n’est pas un événément. La notationP(A|B) ne signifie pas que l’on applique la probabilité P à A|B, qui n’a pas de sens !

D’un point de vue pratique, donner des probabilités conditionnelles est souvent une façon de spécifier la modé-lisation à un niveau fin.

Pour illustrer ceci, supposons que nous disposions d’une population de 36 individus, composée de 13 de garçons

et de 23 de filles. Parmi les garçons, 33% portent des lunettes alors que c’est le cas pour seulement 25% des filles.

Une question simple est la proportion d’individus portant des lunettes.On peut régler cette question de deux façons.La première, naïve, consiste à dénombrer les individus :Il y a 12 garçons dont 4 portent des lunettes, il y a 24 filles dont 6 portent des lunettes. Il y a donc, sur les 36

individus, 10 individus porteurs de lunettes, ce qui fait une proportion de 1036 = 27, 8% de porteurs de lunettes dans

cette population.On peut faire ce raisonnement sans connaitre le nombre d’individus. Si N est le nombre total d’individus,Il y a 1

3 .N garçons et 13 .

13 .N garçons porteurs de lunettes, il y a 2

3 .N filles et 14 .

23 .N filles porteuses de lunettes,

ce qui fait un total de (19 + 1

6).N = 518 .N de porteurs de lunettes et donc une proportion de 27, 8% de la population.

La seconde (en apparence plus savante, mais on fait la même chose ! !). On considère l’expérience aléatoire detirer au sort (uniformément) un individu I et on considère les événements

A =« I porte des lunettes », B =« I est une fille » et C =« I est un garçon ».La question est la valeur de P(A).L’utilisation d’une phrase entre « » pour désigner un événement peut mener à des ambiguités et est une mauvaise

pratique. D’un point de vue de la méthode, il est préférable d’introduire immédiatement des variables aléatoires, p.ex.des indicatrices, permettant l’écriture usuelle de ces événements. Soit S et M définies par

S =

0 si I est un garçon1 si I est une fille

et M =

0 si I sans lunettes1 si I à lunettes

11. On trouve aussi la nottion PB(A)

Page 18: Notes de cours 02 - Freejcleger.math.free.fr/maths/2017/docs/2017-ndc-02... · 2018-08-29 · 3 Là, c’est de la physique! Balistique Pour le problème de la sagaie, les variables

18

On a alorsA = M = 1, B = S = 1 et C = S = 0

et les données du problème, s’expriment par les faits suivants

P(B) =2

3, P(C) =

1

3, P(A|B) =

1

4et P(A|C) =

1

3

On a doncP(A et B) = P(A|B).P(B) =

1

4.2

3, P(A et C) = P(A|C).P(C) =

1

3.1

3

et, sachant que A = (A et B) ou (A et C), avec une alternative exclusive, on a

P(A) = P(A et B) + P(A et C) =5

18

Ces méthodes donnent évidemment le même résultat, la première a l’avantage de la naïveté et de la simplicitéconceptuelle, la seconde ouvre la porte à une possibilité de généralisation dans le cas d’une population infinie. Notonsqu’on a montré au passage la formule des probabilités totales : Si B1, . . . BN est un système complet d’événementsincompatibles (de probabilité > 0), on a, pour tout évenement A,

P(A) =N∑n=1

P(A|Bn).P(Bn)

Espérance conditionnelleB étant un événement de probabilité > 0, l’application P(.|B) : A 7→ P(A|B) est une probabilité sur l’ensemble

des événements. Si X est une variable aléatoire réelle, on peut tenter de calculer son espérance relativement à cetteprobabilité. Il s’agit de l’espérance conditionnelle de X conditionnée à B 12. Elle est notée E(X|B). Si X prend unnombre fini de valeurs x1, . . . , xK ⊂ R, on a, par transcription de la formule usuelle d’espérance, la formule

E(X|B) =

K∑k=1

xK .P(X = xk|B)

Exercice 9.— Montrer que, siB1, . . . BN est un système complet d’événements incompatibles (de probabilité> 0),on a,

E(X) =

N∑n=1

E(X|Bn).P(Bn)

Indépendance d’événementsSi un événement B est de probabilité > 0 et A est un événement, on traduit l’indépendance de A relativement à

B par le fait queP(A) = P(A|B)

Si on lit cette formule à haute voix, on se rend compte qu’elle signifie que la proportion de configurations vérifiantA parmi celles vérifiant B est la proportion de configurations vérifiant A parmi toutes les configurations. C’est bienl’idée que l’on se fait de l’indépendance statistique.

On peut réécrire cette relation de façon à traiter le cas P(B) = 0. Ceci symétrise la relation d’indépendance.

12. cette notion n’est pas formellement au programme, on voit cependant qu’elle n’en est pas disjointe...

Page 19: Notes de cours 02 - Freejcleger.math.free.fr/maths/2017/docs/2017-ndc-02... · 2018-08-29 · 3 Là, c’est de la physique! Balistique Pour le problème de la sagaie, les variables

19

Définition 3. Deux événements A et B sont indépendants si

P(A et B) = P(A).P(B)

D’un point de vue pratique, l’indépendance de deux événements (ou de variables aléatoires) est souvent unespécification du modèle, un choix, donc, du modélisateur.

Indépendance de variables aléatoires

Définition 4. Soient X et Y deux variables aléatoires réelles.— X et Y sont dites indépendantes si pour tous intervalles I et J , les événements X ∈ I et Y ∈ J sont

indépendants i.e.P(X ∈ I et Y ∈ J) = P(X ∈ I).P(Y ∈ J)

— X et Y sont indépendantes ssi pour toutes fonctions f, g : R→ R,

E(f(X).g(Y )) = E(f(X)).E(g(Y ))

Rq : On a une définition similaire pour définir l’indépendance mutuelle d’une famille de n variables aléatoires :X1, . . . , Xn sont mutuellement indépendantes ssi pour toutes fonctions f1 . . . , fn : R→ R,

E(f1(X1). . . . .fn(Xn)) = E(f1(X1)). . . . .E(fn(Xn))

Exercice 10.— On dispose de 3 urnes U1, U2 et U3 comportant chacune n boules numérotées de 1 à n. On tire uneboule dans chaque urne et on note Xi le numéro tiré dans Ui.1. Donner la loi de X1 +X2.2. Quelle est la probabilité pour que le numéro d’une boule tirée soit la somme des deux autres.

1.4 Des exemples fondamentaux de modèles

Deux dés indépendantsOn considère deux dés à 6 faces, équilibrés. Une partie, c’est deux joueurs Pierre et Iris, et un tirage de ces deux

dés.— Si la somme des deux dés est un nombre pair, Pierre reçoit d’Iris un montant de αp × somme,— Si la somme des deux dés est un nombre impair, Iris reçoit de Pierre un montant de αi× somme. La question

est :comment choisir αp et αi de sorte que le jeu soit équitable.Il faut définir les variables aléatoires fondamentales du modèle, traduire les hypothèses, donner une version mathé-matique de la question finale et enfin, faire les calculs. On peut poser comme variables fondamentales X1 et X2, leschiffres tirés respectivement par le premier dé et le second.

L’hypothèse sur les dés indique que on peut supposer X1, X2 indépendantes et uniformément distribuées sur1, . . . , 6.

La somme est S = X1 +X2.La variable qui nous intéresse est Gi, le gain d’Iris. (Noter que Gi = −Gp où Gp est le gain de Pierre).On a Gi = αi.S.11S impair − αp.S.11S pair.Finalement, on dira que le jeu est équitable si E(Gi) = 0.Il s’agit de calculer E(Gi) en fonction de αi et αp pour trouver la condition cherchée de jeu équitable. On a, par

linéarité de l’espérance,E(Gi) = αi.E(S.11S impair)− αp.E(S.11S pair)

Il suffit de calculer E(S.11S impair) et E(S.11S pair). On a

E(S.11S impair) + E(S.11S pair) = E(S) = E(X1) + E(X2) = 7

Page 20: Notes de cours 02 - Freejcleger.math.free.fr/maths/2017/docs/2017-ndc-02... · 2018-08-29 · 3 Là, c’est de la physique! Balistique Pour le problème de la sagaie, les variables

20

Il suffit de calculer E(S.11S pair). Calculons ce qu’il faut de la loi de Y = S.11S pair pour évaluer E(Y ). C’est unevariable à valeurs dans 0, 2, 4, 6, 8, 10, 12.

De la formule de l’espérance, il est a priori inutile de calculer P(Y = 0).On calcule par disjonction de cas puis indépendance.

(Y = 2) = (X1 = 1 et X2 = 1)

et, par indépendance

P(Y = 2) = P(X1 = 1).P(X2 = 1) =1

36

(Y = 4) = (X1 = 1 et X2 = 3) ou (X1 = 2 et X2 = 2) ou (X1 = 3 et X2 = 1)

par incompatibilité

P(Y = 4) = P(X1 = 1 et X2 = 3) + P(X1 = 2 et X2 = 2) + P(X1 = 3 et X2 = 1)

et, par indépendance,

P(Y = 4) = P(X1 = 1).P(X2 = 3) + P(X1 = 2).P(X2 = 2) + P(X1 = 3).P(X2 = 1)

=3

36=

1

12

(Y = 6) = (X1 = 1 et X2 = 5) ou (X1 = 2 et X2 = 4) ou (X1 = 3 et X2 = 3) ou . . .

par incompatibilité,

P(Y = 6) = P(X1 = 1 et X2 = 5) + P(X1 = 2 et X2 = 4) + P(X1 = 3 et X2 = 3) + . . .

et, par indépendance,

P(Y = 6) = P(X1 = 1).P(X2 = 5) + P(X1 = 2).P(X2 = 4) + P(X1 = 3).P(X2 = 3) + · · · = 5

36

De même,

P(Y = 8) =5

36, P(Y = 10) =

3

36et P(Y = 12) =

1

36

et, par la formule de l’espérance,

E(Y ) =1

36(2 + 4× 3 + 6× 5 + 8× 5 + 10× 3 + 12) =

126

36=

7

2

Pour finir, on a

E(S.11S impair) = 7− E(S.11S pair) =7

2

d’oùE(Gi) =

7

2(αi − αp)

et donc, le jeu est équitable si et seulement si αi = αp.

Page 21: Notes de cours 02 - Freejcleger.math.free.fr/maths/2017/docs/2017-ndc-02... · 2018-08-29 · 3 Là, c’est de la physique! Balistique Pour le problème de la sagaie, les variables

21

Remarquons qu’on pouvait faire une variante du calcul de E(Y ) en utilisant directement la formule de transfertsur la variable couplée (X1, X2) à valeurs dans 1, . . . , 6 × 1, . . . , 6, sachant que pour ces couples, par indépen-dance, P((X1, X2) = (x1, x2)) = 1

36 .

E(S.11S pair) =6∑

x1=1

6∑x2=1

(x1 + x2).11x1+x2 pair.P((X1, X2) = (x1, x2))

=∑

x1,x2 même parité

(x1 + x2).P((X1, X2) = (x1, x2))

=∑

x1,x2 pairs

....+∑

x1,x2 impairs

...

=1

36

3∑p1=1

3∑p2=1

(2p1 + 2p2) +1

36

2∑p1=0

2∑p2=0

(2p1 + 1 + 2p2 + 1)

(symétrie) =4

36

3∑p1=1

3∑p2=1

p1 +2

36

2∑p1=0

3∑p2=1

(2p1 + 1)

=4× 3

36

3∑p1=1

p1 +2× 3

36

2∑p1=0

(2p1 + 1)

=4× 3× 6

36+

2× 3× 9

36=

7

2

Tirer des boules avec remiseLe passionnant phénomène en considération est le suivant : on dispose d’un sac contenant N fruits (prunes et

quetsches), indiscernables au toucher, dont une proportion p de prunes et une proportion q de quetsches. On a

p+ q = 1

L’opération élémentaire effectuée est la suivante : on prend un fruit dans le sac, on note son type et on le remet dansle sac.

L’opération complète est la suivante : on effectue n opérations élémentaires successives.On compte au final le nombre S de prunes. La question est donner la distribution de S.

La méthode combinatoireLa méthode combinatoire consiste à considérer les configurations possibles, à évaluer leur probabilité d’appari-

tion et à les dénombrer.Une configuration pour cette expérience est une suite de n lettres, P ou Q, correspondant au codage d’un tirage.

Par exemple PPQQ....PQ code le fait que les deux premiers tirages ont été des prunes, les deux suivants desquetsches, l’avant dernier une prune et le dernier une quetsche.

Une telle configuration à une probabilité pnbre de P .qnbre de Q d’apparition. Il y a 2n telles configurations. Trouverla loi de S, qui prend clairement ses valeurs dans l’ensemble 0, . . . , n, consiste, pour chaque s ∈ 0, . . . , n,à trouver et dénombrer les configurations comportant exactement s fois la lettre P . Il y a exactement

(ns

)telles

configurations, toutes ayant même probabilité d’apparition psqn−s et donc

∀s ∈ 0, . . . , n , P(S = s) =

(n

s

)psqn−s

On dit que S suit la loi binomiale B (n, p).

Page 22: Notes de cours 02 - Freejcleger.math.free.fr/maths/2017/docs/2017-ndc-02... · 2018-08-29 · 3 Là, c’est de la physique! Balistique Pour le problème de la sagaie, les variables

22

La modélisation élémentaireOn va maintenant modéliser cette expérience de façon naturelle, en tirant effectivement les fruits les uns après les

autres. La question est : est-ce que cette façon de calculer donne les mêmes résultats que la méthode combinatoireclassique ?

Les variables du modèle que l’on construit sont (assez naturellement),

1. X1, X2,....Xn, Xk désignant le résultat du k-ième tirage. On convient que Xk = 1 si on y a tiré une prune etXk = 0 sinon.

2. X1, X2,....Xn sont indépendantes. (remise)

3. S = X1 + · · ·+Xn, grâce à la convention précédente.

4. La distribution de chaque Xi est connue. Xi suit une loi de BERNOULLI de paramètre de succès p

Modèle binomial : méthode 1Notons, pour k ∈ 1, . . . , n, Sk = X1 + · · · + Xk. On a, pour 1 ≤ k ≤ n − 1, Sk+1 = Sk + Xk+1 etSk et

Xk+1 sont indépendantes. Sk+1 prend clairement ses valeurs dans 0, . . . , k + 1. Pour s ∈ 0, . . . , k + 1, on a,« en décomposant cet événement suivant les valeurs de Xk+1 »,

P(Sk+1 = s) = P(Sk = s et Xk+1 = 0) + P(Sk = s− 1 et Xk+1 = 1)

= P(Sk = s)P(Xk+1 = 0)

+P(Sk = s− 1)P(Xk+1 = 1) par indep.

= P(Sk = s).q + P(Sk = s− 1).p

Par récurrence, à l’aide de la formule du triangle de PASCAL, on montre que, pour tout 0 ≤ s ≤ k, P(Sk = s) =(ks

)ps.qk−s

Démonstration. Pour s = 0, on a clairement par récurrence que P(Sk = 0) = qk. De même, on a clairement parrécurrence que P(Sk = k) = pk.

(Le terme en facteur de p est nul). On a obtenu une formule de récurrence permettant de calculer la loi de Sk+1

en fonction de celle de Sk, formule qui présente des airs de parenté avec la formule du triangle de PASCAL. Montronsla formule cherchée par récurrence (finie) : pour k ∈ 1, . . . , n, posons l’hypothèse de récurrence

Pk : ∀s ∈ 0, . . . , k , P(Sk = s) =

(k

s

)ps.qk−s

1. P1 est vraie car S1 = X1

2. Si Pk est vraie pour un certain entier k, 1 ≤ k ≤ n− 1, on a, pour s ∈ 0, . . . , k + 1,— soit s = 0, auquel cas, P(Sk+1 = 0) = qk+1 =

(k+1

0

)p0.qk+1−0,

— soit s = k + 1, auquel cas, P(Sk+1 = k + 1) = pk+1 =(k+1

0

)pk+1.qk+1−(k+1),

— soit s ∈ 1, . . . , k, auquel cas,

P(Sk+1 = s) = P(Sk = s).q + P(Sk = s− 1).p

=

(k

s

)ps.qk−s+1 +

(k

s− 1

)ps.qk−(s−1)( par Pk car 0 ≤ s, s− 1 ≤ k)

= (

(k

s

)+

(k

s− 1

))ps.qk−(s−1)

=

(k + 1

s

)ps.qk+1−s( PASCAL)

Pk+1 est donc vraie et le principe de récurrence affirme que Pk est vraie pour tout entier k.

Page 23: Notes de cours 02 - Freejcleger.math.free.fr/maths/2017/docs/2017-ndc-02... · 2018-08-29 · 3 Là, c’est de la physique! Balistique Pour le problème de la sagaie, les variables

23

Modèle binomial : méthode 2La méthode que l’on présente maintenant est basée sur le principe du polynôme générateur d’une variable aléa-

toire N prenant un nombre fini de valeurs entières positives. Ce polynôme caractérise complètement la loi de lavariable N .

On définit donc, pour x ∈ R,

πN (x) := E(xN ) =

∗∑n=0

P(N = n)xn

Connaissant le polynôme, on retrouve ses coefficients qui donnent la loi de N et réciproquement, connaissant la loide N , on peut construire le polynôme.

Si X ∼ B(p), on a, pour t ∈ R,

πX(t) = E(tX) = q + p.t = 1− p+ p.t

Pour S = X1 + · · ·+Xn, on a, pour t ∈ R,

πS(t) = E(tS) = E(tX1 ...tXn)

= E(tX1)...E(tXn)( indépendance )

= (q + p.t)n

=n∑s=0

(n

s

)qn−sps.ts( NEWTON)

On a donc que pour tout s ∈ 0, . . . , n, P(S = s) =(ns

)qn−sps et S ∼ B (n, p).

Simulation informatique

1 0 1 2 3 4 5 60.00

0.05

0.10

0.15

0.20

0.25

0.30

0.35

FIGURE 9: Simulation d’une expérience de BERNOULLI, n = 5, p = 0.5. simulation sur N = 1000 expériences

Utiliser le script simulation-binomiale.py

Tirer des boules sans remiseLe passionnant phénomène, variante du précédent, en considération est le suivant : on dispose d’un sac contenant

N ≥ 2 fruits (prunes et quetsches), indiscernables au toucher, dont une quantité p.N de prunes et une quantité q.Nde quetsches. On a

p+ q = 1

Page 24: Notes de cours 02 - Freejcleger.math.free.fr/maths/2017/docs/2017-ndc-02... · 2018-08-29 · 3 Là, c’est de la physique! Balistique Pour le problème de la sagaie, les variables

24

L’opération élémentaire effectuée est la suivante : on prend un fruit dans le sac, on note son type et on ne le remetpas dans le sac.

L’opération complète est la suivante : on effectue n ≤ N opérations élémentaires successives.On compte au final le nombre Sn de prunes. La question est donner la distribution de Sn.Il s’agit de la loi hypergéométrique H (n, p,N). Vous devez savoir exprimer la loi d’une telle variable aléatoire

et connaitre son espérance 13

E(Sn) = n.p

La méthode combinatoireLa méthode combinatoire consiste à considérer les configurations possibles, à évaluer leur probabilité d’appari-

tion et à les dénombrer.Pour décrire cette expérience, on numérote les objets en plaçant les P en premier et on met un x sous ceux qui

ont été tirés, un o sous les autres. Par exemple pour p.N = 3, q.N = 2, N = 5, n = 3

P1 P2 P3 Q4 Q5o x x o x

signifie que l’on a tiré les prunes 2 et 3 et la quetsche 5. Le nombre de prunes tirées est S = 2. Une configurationpour cette expérience est une suite de N lettres, x ou o comportant n x, correspondant au codage d’un tirage.

Il est clair que S peut prendre toutes les valeurs s entre max(0, n− q.N) et min(n, p.N)Le nombre total de configurations est

(Nn

)et l’on voit que le nombre de configurations comportant s prunes et

n− s quetsches est(p.Ns

).(q.Nn−s).

On a donc P(S = s) =(p.Ns ).(q.Nn−s)

(Nn).

Personnellement, je trouve cette combinatoire un peu douteuse : comment être certain que la succession de tiragesest exactement équivalente à un tirage (uniforme) d’une configuration de x et de o ?

Modèle hypergéométriqueOn modélise cette expérience de la même façon naturelle que pour le modèle avec remise. On verra que de la

sorte on retrouve le résultat combinatoire.–Les variables du modèle que l’on construit sont (assez naturellement),

1. X1, X2,....Xn, On convient que Xk = 1 si on y a tiré une prune au k-ième tirage et Xk = 0 sinon.

2. Sk = X1 + · · ·+Xk, le nombre total de prunes obtenues au k-ième tirage. On a Sk+1 = Sk +Xk+1.

–La distribution 14 de chaque Xk : X1 ∼ B(p) et, si s ∈ 0, . . . , p.N, k ∈ 1, . . . , n− 1,

P(Xk+1 = 1|Sk = s) =p.N − sN − k

,

P(Xk+1 = 0|Sk = s) = 1− p.N − sN − k

=q.N + s− kN − k

–De ceci, on déduit par récurrence sur 1 ≤ k ≤ N que

Qk : Sk suit la loiH (k, p,N)

est vraie pour tout k, 1 ≤ k ≤ N .

13. La formule de la variance est HPV(Sn) =

N − n

N − 1.n.p.(1− p)

14. sauf pour le premier, elle n’est connue que conditionnellement

Page 25: Notes de cours 02 - Freejcleger.math.free.fr/maths/2017/docs/2017-ndc-02... · 2018-08-29 · 3 Là, c’est de la physique! Balistique Pour le problème de la sagaie, les variables

25

Démonstration. 1. Si k = 1, S1 = X1,

P (S1 = 1) = p =

(p.N

1

)(q.N1−1

)(N1

)P (S1 = 0) = q =

(p.N

0

)(q.N1−0

)(N1

)2. SupposonsQk vraie au rang k ≤ N−1 et déduisons enQk+1. Soit s ∈ max(0, k + 1− q.N), . . . ,min(k + 1, p.N).

— Si s, s − 1 ∈ max(0, k − q.N), . . . ,min(k, p.N), on a, par la formule des probabilités totales & loiconditionnelle puis par Qk,

P(Sk+1 = s) = P(Sk = s et Xk+1 = 0) + P(Sk = s− 1 et Xk+1 = 1)

= P(Xk+1 = 0|Sk = s)P(Sk = s) + P(Xk+1 = 1|Sk = s− 1)P(Sk = s− 1)

=q.N − (k − s)

N − kP(Sk = s) +

p.N − (s− 1)

N − kP(Sk = s− 1)

=1

(N − k).(Nk

)(q.N − (k − s))

(q.N

k − s

)︸ ︷︷ ︸

(k+1−s)( q.Nk+1−s)

(p.N

s

)+ (p.N − (s− 1))

(p.N

s− 1

)︸ ︷︷ ︸

s.(p.Ns )

.

(q.N

k − (s− 1)

)=

k + 1

(N − k).(Nk

)( q.N

k + 1− s

)(p.N

s

)=

(q.N

k+1−s)(p.Ns

)(Nk+1

)— On traite de manière similaire les cas extrêmes où s ou s−1 6∈ max(0, k − q.N), . . . ,min(k, p.N) pour

obtenir que Qk+1 est vraie.

3. Par récurrence, Qk est vraie pour tout k, 0 ≤ k ≤ N .

Simulation informatique

0 5 10 15 200.00

0.05

0.10

0.15

0.20

FIGURE 10: Simulation de tirages sans remiseN = 100, n = 50, p.N = 20, simulation surNS = 1000 expériences

Utiliser le script simulation-sansremise.py

Page 26: Notes de cours 02 - Freejcleger.math.free.fr/maths/2017/docs/2017-ndc-02... · 2018-08-29 · 3 Là, c’est de la physique! Balistique Pour le problème de la sagaie, les variables

26

Exercice 11.— Le but est de démontrer les formules annoncées d’espérance et de variance pour la loi hypergéomé-trique. On conserve les notations du cours et notamment le fait que Xk est l’indicatrice d’un tirage de prune à l’étapek(≤ N) et que

Sk = X1 + · · ·+Xk

indique le nombre de prunes obtenues à l’étape k. On rappelle que chaque Sk est à valeurs dans S = 0, . . . , p.Net que pour un tel s, pour 1 ≤ k ≤ N − 1

P(Xk+1 = 1|Sk = s) =p.N − sN − k

1. On cherche à montrer que pour k ≤ N , Xk est une variable de BERNOULLI de paramètre p et, conjointement, queE(Sk) = k.p.1.a. Montrer, en conditionnant sur les valeurs de Sk, que pour 1 ≤ k ≤ N − 1,

P(Xk+1 = 1) =∑s∈S

P(Xk+1 = 1|Sk = s)P(Sk = s) =p.N

N − k− 1

N − kE(Sk)

1.b. Conclure la récurrence.2. (Difficile) On veut, sur le même principe, montrer que pour 1 ≤ k ≤ N ,

V(Sk) =N − kN − 1

k.p(1− p)

2.a. Vérifier que pour 1 ≤ k ≤ N − 1,

Sk+1 = Sk +Xk+1 et V(Sk+1) = V(Sk) + V(Xk+1) + 2Cov(Sk, Xk+1)

2.b. Montrer, en conditionnant sur les valeurs de Sk et en utilisant la formule de l’espérance conditionnelle,

E(Sk.Xk+1) =∑s∈S

E(Sk.Xk+1|Sk = s)P(Sk = s) =p.N

N − kE(Sk)−

1

N − kE(S2

k)

puis que

Cov(Sk, Xk+1) = − 1

N − kV(Sk)

2.c. Conclure en rédigeant la récurrence.

Chaînes de MARKOV

Il s’agit d’une méthode de modélisation pour des phénomènes évoluant stochastiquement dans le temps. Onconsidère le temps discret. Chaque étape dans l’évolution se déduit de la précédente en faisant intervenir le hasard.

Le système que l’on considère peut être dans un certain nombre (fini) d’états. Par exemple, supposons que (pourune raison que j’ignore) un champignon puisse prendre trois couleurs : Rouge (R), Vert(V) ou Bleu(B).

On constate que ce champignon, s’il est d’un certaine couleur à un instant donné, il passe à une autre couleur, autop chrono suivant, avec certaines probabilités

Pour fixer les idées

1. S’il est R, il devient R avec probabilité 0.5, V avec proba 0.3 et B avec proba 0.2,

2. S’il est V, il devient R avec probabilité 0.2, V avec proba 0.4 et B avec proba 0.4,

3. S’il est B, il devient R avec probabilité 0.3, V avec proba 0.3 et B avec proba 0.4,

La question que l’on se pose est sachant qu’au départ n = 0 le champignon est R, quelle est la proba qu’à l’instantn = N(= 10), il soit B ?

Page 27: Notes de cours 02 - Freejcleger.math.free.fr/maths/2017/docs/2017-ndc-02... · 2018-08-29 · 3 Là, c’est de la physique! Balistique Pour le problème de la sagaie, les variables

27

ModélisationSi on suit notre méthode de modélisation, on voit que les variables qui importent sont X0, X1, . . . , Xn, . . . , XN ,

Xn donnant la couleur du champignon à l’instant n. On sait que X0 = R et ce qu’on cherche c’est

P(XN = R), P(XN = V ) et P(XN = B)

Ce que donne l’énoncé, c’est la loi conditionnelle de Xn+1 sachant Xn. On a

1. S’il est R, P(Xn+1 = R|Xn = R) = 0.5, P(Xn+1 = V |Xn = R) = 0.3 et P(Xn+1 = B|Xn = R) = 0.2,

2. S’il est V, P(Xn+1 = R|Xn = V ) = 0.2, P(Xn+1 = V |Xn = V ) = 0.4 et P(Xn+1 = B|Xn = V ) = 0.4,

3. S’il est B, P(Xn+1 = R|Xn = B) = 0.3, P(Xn+1 = V |Xn = B) = 0.3 et P(Xn+1 = B|Xn = B) = 0.4,

Pour calculer la loi de Xn+1, appliquons la formule des probabilités totales, les définitions des probabilitésconditionnelles en « décomposant les événements suivant les valeurs de Xn »,

P(Xn+1 = R) = P(Xn+1 = R|Xn = R)P(Xn = R)

+P(Xn+1 = R|Xn = V )P(Xn = V )

+P(Xn+1 = R|Xn = B)P(Xn = B)

P(Xn+1 = V ) = P(Xn+1 = V |Xn = R)P(Xn = R)

+P(Xn+1 = V |Xn = V )P(Xn = V )

+P(Xn+1 = V |Xn = B)P(Xn = B)

P(Xn+1 = B) = P(Xn+1 = B|Xn = R)P(Xn = R)

+P(Xn+1 = B|Xn = V )P(Xn = V )

+P(Xn+1 = B|Xn = B)P(Xn = B)

P(Xn+1 = R) = 0.5P(Xn = R) + 0.2P(Xn = V ) + 0.3P(Xn = B)

P(Xn+1 = V ) = 0.3P(Xn = R) + 0.4P(Xn = V ) + 0.3P(Xn = B)

P(Xn+1 = B) = 0.2P(Xn = R) + 0.4P(Xn = V ) + 0.4P(Xn = B)

Ce qui n’est pas sans rappeler le calcul matriciel.

Représentation graphique de chaine

Page 28: Notes de cours 02 - Freejcleger.math.free.fr/maths/2017/docs/2017-ndc-02... · 2018-08-29 · 3 Là, c’est de la physique! Balistique Pour le problème de la sagaie, les variables

28

R B

V

0.5

0.3

0.2

0.2

0.4

0.40.3

0.3

0.4

FIGURE 11: Représentation graphique de l’exemple : on place les états et, sur des flèches, les probabilités de transitiond’un état à l’autre

. ...

.. A

P(Xn+1 =

A|X

n

=.)

P(Xn+1 = A|Xn = A)

P(Xn+1 = A|Xn = ..)

. . .

FIGURE 12: Un noeud, probabilités de l’atteindre, la ligne A de la matrice de transition

. ...

.. A

P(Xn+1 =

.|Xn

=A)

P(Xn+1 = A|Xn = A)

P(Xn+1 = ..|Xn = A)

. . .

FIGURE 13: Un noeud, probabilités des destinations, la colonne A de la matrice de transition, leur somme vaut 1

Page 29: Notes de cours 02 - Freejcleger.math.free.fr/maths/2017/docs/2017-ndc-02... · 2018-08-29 · 3 Là, c’est de la physique! Balistique Pour le problème de la sagaie, les variables

29

Calcul matriciel et matrice de transitionPosons

A =

0.5 0.2 0.30.3 0.4 0.30.2 0.4 0.4

, Pn =

P(Xn = R)P(Xn = V )P(Xn = B)

La relation précédente se traduit par

∀n ∈ 0, . . . , N − 1 , Pn+1 = A.Pn

La récurrence des suites géométriques donne que PN = AN .P0 où le vecteur P0 traduit la position initiale.

Simulation informatique

0 1 2

0.0

0.2

0.4

0.6

0.8

1.0

FIGURE 14: Simulation d’une chaîne de MARKOV, N = 10, A et P0 donné dans le texte. Simulation sur NS = 100

expériences. =théorique, ×=simulé

Avec

A′ =

0.5 0.2 0.30.1 0.4 0.30.4 0.4 0.4

Utiliser le script simulation-markov.py

Exercice 12.—On jette n fois une pièce, pile sortant avec probabilité p à chaque tirage. Soit Pn la probabilité pour que le nombre

de piles soit pair dans n jets (comptant 0 comme nombre pair). Montrer que

Pn = (q − p)Pn−1 + p

où q = 1− p.En déduire que Pn = 1

2(1 + (q − p)n) pour n ≥ 0.

Page 30: Notes de cours 02 - Freejcleger.math.free.fr/maths/2017/docs/2017-ndc-02... · 2018-08-29 · 3 Là, c’est de la physique! Balistique Pour le problème de la sagaie, les variables

30

0 1 2

0.0

0.2

0.4

0.6

0.8

1.0

FIGURE 15: Simulation d’une chaîne de MARKOV, N = 10, A′, P0 donné dans le texte. Simulation sur NS = 1000

expériences. =théorique, ×=simulé

Exercice 13.— Le prof de maths, après avoir lu une série de statistiques effrayantes sur les risques de cancer,problèmes cardiovasculaires liés au tabac, décide d’arrêter de fumer ; toujours d’après des statistiques, on estime lesprobabilités suivantes :

1. si cette personne n’a pas fumé un jour Jn, alors la probabilité pour qu’elle ne fume pas le jour suivant Jn+1

est 0, 3 ;

2. si elle a fumé un jour Jn, alors la probabilité pour qu’elle ne fume pas le jour suivant Jn+1 est 0, 9 ;

Va-t-il finir par s’arrêter ?

Exercice 14.— On dispose d’une urne qui contient trois boules numérotées de 0 à 2.On s’intéresse à une suite d’épreuves définies de la manière suivante :— On choisit au hasard une boule dans cette urne.— Si j est le numéro de la boule tirée, on enlève de l’urne toutes les boules dont le numéro est strictement

supérieur à j. Pour le tirage suivant, l’urne ne contient plus que les boules numérotées de 0 à j.On considère alors la variable aléatoire réelle Xk égale au numéro de la boule obtenue à la keme épreuve (k ≥ 0)On note alors Uk la matrice unicolonne définie par :

Uk =

P [Xk = 0]P [Xk = 1]P [Xk = 2]

où P [Xk = j] est la probabilité de tirer la boule numéro j à la keme épreuve.

On convient de définir la matrice U0 par :

U0 =

001

1. Préliminaire algèbrique. Soient

A =

1 12

13

0 12

13

0 0 13

et P =

1 1 10 −1 −20 0 1

1.a. Calculer P 2 et déterminer l’inverse P−1 de la matrice P .

Page 31: Notes de cours 02 - Freejcleger.math.free.fr/maths/2017/docs/2017-ndc-02... · 2018-08-29 · 3 Là, c’est de la physique! Balistique Pour le problème de la sagaie, les variables

31

1.b. Montrer que A = P.D.P−1 où

D =

1 0 00 1

2 00 0 1

3

1.c. En déduire, pour k ∈ N∗, une formule explicite donnant Ak.2.2.a. Vérifier que U1 = A.U0.2.b. Déterminer la loi de X2. (On pourra montrer que U2 = A.U1.) Calculer l’espérance et la variance de X2

3. Par utilisation de la formule des probabilités totales, prouver que pour tout entier naturel k ≥ 1 :

Uk+1 = A.Uk

4. Écrire, pour un entier naturel k, Uk en fonction de A et U0

5. Pour tout k de N∗, donner la loi de Xk et vérifier que l’on a :

limk→+∞

P [Xk = 0] = 1, limk→+∞

P [Xk = 1] = 0, limk→+∞

P [Xk = 2] = 0

2 Modèles probabilistes généraux- la théorie

L’existantNous avons revu les concepts de base du calcul des probabilités de première année, qui concerne les calculs sur

des modèles « finis ».On a notamment revu la définition d’un espace probabilisé (Ω,P) où Ω est un ensemble fini, dont la famille des

parties P(Ω) est appelée la famille des événements et P : P(Ω) → [0, 1] ⊂ R est une application qui à chaqueévénement A associe sa probabilité P(A).

Le plus important pour la modélisation, c’est l’introduction et la manipulation des variables aléatoires. Le cadrede première année rattache la théorie des probabilités aux mathématiques « standard ». Il permet de ne traiter que lecas où un nombre fini de variables prenant un nombre fini de valeurs interviennent.

J’espère avoir démontré dans la partie précédente que l’on peut progressivement se désintéresser de l’hypothèsede finitude et mener beaucoup de calculs sans se préoccuper de la forme exacte de l’ensemble Ω.

2.1 L’axiomatique de KOLMOGOROV

DisclaimerOn donne maintenant les définitions générales d’espace probabilisé, de tribu (d’événements), de probabilité qui

vont permettre de traiter le cas de variables prenant possiblement une infinité de valeurs et le cas d’un nombre infinide variables.

C’est une théorie très abstraite, ces définitions sont au programme mais, comme on le verra assez rapidement,on va peu s’en préoccuper. Un modèle probabiliste est construit par la donnée des variables intéressantes, de leursdistributions et de leurs relations et permet de calculer probabilité d’événements, espérance de variable, etc...Il s’agitfondamentalement, pour faire des calculs fondés mathématiquement, de savoir qu’il existe au moins un ensemble Ω,une tribu d’événements T et une probabilité P sur cette tribu « supportant » le modèle, i.e. les variables aléatoiresvoulues. Les résultats attendus doivent être indépendants du choix de Ω, T , P.

Cette question d’existence est logiquement extrêmement délicate et en conséquence...

Pour chacun des modèles probabilistes que nous rencontrerons, nous admettrons qu’ilexiste un (Ω, T ,P) abstrait permettant de faire des calculs sensés.

Au niveau du théorème 14, nous donnons quelques explications autour de ce fait.

Page 32: Notes de cours 02 - Freejcleger.math.free.fr/maths/2017/docs/2017-ndc-02... · 2018-08-29 · 3 Là, c’est de la physique! Balistique Pour le problème de la sagaie, les variables

32

A savoir donc, mais sans en faire une fixation. LAPLACE, BERNOULLI,.. faisaient au XV IIIe et XIXe ducalcul des probabilités sans cet arsenal logique 15 qui date des années 1930.

Tribu d’événements

Définition 5. Soit Ω un ensemble non vide. T un sous-ensemble 16 de P(Ω). On dit que T est une tribu (d’événe-ments) si

1. ∅ ∈ T , Ω ∈ T , respectivement l’événement impossible et l’événement certain

2. T est stable par passage au complémentaire.

Si A ∈ T , alors A ∈ T

3. T est stable par ∪ dénombrable 17 : Si (An)n∈N est une famille d’éléments de T alors ∪n∈NAn ∈ T où

∪n∈NAn = ω ∈ Ω, ∃n ∈ N, ω ∈ An

T est stable par ∩ dénombrable 18 : Si (An)n∈N est une famille d’éléments de T alors ∩n∈NAn ∈ T où

∩n∈NAn = ω ∈ Ω, ∀n ∈ N, ω ∈ An

Avec le vocabulaire des événements, ces axiomes se lisent comme suit

1. Un élément ω ∈ Ω est appelé un élément de hasard (en anglais ’random element’). On trouve aussi la locution’configuration élémentaire’. J.P KAHANE a proposé de l’appeler un randon.

2. Un événement, c’est ce qui peut avoir lieu ou pas quand un ω est choisi. C’est un ensemble de randons qui ontune propriété logique commune. Il a lieu si le ω choisi fait partie de l’événement, il n’a pas lieu sinon.

3. L’événement impossible, c’est ce qui est toujours faux, n’a jamais lieu. L’événement certain c’est ce qui esttoujours vrai, a toujours lieu.

4. Si A est un événement, l’événement contraire A est aussi un événement.

5. Si A1, A2 sont deux événements, A1 ∪ A2 = (A1 ou A2) est un événement. C’est l’ensemble des randons ωfaisant partie de l’événement A1 ou de l’événement A2. C’est l’événement « alternative de A1 et A2 ».

6. Si A1, A2 sont deux événements, A1 ∩ A2 = (A1 et A2) est un événement. C’est l’ensemble des randons ωfaisant partie de l’événement A1 et de l’événement A2. C’est l’événement « conjonction de A1 et A2 ».

7. Les deux derniers axiomes montrent que l’on peut faire une conjonction ou une alternative d’une infinitédénombrable d’événements et obtenir encore un événement.

8. Un événement A implique un événement B si A ⊂ B. Cela signifie que si A a lieu lorsque ω est choisi, alorsB a lieu.

9. Deux événements A et B sont dits « équivalents » si A = B. Cela signifie que lorsque ω est choisi A a lieusi et seulement si B a lieu. Si leur conjonction est impossible, i.e. si A ∩ B = ∅. Cela signifie que si A a lieulorsque ω est choisi, alors B n’a pas lieu et réciproquement.

10. Deux événements sont dits « incompatibles »si leur conjonction est impossible, i.e. si A∩B = ∅. Cela signifieque si A a lieu lorsque ω est choisi, alors B n’a pas lieu et réciproquement.

15. Cet arsenal n’est pas inutile, il a permis de lever et/ou résoudre certains paradoxes que les pratiques antérieures ont pu mettre à jour16. Les éléments de T sont donc des parties de Ω.17. union dénombrable18. intersection dénombrable

Page 33: Notes de cours 02 - Freejcleger.math.free.fr/maths/2017/docs/2017-ndc-02... · 2018-08-29 · 3 Là, c’est de la physique! Balistique Pour le problème de la sagaie, les variables

33

Probabilité sur une tribu

Définition 6. Soit T une tribu sur un ensemble Ω. Une application P : T → [0, 1] ⊂ R est appelée une (mesure de)probabilité. Si

1. P(∅) = 0 et P(Ω) = 1.2. Si A1, . . . , An, . . . est une famille (au plus dénombrable) d’événements incompatibles alors

P(∪n∈NAn) = P(A1 ∪ · · · ∪An ∪ . . . )= P(A1) + · · ·+ P(An) + . . .

= limN→+∞

N∑n=1

P(An)

Si Ω est un ensemble quelconque, P(Ω) est une tribu.1. C’est celle que l’on considère le plus souvent lorsque Ω est fini. On peut alors définir une probabilité sur cette

tribu à l’aide d’un système de poids.2. Lorsque Ω est infini, il y a potentiellement une difficulté relevant de la logique pour définir une mesure de

probabilité intéressante sur P(Ω).En conséquences directes des axiomes

Proposition 7. 1. Si A ⊂ B alors P(A) ≤ P(B)

2. (Formule de POINCARÉ)P(A ∪B) = P(A) + P(B)− P(A ∩B)

En langage presque courant, on peut lire1. La probabilité d’un événement impossible est nulle. La probabilité d’un événement certain est 1.2. Si A1 et A2 sont incompatibles alors la probabilité de l’alternative de A1 et A2 est la somme des probabilités.3. Si un événement A implique un événement B, la probabilité de A est inférieure à celle de B.

Exemples graphiques : Carré (HP)Considérons le carré Ω = [0, 1[× [0, 1[ subdivisé en petits carrés Ci,j =

[i4 ,

i+14

[×[j4 ,

j+14

[, i, j ∈ 0, . . . , 3,

de côté 14 comme sur la figure 16

L’ensemble C = Ci,j , i, j ∈ 0, . . . , 3 est un ensemble de parties de Ω. Il comporte 16 éléments. Ce n’estpas une tribu de parties de Ω.

Par contre, l’ensemble T0 où chaque élément est une figure T formée d’une union finie de carrésCi,j est une tribude parties de Ω. Il comporte 216 éléments. Une probabilité P0 sur cette tribu est donnée par l’application définie par

∀T ∈ T0, P0(T ) =aire(T )

aire(Ω)= aire(T )

Sur la figure 16, on a

P0(T1) =4

16, P0(T2) =

3

16, P0(T1 ∩ T2) =

1

16et P0((T1 ∪ T2)) =

10

16

Sur ce même Ω, on peut définir de façon un peu vague, une tribu T beaucoup plus large, à savoir, l’ensemble desparties du carré admettant une aire 19 et définir sur cette tribu T la probabilité P définie par

∀T ∈ T , P(T ) =aire(T )

aire(Ω)= aire(T )

Spécifier la probabilité d’un événement A, c’est imposer une mesure de la proportion de A relativement à Ω.

19. C’est beaucoup plus délicat que ça n’en a l’air !

Page 34: Notes de cours 02 - Freejcleger.math.free.fr/maths/2017/docs/2017-ndc-02... · 2018-08-29 · 3 Là, c’est de la physique! Balistique Pour le problème de la sagaie, les variables

34

0 14

12

34

10

14

12

34

1

T1

T2 T1 ∩T2

T1 ∪T2

FIGURE 16: Le carré, T1 en rouge, T2 en bleu, des éléments de la tribu T0

0 14

12

34

10

14

12

34

1

T1

T2

T1 ∩T2

FIGURE 17: Le carré Ω, quelques éléments de la tribu T

Exemples graphiques : Segment (HP)Considérons maintenant le segment Ω = [0, 1[ subdivisé en petits segments Sk =

[k16 ,

k+116

[, k ∈ 0, . . . , 15,

de longueur 116 comme sur la figure 18. On a épaissi les segments en hauteur pour pouvoir voir les couleurs.

L’ensemble S = Sk, k ∈ 0, . . . , 15 est un ensemble de parties de Ω. Il comporte 16 éléments. Ce n’est pasune tribu de parties de Ω.

Par contre, l’ensemble T0 où chaque élément est une figure T formée d’une union finie de segments Sk est unetribu de parties de Ω. Il comporte 216 éléments. Une probabilité P0 sur cette tribu est donnée par l’application définiepar

∀T ∈ T0, P0(T ) =longueur(T )

longueur(Ω)= longueur(T )

Page 35: Notes de cours 02 - Freejcleger.math.free.fr/maths/2017/docs/2017-ndc-02... · 2018-08-29 · 3 Là, c’est de la physique! Balistique Pour le problème de la sagaie, les variables

35

Sur la figure 18, on a

P0(T1) =4

16, P0(T2) =

3

16, P0(T1 ∩ T2) =

1

16et P0((T1 ∪ T2)) =

10

16

Comme pour le carré, on peut aussi considérer la tribu T de toutes les parties T du segment unité admettant unelongueur. La longueur longueur(T ) d’une telle partie peut-être interprétée comme la probabilité P(T ) de l’événementT .

0 14

12

34

1

T1 T2 T1 ∩T2T1 ∪T2

FIGURE 18: Le segment, T1 en rouge, T2 en bleu, des éléments de la tribu T0

Pouvez vous deviner la transformation qui fait passer du carré au segment et réciproquement ?

Variables aléatoires réelles

Définition 8. Soit un espace probabilisé (Ω, T ,P).Une variable aléatoire réelle, X , est une application X : Ω→ R telle que pour tout intervalle I ∈ R

X ∈ I︸ ︷︷ ︸notation probabiliste

:= ω ∈ Ω, X(ω) ∈ I = X−1(I)︸ ︷︷ ︸notation ensembliste

est un événement, i.e. est dans T .

Un exemple graphique (HP)Reprenons le cas où Ω est le carré [0, 1[ × [0, 1[, P l’aire et prenons comme v.a., à valeurs dans [0, 1[, X1 et X2

définies par∀ω = (ω1, ω2) ∈ [0, 1[× [0, 1[ , X1(ω) = ω1, X2(ω) = ω2

Sur la figure 19, on a représenté

T1 =

X2 ∈

[1

2,3

4

[et T2 =

X1 ∈

[1

4,1

2

[On a

P(1

2≤ X1 <

1

4) =

1

4, P(

1

4≤ X2 <

1

2) =

1

4,

P(1

2≤ X1 <

1

4) =

1

4et

1

4≤ X2 <

1

2) =

1

16

Une interprétation graphique plus imaginative montre que, si I1, I2 sont deux intervalles quelconques de R, alors— X1 ∈ I1 est un rectangle « vertical »de largeur P(X1 ∈ I1), de hauteur 1— X2 ∈ I2 est un rectangle « horizontal »de largeur 1, de hauteur P(X2 ∈ I2),— X1 ∈ I1 ∩ X2 ∈ I2 est un rectangle de largeur P(X1 ∈ I1), de hauteur P(X2 ∈ I2),— On a donc P(X1 ∈ I1 et X2 ∈ I2) = P(X1 ∈ I1).P(X2 ∈ I2).— Ceci étant vrai pour tout couple d’intervalle (I1, I2), les v.a X1 et X2 sont indépendantes ?

Page 36: Notes de cours 02 - Freejcleger.math.free.fr/maths/2017/docs/2017-ndc-02... · 2018-08-29 · 3 Là, c’est de la physique! Balistique Pour le problème de la sagaie, les variables

36

0 14

12

34

10

14

12

34

1

T1

T2 T1 ∩T2

FIGURE 19: Le carré, T1 en rouge, T2 en bleu, T1 ∩ T2

Posons maintenant les v.a. D1 et D2 définies par

D1 =

0 si 0 ≤ X1 <

14

1 si 14 ≤ X1 <

12

2 si 12 ≤ X1 <

34

3 si 34 ≤ X1 < 1

et D2 =

0 si 0 ≤ X2 <

14

1 si 14 ≤ X2 <

12

2 si 12 ≤ X2 <

34

3 si 34 ≤ X2 < 1

Pour résumer, pour (i, j) ∈ 0, . . . , 3 × 0, . . . , 3, ω ∈ [0, 1[2, (D1(ω), D2(ω)) = (i, j) si et seulement siω ∈ Ci,j . D1 et D2 sont des variables prenant un nombre fini de valeurs, uniformément distribuées sur 0, . . . , 3 etindépendantes.

En d’autres termes, on a « construit »un espace 20 pour la modèlisation de l’expérience de tirer indépendammentdeux dés à 4 faces numérotées de 0 à 3 21. Cet espace est différent de l’espace naturel, fini, où l’on prend Ω′ =0, . . . , 32 et P′ la probabilité uniforme sur Ω′.

Les calculs relativement à un espace ou à l’autre donnent les mêmes résultats concernant les expériences à deuxdés, le nouvel espace permet en plus de se garder la possibilité de construire d’autres v.a. n’ayant rien à voir avecl’expérience des deux dés.

Variables aléatoires réelles, opérationsUne fois que l’on a une ou plusieurs v.a.r, on peut en fabriquer de nouvelles par toutes les opérations algébriques

et compositions avec les fonctions numériques de variable réelle usuelles.

Proposition 9. Soit X , Y , Z,... des v.a.r

1. (Stabilité par CL) Si λ, µ sont des nombres réels alors λ.X + µ.Y est une v.a.r.

2. (Stabilité par composition I) Si h : I → R est une fonction réelle de variable réelle, X à valeurs dans I , unintervalle de R, alors 22 Y = h(X) définie par

∀ω ∈ Ω, Y (ω) = [h(X)](ω) = h(X(ω)) = (h X)(ω)

20. En fait deux : (Ω, T0,P0) et (Ω, T ,P), ce dernier n’ayant été que très incomplètement défini.21. Les amateurs de jeux de rôles apprécieront22. modulo des hypothèses très faibles sur h, toutes les fonctions h que nous utilisons vérifient ces hypothèses relevant de la logique

mathématique la plus fondamentale.

Page 37: Notes de cours 02 - Freejcleger.math.free.fr/maths/2017/docs/2017-ndc-02... · 2018-08-29 · 3 Là, c’est de la physique! Balistique Pour le problème de la sagaie, les variables

37

est une variable aléatoire réelle.

3. (Stabilité par composition II) Si h : R2 → R est une fonction réelle de deux variables réelles, Z = h(X,Y )définie par

∀ω ∈ Ω, Z(ω) = [h(X,Y )](ω) = h(X(ω), Y (ω))

est une variable aléatoire réelle.

Commentaires sur les hypothèses : on peut prendre h continue, continue par morceaux, monotone, et d’une façongénérale, toute fonction que l’on rencontre dans la pratique.

Exemples : Prendre une v.a, prendre son max, son min, mettre au carré, prendre le log, l’exp,....

Exercice 15.— Jet de deux dés à 4 faces, loi de la somme, loi de la différence.Indication:Faire une décomposition des évenements suivant la valeur prise par le premier dé ( i.e. formule des probabilités

totales)

Variables aléatoires réelles, loi, fonction de répartition

Définition 10. Soit un espace probabilisé (Ω, T ,P). Soit X une variable aléatoire réelle. La loi de X est la donnéede la famille de nombres P(X ∈ I), I intervalle de R

Plus modestement, on peut se contenter de la sous-famille des intervalles ]∞, x], x ∈ R pour reconstruire lafamille complète. La loi de X est donc donnée par la connaissance de la fonction de répartition de X ,

FX : R → [0, 1]x 7→ P(X ≤ x) := P(X ∈ ]−∞, x])

Par exemple, pour a < b, on a

P(X ∈ ]a, b]) = FX(b)− FX(a), P(X ∈ ]a,+∞[) = 1− FX(a)

Proposition 11. La fonction de répartition FX d’une v.a.r X est une fonction R→ [0, 1], vérifiant

1. FX est croissante

2. limx→−∞ FX(x) = 0, limx→+∞ FX(x) = 1

3. (Hors programme) continue à droite en tout point

2.2 Variables aléatoires réelles, nombre fini de valeurs

Si X est une variable aléatoire (réelle) prenant un nombre fini de valeurs distinctes x1, . . . , xN , on a vu que laloi de X est la donnée des nombres

p1 = P(X = x1), . . . , pN = P(X = xN )

On a vu sur un exemple à 3 valeurs que la donnée de cette famille est équivalente à la connaissance de la loi de X ausens donné précédemment. Plus précisément :

Si I est un intervalle de R,

P(X ∈ I) =N∑k=1

11xk∈Ipk

Page 38: Notes de cours 02 - Freejcleger.math.free.fr/maths/2017/docs/2017-ndc-02... · 2018-08-29 · 3 Là, c’est de la physique! Balistique Pour le problème de la sagaie, les variables

38

Démonstration. Le sens facile, c’est de remarquer que chaque singleton xn est un intervalle, si on connaît la loi deX au sens étendu, alors on connaît P(X ∈ [xk, xk]) = P(X = xk) et donc on connaît la loi de X au sens premièreannée.

L’autre sens est plus difficile conceptuellement : on connaît une quantité finie de nombres pk et on arrive àreconstruire la quantité, possiblement infinie des nombres P(X ∈ I). Il y a beaucoup d’intervalles dans R !

L’assertion «X prend ses valeurs dans l’ensemble fini x1, . . . , xN »se traduit en termes probabilistes par « lafamille finie d’événements X = x1 , . . . , X = xN forme un système complet d’événements, i.e

1. Leur alternative est l’événement certain

∪Nk=1 X = xk = X = x1 ∪ · · · ∪ X = xN = Ω

2. Ils sont mutuellement incompatibles.

∀k 6= `, X = xk ∩ X = x` = ∅

On peut alors, et c’est une technique qu’on utilisera encore et encore, décomposer un événement sur ce systèmecomplet.

Je dirai « décomposer un événement suivant les valeurs possibles d’une certaine variable »Plus précisément, si I est un intervalle, A = X ∈ I, on a

P(X ∈ I) = P(X ∈ I ∩ ∪Nk=1X = xk)= P(∪Nk=1(X ∈ I ∩ X = xk) (distributivité)

=

N∑k=1

P((X ∈ I ∩ X = xk)

Pour k ∈ 1, . . . , N, que vaut P(X ∈ I ∩ X = xk) ? Il y a deux possibilités— Soit xk ∈ I , auquel cas X ∈ I ∩ X = xk = X = xk et P(X ∈ I ∩ X = xk) = pk,— Soit xk 6∈ I , auquel cas X ∈ I ∩ X = xk = ∅ et P(X ∈ I ∩ X = xk) = 0,

On a donc

P(X ∈ I) =N∑k=1

11xk∈Ipk

Exemples

Exercice 16.— Si X suit la loi uniforme surkn , k ∈ 0, . . . , n

où n ∈ N∗. Tracer histogramme, fonction de

répartition, idem pour Y = X2. Formule de transfert générique pour une fonction pour X .

Exercice 17.— Tracer, à la machine, histogramme et fonction de répartition pour la loi binomiale B (n, p).1. Prendre pour p fixé, des valeurs de n augmentant. Observer l’évolution des graphiques.2. Fixer λ > 0. Prendre des valeurs de n augmentant et p = λ

n

Correction Ex.–16

v.a de BERNOULLI

Définition 12. Une variable aléatoire de BERNOULLI est une variable aléatoire ne pouvant prendre que les valeurs0 (échec,faux) ou 1 (succès,vrai).

— Une indicatrice d’événement 11A est une v.a de BERNOULLI et réciproquement. On a A = 11A = 1.

Page 39: Notes de cours 02 - Freejcleger.math.free.fr/maths/2017/docs/2017-ndc-02... · 2018-08-29 · 3 Là, c’est de la physique! Balistique Pour le problème de la sagaie, les variables

39

0 kn

k+1n

1

x

1n+1

1p

0(kn

)2(k+1n

)2 1

y

1n+1

1

p

FIGURE 20: X ∼ U kn, k∈0,...,n, sa distribution et la distribution de Y = X2, fonctions de répartition.

— Toute v.a.r prenant un nombre fini de valeurs est combinaison linéaire de v.a de BERNOULLI. Si X est àvaleurs dans x1, . . . , xK, en posant Ak = X = xk, on a

X =K∑k=1

xk11Ak

2.3 V.a. uniforme sur [0, 1]

Définition et loiOn présente maintenant l’exemple fondamental de v.a.r pouvant prendre une infinité de valeurs.

Définition 13. Soit U une variable aléatoire réelle. On dit que U suit la loi uniforme sur [0, 1] si, pour tout intervalleI de R,

P(U ∈ I) = longueur(I ∩ [0, 1])

Dans ce cas, on note U ∼ U[0,1].

U est p.s. à valeurs dans [0, 1]. En effet, on a

P(U 6∈ [0, 1]) = P(U ∈ ]−∞, 0]) + P(U ∈ [1,−∞[) = 0 + 0 = 0

On peut comparer le résultat suivant (admis, difficile) avec le théorème 1

Théorème 14 (Existence d’un modèle probabiliste fondamental). Il existe un ensemble Ω, une tribu T sur Ω, uneprobabilité P sur T et une v.a. U : Ω→ R tels que

U ∼ U[0,1]

Ayant à disposition un tel modèle (Ω, T ,P), on peut aller plus loin ( c.f. fin de ce cours pour l’indépendance,c.f. derniers cours de l’année pour des idées de construction) :

Il existe une suite (Un)n∈N de v.a. sur (Ω, T ,P), indépendantes, distribuées uniformément sur [0, 1]. Sur cetespace, à l’aide de cette suite de v.a. uniformes et indépendantes, on peut, en utilisant les techniques de simula-tion/construction de v.a. décrites dans les sections Simulations et construction de v.a prenant un nombre finide valeurs et Lois conditionnelles, Simulation informatique, construire une chaine de MARKOV de matrice detransition donnée ou les modèles de tirage au sort avec ou sans remise.

Page 40: Notes de cours 02 - Freejcleger.math.free.fr/maths/2017/docs/2017-ndc-02... · 2018-08-29 · 3 Là, c’est de la physique! Balistique Pour le problème de la sagaie, les variables

40

Fonction de répartition d’une loi uniformeCalcul et graphe. Fonction de répartition du carré d’une telle variable. c.f. fig. 21.Remarque sur la probabilité de prendre une valeur « exactement ».

∀x ∈ R, P(U = x) = P(U ∈ [x, x]) = 0

En conséquence, U est aussi p.s. à valeurs dans ]0, 1[.

0 kn

k+1n

1

x

1n+1

1

p

0(kn

)2(k+1n

)2 1

y

1n+1

1

p

FIGURE 21: X ∼ U[0,1], Y = X2, fonctions de répartition, comparaison avec le cas discret.

V.a. uniforme sur un intervalle borné

Définition 15. Soit X une variable aléatoire réelle, a, b ∈ R, a < b. On dit que X suit la loi uniforme sur [a, b] si,pour tout intervalle I de R,

P(X ∈ I) =longueur(I ∩ [a, b])

longueur([a, b])=

1

b− alongueur(I ∩ [a, b])

Dans ce cas, on note X ∼ U[a,b].

1. Si U ∼ U[0,1] alors en posant X = a+ (b− a)U , X ∼ U[a,b].

2. Si X ∼ U[a,b] alors en posant U = X−ab−a , U ∼ U[0,1].

Simulations et construction de v.a prenant un nombre fini de valeurs.Pour simuler (informatiquement) des variables aléatoires, les langages informatiques disposent en général d’un

générateur fondamental de nombres aléatoires. L’instruction s’appelle toujours rand() ou random().Pour nous ce sera np.random.rand() où np est l’alias de numpy Chaque appel à ce générateur retourne

un nombre aléatoire de distribution uniforme sur [0, 1[, indépendant des précédents. Cela signifie que si l’on faitplusieurs appels successifs, la suite des nombres obtenus a les mêmes propriétés statistiques (distribution, moyenne,...) qu’une suite (abstraite) de valeurs prises par U1, . . . , Un où U1, . . . , Un sont des v.a indépendantes et

∀k ∈ 1, . . . , n , Uk ∼ U[0,1]

La question qui se pose est la suivante : à partir d’une v.a. uniforme sur [0, 1], U , comment construire une v.a.(prenant un nombre fini de valeurs) ayant une loi discrète finie donnée. Reformulé pour Python, la question est :comment réécrire une fonction du type np.random.choice en utilisant np.random.rand ?

Page 41: Notes de cours 02 - Freejcleger.math.free.fr/maths/2017/docs/2017-ndc-02... · 2018-08-29 · 3 Là, c’est de la physique! Balistique Pour le problème de la sagaie, les variables

41

Supposons que l’on doive simuler une v.a. X prenant trois valeurs distinctes (non nécessairement numériques),x1, x2 et x3. L’information dont on dispose est la distribution de X

p1 := P(X = x1), p2 := P(X = x2), p3 := P(X = x3),

La méthode est simple (graphique) On découpe l’intervalle [0, 1] en trois intervalles disjoints I1, I2 et I3 de longueursrespectives p1, p2 et p3. On tire au sort U grâce au générateur uniforme. Si U ∈ I1, on prend X = x1, si U ∈ I2, onprend X = x2,...

En d’autres termes, on pose

I1 = [0, p1[ , I2 = [p1, p1 + p2[ , I3 = [p1 + p2, 1[ et

X =

x1 si U ∈ I1

x2 si U ∈ I2

x3 si U ∈ I3

En termes de fonction sur Ω,

∀ω ∈ Ω, X(ω) =

x1 si U(ω) ∈ I1

x2 si U(ω) ∈ I2

x3 si U(ω) ∈ I3

On a X = x1 = U ∈ I1 et donc P(X = x1) = P(U ∈ I1) = p1, etc...En Python cela donne la fonction suivante

def VA3finie(p):"""VA3finie(p): liste de 3 nombres positifs sommant à 1retourne un tirage aléatoire d’un nombre entre 0 et 2 avecla distribution pP(VAfinie(p)=k)=p[k]"""u=np.random.rand() #tire un nombre uniformement entre 0 et 1if(u<=p[0]):

return 0if(u<=p[0]+p[1]):

return 1if(u<=p[0]+p[1]+p[2]):#RQ: ne sert à rien, automatiquement vrai si p correct

return 2return -1 #On n’arrive jamais à ce point si p correct

Pour finir, généralisons au cas de K valeurs. Si X prend un nombre fini de valeurs numériques ordonnées x1 <x2 < · · · < xK , avec probabilités p1, p2,..pK , ce mécanisme peut s’exprimer à l’aide de la fonction de répartition deX . Si F (ne dépendant que de la distribution connue de X) est définie par

∀x ∈ R, F (x) := P(X ≤ x)

(On pose x0 := −∞, F (x0) := 0)

X = xk si U ∈ Ik := [F (xk−1), F (xk)[

Ce qui donne en Python :

def VAfinie(p):"""VAfinie(p): p liste de nombres positifs sommant à 1

Page 42: Notes de cours 02 - Freejcleger.math.free.fr/maths/2017/docs/2017-ndc-02... · 2018-08-29 · 3 Là, c’est de la physique! Balistique Pour le problème de la sagaie, les variables

42

retourne un tirage aléatoire d’un nombre entre 0 et len(p)-1 avecla distribution pP(VAfinie(p)=k)=p[k]"""u=np.random.rand() #tire un nombre uniformement entre 0 et 1q=0.0for y in range(len(p)) :

q=q+p[y]if(u<=q) :

return yreturn -1 #si erreurr!!!

3 Variables aléatoires réelles, espérance

3.1 Espérance et v.a.r intégrables

On admet qu’il existe une opération E, agissant sur les variables aléatoires réelles positives, dont les valeurs sontsoit un nombre réel, soit le symbole∞, et telle que

1. E(11) = 1, E(0) = 0

2. Si A ∈ T , E(11A) = P(A),

3. Si X est une variable aléatoire réelle prenant des valeurs positives alors E(X) a toujours un sens. 23

Il s’agit soit d’un nombre réel positif, soit du symbole « infini » (∞).

4. Dans ce cas, on a l’équivalence E(X) = 0 si et seulement si P(X = 0) = 1.

5. (Croissance de l’espérance) Si X et Y sont deux variables aléatoires réelles prenant des valeurs positives et siX ≤ Y , alors 24

0 ≤ E(X) ≤ E(Y )

1. (Additivité de l’espérance) Si X et Y sont deux variables aléatoires réelles prenant des valeurs positives, alors,avec l’extension naturelle de cette écriture au cas où le symbole +∞ apparaît,

E(X + Y ) = E(X) + E(Y )

2. (Homogénéité de l’espérance) Si X est une variable aléatoire réelle prenant des valeurs positives et λ ∈[0,+∞[, alors, avec conventions particulières pour gérer le cas E(X) =∞, on a

E(λ.X) = λ.E(X)

1. Ce qui est à comprendre c’est que E est un genre de moyenne. On moyenne sur tous les « ω »

2. E se comporte à beaucoup d’égards (linéarité, positivité) comme le symbole∑

ou le symbole∫

, ce qui varessortir lors de diverses formules de transfert.

Variables aléatoires réelles intégrables

Définition 16. Soit X une variable aléatoire réelle.

1. On dit que X est intégrable ou que X admet une espérance si E(|X|) 6=∞.

23. La formule de CAVALIERI de l’exercice 6, p.15 peut servir de définition pour le cas le plus général.24. avec l’extension naturelle de cette écriture au cas où l’un des deux vaut∞

Page 43: Notes de cours 02 - Freejcleger.math.free.fr/maths/2017/docs/2017-ndc-02... · 2018-08-29 · 3 Là, c’est de la physique! Balistique Pour le problème de la sagaie, les variables

43

2. Si X est intégrable, X+ = max(X, 0) et X− = −min(X, 0) le sont aussi, sont à valeurs positives, on a

X = X+ −X−, |X| = X+ +X−,

et on poseE(X) := E(X+)− E(X−)

RQ : ceci n’est pas sans rappeler des éléments de démonstration du théorèmeACV ⇒ CV . C’est exprès, commeon le verra dans le chapitre sur les v.a. à densité. On a les règles de calcul suivantes.

Proposition 17. Soit X , Y des variables aléatoires réelles intégrables et λ, µ deux nombres réels,

1. (Linéarité de l’espérance) Z = λ.X + µ.Y est une variable aléatoire réelle intégrable et

E(Z) = E(λ.X + µ.Y ) = λ.E(X) + µ.E(Y )

2. (Croissance) Si X ≤ Y alors E(X) ≤ E(Y ) avec égalité ssi P(X = Y ) = 1.

3. (Inégalité triangulaire)|E(λ.X + µ.Y )| ≤ |λ|.E(|X|) + |µ|.E(|Y |)

La façon dont se distribue h(X) ou h(X,Y ) pour une fonction h quelconque est un de nos problèmes centraux.

Nombre fini de valeurs.Dans le cas d’une v.a.r. X prenant un nombre fini de valeurs, on retrouve, par linéarité de E, la formule de

première annéeSi X est une v.a.r., à valeurs dans l’ensemble fini xk, k ∈ 1, . . . ,K ⊂ R, alors

1. X =∑K

k=1 xk11X=xk

2. X admet une espérance,

E(|X|) =K∑k=1

|xk|P(X = xk) et E(X) =K∑k=1

xkP(X = xk)

Exercice 18.— Soit n un entier naturel non nul, soitX une variable suivant la loi U0, 1n,...,n−1

n,nn. Soit f : [0, 1]→ R

une fonction continue.1. Donner une formule pour Sn(f) = E(f(X)). Appliquer cette formule à l’exemple f : x 7→ x2.2. Quelle est, en général, la limite de Sn(f) lorsque n→ +∞.3. Quelle est la valeur de cette limite pour l’exemple proposé ?

c.f. figure 21.

L’espérance d’une fonction d’une variable uniformeSupposons que U ∼ U[0,1]. On admet que l’on a la formule de transfert suivante :Si h : R→ R est une fonction, on a

E(h(U)) =

∫ +∞

−∞h(u)11u∈[0,1] du =

∫ 1

0h(u) du

pourvu que cette dernière intégrale soit absolument convergente.On convient que E(h(U)) = +∞ si h est positive et l’intégrale diverge vers +∞.Exemples :

Page 44: Notes de cours 02 - Freejcleger.math.free.fr/maths/2017/docs/2017-ndc-02... · 2018-08-29 · 3 Là, c’est de la physique! Balistique Pour le problème de la sagaie, les variables

44

1. Montrer que le formule de transfert en question est vraie au cas où h est constante par morceaux, i.e. h est dela forme h =

∑Kk=1 xk11Ik où les Ik sont des intervalles disjoints de R. (On pourra vérifier la formule dans le

cas d’un seul intervalle et argumenter par linéarité des opérations).

2. Calculer E(U2), E( 11+U ), E( 1√

1−U2).

3. Calculer E(e−λ.U ) où λ ∈ R.

4. Les v.a.r lnU , 1U , 1√

Usont-elles intégrables ?

5. Soit V une v.a.r uniforme sur [0, 1]. Donner l’espérance de U + V , de U − V .

6. Soit a < b, a, b ∈ R, V une v.a.r uniforme sur [a, b]. Donner la formule de transfert générique donnantE(h(V )).

Variables intégrables, Inégalité de MARKOV

Théorème 18 (Inégalité de MARKOV). Si X est une variable aléatoire réelle, positive, alors, pour tout seuil λ > 0,

P(X ≥ λ) ≤ E(X)

λ

Démonstration. On peut se limiter au cas où X est intégrable. Comme X est positive, on a

11X≥λ ≤X

λ

Par croissance et linéarité de l’espérance, il vient

E(11X≥λ) ≤E(X)

λ

3.2 Variables de carré intégrable

Variables de carré intégrable, définition

Définition 19. Soit X une v.a.r. On dit que X est de carré intégrable ou admet une variance si X2 est intégrable.

Exercice 19.— Soit U ∼ U[0,1].1. U est de carré intégrable ?2. 1√

Uest intégrable sans être de carré intégrable ?

Variables de carré intégrable, CAUCHY–SCHWARZ

Théorème 20 (Inégalité de CAUCHY–SCHWARZ). Si X et Y sont deux v.a.r de carré intégrable alors X.Y estintégrable et on a

|E(X.Y )| ≤ E(|X|.|Y |) ≤ E(|X|2)12E(|Y |2)

12

Démonstration. On commence par noter que si X et Y sont de carré intégrable alors toute combinaison linéaire deX et Y l’est aussi. En effet,

0 ≤ (X + Y )2 ≤ 4X2 + 4Y 2

et comme par hypothèse, E(X2) et E(Y 2) sont finis, 4 fois leur somme l’est aussi et, par croissance de l’espérance,E((X + Y )2 est finie.

Si λ, µ deux nombres réels, alors λ.X et µ.Y sont aussi de carré intégrable et leur somme aussi.

Page 45: Notes de cours 02 - Freejcleger.math.free.fr/maths/2017/docs/2017-ndc-02... · 2018-08-29 · 3 Là, c’est de la physique! Balistique Pour le problème de la sagaie, les variables

45

Comme X.Y = 14((X + Y )2 − (X − Y )2), on en déduit que XY est intégrable.

Considérons maintenant la fonction f : λ ∈ R 7→ E((X + λ.Y )2). Cette fonction est bien définie, à valeursréelles.

On a, en développant le carré et en utilisant la linéarité de l’espérance d’une part et en utilisant la positivité del’espérance, que, pour λ ∈ R,

0 ≤ E((X + λ.Y )2) = E(X2) + 2λE(XY ) + λ2E(Y 2)

La fonction f est donc une fonction polynômiale, de degré au plus 2, positive.1. Si E(Y 2) 6= 0, f est de degré 2 et son discrimant (réduit) est négatif :

(E(XY ))2 − E(X2).E(Y 2) ≤ 0,

ce qui, une fois réarrangé donne l’inégalité attendue.2. Si E(Y 2) = 0, on a affaire à une fonction affine positive et donc sa pente est nulle : E(XY ) = 0 et l’inégalité

est aussi vérifiée.L’inégalité intermédiaire avec E(|X|.|Y |) provient de l’application de l’inégalité démontrée aux variables |X| et |Y |qui sont elles aussi de carré intégrable.

Une conséquence en est la suivante :

Proposition 21. Si X est de carré intégrable, elle est intégrable et

|E(X)| ≤ E(|X|) ≤ E(X2)12

Démonstration. On applique le théorème précédent à X et Y = 11. Y est de carré intégrable et E(Y 2) = E(Y ) =1.

Variables de carré intégrable, Variance et covariance

Proposition-Définition 22. 1. Si X est de carré intégrable 25, sa variance est définie par

V(X) = E((X − E(X))2)

2. Son écart-type, σ(X) = V(X)12 .

3. Si X et Y sont de carré intégrable, leur covariance est définie par

Cov(X,Y ) = E((X − E(X)).(Y − E(Y )))

4. On a |Cov(X,Y )| ≤ σ(X).σ(Y ).

Formule de KOENIG–HUYGENS

Proposition-Définition 23. 1. Si X admet une variance, sa variance vaut

V(X) = E(X2)− E(X)2

2. Si X et Y admettent une variance, leur covariance vaut

Cov(X,Y ) = E(X.Y )− E(X).E(Y )

Démonstration. On ne démontre que la première égalité, la seconde relevant de la même technique de calcul. On a,en développant le carré, par linéarité de l’espérance et le fait que E(C) = C pour une constante C,

V(X) = E(X2 − 2X.E(X) + E(X)2)

= E(X2)− 2E(X).E(X) + E(X)2 = E(X2)− E(X)2

25. La terminologie officielle est « X admet une variance ».

Page 46: Notes de cours 02 - Freejcleger.math.free.fr/maths/2017/docs/2017-ndc-02... · 2018-08-29 · 3 Là, c’est de la physique! Balistique Pour le problème de la sagaie, les variables

46

Variables de carré intégrable, centrage, normalisationUne variable aléatoire positive est d’espérance nulle si et seulement si P(X = 0) = 1. ( On dit que X est nulle

presque sûrement.)Une variable aléatoire est de variance nulle, V(X) = 0, si et seulement si P(X = E(X)) = 1. Autrement dit ssi

X est une constante presque sûrement.Supposons que X est une variable aléatoire admettant une variance.— si C une constante ( i.e. une variable ne prenant presque sûrement qu’une valeur), on a

V(X + C) = V(X)

— si λ est une constante, V(λ.X) = λ2V(X).On peut se servir de ces deux propriétés pour centrer, puis normaliser une v.a non constanteX , de carré intégrable.

X∗ =X − E(X)

σ(X)

est une variable d’espérance nulle (centrée), de variance 1. On dit qu’elle est centrée-réduite.Remarquer que si X est mesurée dans une certaine unité, alors E(X), σ(X) sont dans la même unité et X∗ est

sans unité.

Exercice 20.—1. Donner espérance et variance d’une v.a U ∼ U[0,1].2. Donner espérance et variance d’une v.a V ∼ U[a,b].3. Quelle est la centrée réduite de U ? de V ?

Exercice 21.— SiX ∼ B(n, 1

2

). Donner l’histogramme deX∗. Dans quel ensemble finiX∗ prend-elle ses valeurs ?

Exercice 22.— Même question si X ∼ U0,...,2n où n ∈ N∗.

La règle de la somme

Proposition 24. Si X et Y sont de carré intégrable alors

V(X + Y ) = V(X) + V(Y ) + 2Cov(X,Y )

Exercice 23.— Donner une formule pour V(∑N

n=1Xn) où les Xn sont de carré intégrable.

Variables de carré intégrable, BIENAYMÉ–TCHEBYCHEFF

On a vu que l’espérance d’une v.a.r est une sorte de moyenne des valeurs que peut prendre X . Les valeurs de Xse répartissent donc de part et d’autre E(X).

La valeur de la variance mesure quant à elle, assez grossièrement, la façon dont les valeurs prises par X serépartissent autour de E(X).

L’inégalité de BIENAYMÉ–TCHEBYCHEFF est une traduction de l’idée de répartition de X autour de son espé-rance.

Théorème 25 (Inégalité de BIENAYMÉ–TCHEBYCHEFF). Si X est de carré intégrable, on a, pour tout seuil λ > 0,

P(|X − E(X)| > λ) ≤ V(X)

λ2

Démonstration. Il suffit d’appliquer l’inégalité de MARKOV à la variable intégrable positive Z = (X − E(X))2 etde remarquer que les événements (|X − E(X)| > λ) et (Z > λ2) sont égaux. On a E(Z) = V(X).

Page 47: Notes de cours 02 - Freejcleger.math.free.fr/maths/2017/docs/2017-ndc-02... · 2018-08-29 · 3 Là, c’est de la physique! Balistique Pour le problème de la sagaie, les variables

47

Théorème 26 (Inégalité de BIENAYMÉ–TCHEBYCHEFF). Si X est de carré intégrable, on a, pour tout seuil λ > 0,

P(|X − E(X)| > λ.σ(X)) ≤ 1

λ2

Notamment, si λ = 2, on obtient qu’avec probabilité supérieure à 75%, X est distant de la constante E(X) demoins de 2 écart-types. Ceci, quelle que soit la distribution de X .

Cette inégalité n’est pertinente que pour λ > 1.

0 2 4 6 8 10

0.00

0.05

0.10

0.15

0.20

0.25

E(X) E(X) +2σ(X)E(X)−2σ(X)

FIGURE 22: BIENAYMÉ–TCHEBYCHEFF : Au moins 75% de la population est à moins de 2 écarts-types de lamoyenne.

Exercice 24.— Sur n = 100 palourdes péchêes en Bretagne sud, on effectue la mesure de leur diamètre. On notedk le diamètre de la palourde portant le numéro k ∈ 1, . . . , n. On regroupe ces mesures en un tableau et on calcule(via Excel par exemple) leur moyenne d = 1

n

∑nk=1 dk et l’écart-type

σ =

√√√√ 1

n

n∑k=1

(dk − d)2

1. On prend une palourde au hasard et on note D son diamètre. Calculer E(D) et V(D) en fonction de d et σ.2.a. Soit α > 0. Enoncer l’inégalité de BIENAYMÉ–TCHEBYCHEFF pour D au seuil ασ.2.b. Comment choisir α pour être sûr que moins d’un quart des palourdes ont un diamètre qui diffère du diamètremoyen de plus de α.σ en valeur absolue.3. En fait, on met nos n palourdes dans un sac que l’on secoue, ce qui fait que les plus grandes palourdes vont plusfacilement être tirées. On admet que la palourde numéro k est tirée avec probabilité

pk =dk

n.d

3.a. Vérifier que∑n

k=1 pk = 1.3.b. On noteD′ le diamètre de la palourde tirée au sort suivant ce mode. Pourquoi, heuristiquement, E(D′) ≥ E(D) ?3.c. Donner une formule pour E(D′) en fonction de E(D2).

Page 48: Notes de cours 02 - Freejcleger.math.free.fr/maths/2017/docs/2017-ndc-02... · 2018-08-29 · 3 Là, c’est de la physique! Balistique Pour le problème de la sagaie, les variables

48

3.d. Démontrer mathématiquement l’inégalité heuristique.

Variables de carré intégrable, coeff. de corrélation et régression linéaireLe problème de la régression linéaire est le suivant. On dispose de deux variables X (non constante) et Y , de

carré intégrable. Faire la régression linéaire de Y sur X consiste à trouver la variable Y , fonction affine de X « laplus proche »de Y au sens des moindres carrés, i.e. trouver deux réels a et b tels que

E((Y − (aX + b))2)

soit minimal. On pose alors Y = aX + b.Le calcul montre que

Théorème 27.Y =

Cov(X,Y )

V(X)(X − E(X)) + E(Y )

ou alors, en variables centrées et réduites, si X et Y sont non constantes,

Y ∗ = ρ(X,Y )X∗

où ρ(X,Y ) = Cov(X,Y )σ(X)σ(Y ) est le coefficient de corrélation linéaire.

Démonstration. Posons, pour a, b ∈ R, f(a, b) = E((Y − (aX + b))2) et développons cette expression. On a

f(a, b) = E(Y 2) + a2E(X2) + b2 − 2aE(X.Y )− 2bE(Y ) + 2abE(X)

Ce serait plus agréable si les variables X et Y étaient centrées, il y aurait deux termes de moins. Reprenons l’expres-sion de départ et forçons le centrage.

f(a, b) = E((Y − E(Y )︸ ︷︷ ︸=Y

−( a︸︷︷︸=α

(X − E(X)︸ ︷︷ ︸=X

+ b− E(Y ) + aE(X)︸ ︷︷ ︸=β

))2)

= E((Y − (αX + β))2)

= g(α, β)

où on a posé α = a, β = b − E(Y ) + aE(X). Trouver un couple (a, b) qui rende f(a, b) minimal revient à trouverun couple (α, β) qui rende g(α, β) minimal.

Développons l’expression de g(α, β), comme nous avons développé f(a, b), le calcul est le même. On a

g(α, β) = E(Y 2)︸ ︷︷ ︸=V(Y )

+a2 E(X2)︸ ︷︷ ︸=V(X)

+b2 − 2a E(X.Y )︸ ︷︷ ︸=Cov(X,Y )

−2bE(Y )︸ ︷︷ ︸=0

+2abE(X)︸ ︷︷ ︸=0

= V(Y ) + β2 + α2V(X)− 2αCov(X,Y )

(forme canonique ) = β2︸︷︷︸≥0

+V(X)(α− Cov(X,Y )

V(X))2︸ ︷︷ ︸

≥0

+V(Y )V(X)− Cov(X,Y )2

V(X)

≥ g(Cov(X,Y )

V(X), 0)

Ceci démontre que le minimum de g(α, β) est (uniquement) atteint en (Cov(X,Y )V(X) , 0) et donc que le minimum de f

est atteint en

a =Cov(X,Y )

V(X), b = E(Y )− a.E(X)

Page 49: Notes de cours 02 - Freejcleger.math.free.fr/maths/2017/docs/2017-ndc-02... · 2018-08-29 · 3 Là, c’est de la physique! Balistique Pour le problème de la sagaie, les variables

49

Ce qui est ce que l’on cherche. On peut noter que le minimum vaut

V(Y )V(X)− Cov(X,Y )2

V(X)

Cette quantité est positive, par l’inégalité de CAUCHY–SCHWARZ et ne vaut 0 qu’en cas d’égalité dans cette inégalité,i.e. lorsque Y est fonction affine de X .

Pour trouver rapidement la formule de Y , on cherche a et b tels que Cov(X, Y ) = Cov(X,Y ) et E(Y ) = E(Y ).

1. Si Cov(X,Y ) = 0 (ρ(X,Y ) = 0), on dit que X et Y sont non corrélées.

2. Si ρ(X,Y ) > 0, on dit que X et Y sont positivement corrélées.

3. Si ρ(X,Y ) < 0, on dit que X et Y sont négativement corrélées.

Exercice 25.— Soit X ∼ U[0,1], Y = X2.1. Donner les valeurs de V(X), V(Y ), Cov(X,Y ).2. Donner une formule pour Y la régression linéaire de Y sur X .3. En Python, tirer 100 nombres xi suivant la loi de X de façon indépendante. Tracer les nuages de points (xi, yi) lenuage (xi, yi) et tracer la droite des moindres carrés calculée statistiquement.Correction Ex.–25

0.0 0.2 0.4 0.6 0.8 1.0x

0.4

0.2

0.0

0.2

0.4

0.6

0.8

1.0

y

Données

reg. lin. théo.moindres carrés stats

FIGURE 23: Une série de 20 nombres x tirés indépendamment suivant X ∼ U[0,1], Y = X2, les (xi, yi), les (xi, yi),la droite des moindres carrés du nuage (xi, yi)

Proposition 28. Si X et Y sont non corrélées, on a

V(X + Y ) = V(X) + V(Y )

Si X1, . . . , Xn sont deux à deux non corrélées, i.e.

∀i, j ∈ 1, . . . , n , i 6= j ⇒ Cov(Xi, Xj) = 0

alorsV(X1 + · · ·+Xn) = V(X1) + · · ·+ V(Xn)

Page 50: Notes de cours 02 - Freejcleger.math.free.fr/maths/2017/docs/2017-ndc-02... · 2018-08-29 · 3 Là, c’est de la physique! Balistique Pour le problème de la sagaie, les variables

50

3.3 Indépendance

Indépendance d’événements

Définition 29. Soit (Ω, T ,P) un espace probabilisé

1. Soit A,B ∈ T deux événements. On dit que A et B sont indépendants si P(A ∩B) = P(A)P(B).

2. Soit A1, . . . , An ∈ T une famille d’événements. On dit qu’ils sont (mutuellement) indépendants si pour toutesous-famille Ai1 , . . . , Aik , i1 < i2 < · · · < ik,

P(Ai1 ∩ · · · ∩Aik) = P(Ai1) ∩ . . .P(Aik)

3. Soit A1, . . . , An, · · · ∈ T une famille (infinie) d’événements. On dit qu’ils sont (mutuellement) indépendantssi toute sous-famille finie est indépendante.

Exercice 26.— Montrer que si A et B sont indépendants, A et B le sont aussi.

Exercice 27.— Montrer que si A est indépendant de lui-même alors P(A) = 1 ou P(A) = 0.

V.a. indépendantes : deux définitions équivalentes

Définition 30 (Première définition). 1. Deux v.a.r X et Y sont indépendantes si pour tous intervalles I , J de R,

P(X ∈ I et Y ∈ J) = P(X ∈ I).P(Y ∈ J)

2. De façon analogue, les v.a.r X1, . . . , Xn sont dites (mutuellement) indépendantes si pour tous intervallesI1, . . . , In,

P(X1 ∈ I1 et . . . Xn ∈ In) = P(X1 ∈ I1) . . .P(Xn ∈ In)

Traduisons ceci en termes d’espérance en utilisant la relation fondamentale P(A) = E(11A).X et Y sont indépendantes si pour tous intervalles I et J ,

E(11X∈I.11Y ∈J) = E(11X∈I).E(11X∈J)

Prenons maintenant une fonction f de la forme f =∑K

k=1 fk11Ik et g =∑L

`=1 g`11J` où (Ik)1≤k≤K et (J`)1≤`≤Lsont deux familles finies d’intervalles de R. Un peu d’algèbre (on pourra tester avec des familles de deux intervalles)utilisant uniquement la linéarité de l’espérance montre que

E(f(X).g(Y )) = E(f(X)).E(g(Y ))

On a bien évidemment un énoncé similaire pour une famille X1, . . . , Xn de variables indépendantes en prenantdes fonctions f1, . . . , fn en escalier sur R :

E(

n∏ν=1

fν(Xν)) =

n∏ν=1

E(fν(Xν))

Définition 31 (Deuxième définition équivalente). 1. Deux v.a.r X et Y sont indépendantes si pour toutes fonc-tions f, g : R→ R

E(f(X).g(Y )) = E(f(X)).E(g(Y ))

pourvu que ces espérances soient bien définies.

2. De façon analogue, les v.a.r X1, . . . , Xn sont dites (mutuellement) indépendantes si pour toutes fonctionsf1, . . . , fn : R→ R,

E(n∏ν=1

fν(Xν)) =n∏ν=1

E(fν(Xν))

dès que cette formule à un sens.

Page 51: Notes de cours 02 - Freejcleger.math.free.fr/maths/2017/docs/2017-ndc-02... · 2018-08-29 · 3 Là, c’est de la physique! Balistique Pour le problème de la sagaie, les variables

51

Lemmes d’indépendanceOn a les résultats suivants

Lemme 32 (des coalitions). Si X1, . . . , Xn, Y1, . . . , Yp sont indépendantes et si u : Rn → R, v : Rp → R alors, enposant

U := u(X1, . . . , Xn) et V := v(Y1, . . . , Yp),

les variables U et V sont indépendantes.

Lemme 33. Si X1, . . . , Xn sont indépendantes et si u1, . . . , un : R→ R alors, en posant

U1 := u1(X1), . . . Un := un(Xn),

les variables U1, . . . , Un sont indépendantes.

Exercice 28.— Soit E une. v.a.r à valeurs dans ]0,+∞[ admettant une variance, α une v.a.r à valeurs dans]0, π2

[,

m > 0, g > 0 deux constantes. On suppose que E et α sont indépendantes.On pose D = E. sin(2α)

m.g la distance parcourue par une sagaie lancée avec énergie (cinétique) initiale E et anglede tir α. On pose S = sin(2α).1. Montrer que S est à valeurs dans ]0, 1] et admet une variance.2. Exprimer l’espérance de D en fonction de m, g, E(E) et E(S).3. Exprimer la variance de D en fonction de m, g, E(E), E(S), V(E) et V(S).4. Montrer la formule (propagation de l’incertitude relative en physique)

V(D)

E(D)2=

V(E)

E(E)2.V(S)

E(S)2+

V(E)

E(E)2+

V(S)

E(S)2

Ces quantités dépendent-elles de m et g ?5. (Optionnel). Calculer E(S), V(S) sous l’hypothèse α ∼ U]0,π2 [.

Exercice 29.— Un chasseur dispose d’une seule sagaie (de masse m = 1kg), la cible est un troupeau de bisons àune distance entre 20 et 30m.

Il développe au lancer une énergie E comprise entre Emin = 100J et Emax = 700J , qu’il ne contrôle pas.Son angle de tir α, lui même incontrolé, est compris entre π

8 et 3π8 .

Comme notre individu ne contrôle rien (il ne va pas survivre longtemps), on suppose qu’énergie et angle de tirsont indépendants.1. Que valent espérance et écart-type de la distance (on arrondira aux entiers les plus proches) à laquelle la sagaieest lancée ? Quelle information obtient-on en appliquant l’inégalité de BIENAYMÉ–TCHEBYCHEFF au seuil de deuxécarts-types ?

Indication:On rappelle qu’avec une énergie de lancer E, un angle de tir α, le point d’impact est à distance d = E. sin(2α)m.g .

On pourra interpréter « incontrolé » comme une uniformité dans le tirage au sort.2. Tracer l’histogramme de la distance pour NS = 100000 simulations de lancer. (Faire 50 « bins »).3. Evaluer numériquement la probabilité de toucher un animal. Vérifier la cohérence de moyenne et écart-type de vossimulations avec espérance et écart-type théoriques.

Corrélation et indépendance

Proposition 34. 1. Si X et Y sont deux variables de carré intégrable indépendantes, elles sont non corrélées :Cov(X,Y ) = 0.

2. La réciproque est très fausse, contrairement à ce que croit le monde entier.

Démonstration. 1. SiX et Y sont indépendantes, en prenant f(x) = x−E(X) et g(y) = y−E(Y ), f(X).G(Y ),f(X), g(Y ) sont intégrables et on a donc par indépendance Cov(X,Y ) = E(f(X).g(Y )) = E(f(X))E(g(Y )) =0

Page 52: Notes de cours 02 - Freejcleger.math.free.fr/maths/2017/docs/2017-ndc-02... · 2018-08-29 · 3 Là, c’est de la physique! Balistique Pour le problème de la sagaie, les variables

52

2. Prenons un exemple assez élémentaire. SoitX une v.a.r uniformément distribuée sur l’ensemble fini −1, 0,+1et Y = X2. On a alors

E(X) = 0, E(Y ) =2

3, E(XY ) = E(X3) = 0 et Cov(X,Y ) = 0

Ces deux variables ne sont pas indépendantes car

P(X = 1 et Y 2 = 1) = P(X = 1) =1

3, P(X = 1)P(Y 2 = 1) =

2

9

3.4 Probabilités conditionnelles

Ce qui a été dit dans la section de rappels de première année, s’applique tel quel au cadre théorique général. On anotamment un renforcement de la formule des probabilités totales énoncée en termes de probabilités conditionnelles.Nous nous en servirons dans le chapitre sur les variables discrètes, à la fin de l’année.

Théorème 35. Si B1, . . . , Bn, . . . est une famille (possiblement indexée par n ∈ N∗ d’événements formant unsystème complet d’événements incompatibles, alors, pour tout événement A

P(A) = P(A|B1).P(B1) + · · ·+ P(A|Bn).P(Bn) + . . .

= limN→+∞

N∑n=1

P(A|Bn).P(Bn)

Rq : Si P(Bn) = 0, la probabilité conditionnelle P(A|Bn) n’est pas bien définie. On prend cependant la conven-tion P(A|Bn).P(Bn) = 0 (Zéro super absorbant) dans la formule.

Exercice 30.— Soit ε une v.a. uniformément distribuée sur −1,+11. Soit U ∼ U[0,1]. On suppose que U et ε sont indépendantes et on pose V = ε.U . Montrer que V ∼ U[−1,1].

Indication:Pour un intervalle I de R quelconque, calculer P(V ∈ I) en conditionnant sur les valeurs de ε.3. Soit W une v.a.r telle que

1. Sachant ε = +1, W est uniformément distribuée sur [0, 1],

2. sachant ε = −1, W est uniformément distribuée sur [−1, 0],

3.a. Montrer que W ∼ U[−1,1].Indication:Comme précédemment, calculer P(W ∈ I) en conditionnant sur les valeurs de ε, la difficulté est de traduire les

« sachant », i.e. le concept de loi conditionnelle3.b. Montrer que |W | = ε.W ∼ U[0,1] et que |W | et ε sont indépendantes.

Lois conditionnelles, Simulation informatiqueLes modèles probabilistes décrivant un problème physique sont spécifiés via la donnée de variables aléatoires

fondamentales et les relations qu’elles entretiennent entre elles :

1. On peut imposer des relations fonctionnelles, par exemple Z = f(X,Y ) ;

2. on peut imposer de l’indépendance ;

3. on peut donner des lois conditionnelles.

C’est ce dernier point que l’on développe maintenant.Donnons un exemple simple de mélange de populations. Une population de drosophiles est composée à p%

d’individus ailés et q% d’individus possédant des ailes légèrement atrophiées et r% des ailes vestigiales, inutiles. Ona p+ q + r = 1. On s’intéresse à leur durée de vie V .

Page 53: Notes de cours 02 - Freejcleger.math.free.fr/maths/2017/docs/2017-ndc-02... · 2018-08-29 · 3 Là, c’est de la physique! Balistique Pour le problème de la sagaie, les variables

53

1. Sachant qu’une drosophile est normalement ailée, sa durée de vie V (en heures) suit une loi uniforme 26 sur[0, 100] ;

2. Sachant qu’une drosophile a des ailes atrophiées, sa durée de vie V (en heures) suit une loi uniforme sur[0, 75] ;

3. Sachant qu’une drosophile a des ailes vestigiales, sa durée de vie V (en heures) suit une loi uniforme sur[0, 50] ;

On prend une drosophile au hasard (uniforme sur la population), quelle est la loi de la durée de vie ? Son espérance ?Comment simule-t-on une telle variable aléatoire ?

Commençons par la simulation informatique. On peut définir des variables aléatoires (informatique), Vn(), resp.Va(), resp. Vv(), retournant une durée de vie dans le cas normalement ailé, resp. atrophié, resp. vestigial. Ce sontdes tirages uniformes simples.

Pour définir la variable aléatoire (informatique), V(p) retournant une durée de vie de drosophile pour notrepopulation, il suffit de

1. Tirer au sort le type d’aile que la drosophile porte en respectant les paramètres p, q, r.

2. suivant les cas, normalement ailé, resp. atrophié, resp. vestigial, retourner la valeur calculée par Vn(),resp.Va(), resp. Vv().

Listing 3: python/droso-conditionnelles.pyimport numpy as np

def Vn(): #Simule temps de vie, cas normal. ailéreturn 100*np.random.rand()

def Va(): #Simule temps de vie, cas atrophiéreturn 75*np.random.rand()

def Vv(): #Simule temps de vie, cas vestigialreturn 50*np.random.rand()

global aile_n;aile_n=0 #définit les codesglobal aile_a;aile_a=1global aile_v;aile_v=2

def T(p,q): # retourne le type d’aile dans pop. de param. p,qu=np.random.rand()if u<=p: #Si celle tirée au sort est ailée

return aile_nelif u<=p+q: #Si celle tirée au sort est atrophiée

return aile_areturn aile_v #sinon retourne temps pour vestigiale

def V(p,q): #Simule temps de vie, cas d’une population de param. p,qt=T(p,q) #On tire le type d’aile#Sachant le type, on peut retourner une valeur tirée suivant loi adéquateif t==aile_n:

return Vn() #temps pour normalement aileeif t==aile_a:

return Va() #temps pour atrophiéeif t==aile_v:

return Vv() #temps pour vestigiale

26. Cette hypothèse n’est pas biologiquement raisonnable, l’exemple ne vaut que pour illustrer le propos

Page 54: Notes de cours 02 - Freejcleger.math.free.fr/maths/2017/docs/2017-ndc-02... · 2018-08-29 · 3 Là, c’est de la physique! Balistique Pour le problème de la sagaie, les variables

54

Pour mener les calculs, introduisons les v.a. appropriées. Soit T la v.a donnant le type de la drosphile tirée ausort. T est à valeurs dans l’ensemble fini norm. ailé, atrophié, vestigial = n, a, v. On suppose T distribuée àl’aide des proportions dans la population, i.e.

P(T = n) = p, P(T = a) = q et P(T = v) = r

Concernant l’espérance, on peut mener un calcul basé sur le principe des espérances conditionnelles, en condi-tionnant sur la valeur de T

E(V ) = E(V |T = n)P(T = n) + E(V |T = a)P(T = a) + E(V |T = v)P(T = v)

= 100p+ 75q + 50r

Si on ne connait pas ce principe (HP), on peut tout de même s’en sortir en suivant ce que fait la simulationinformatique. Soit U une v.a. uniforme sur [0, 1], indépendante de T et Gn, Ga et Gv trois fonctions telles queV n = Gn(U), resp. V a = Ga(U), resp. V v = Gv(U), a pour loi la loi conditionnelle de V sachant la drosophilenormale ailée, resp. atrophiée, resp. vestigiale. On pose alors (définition d’une fonction sur Ω en trois morceaux)

V =

Gn(U) sur T = nGa(U) sur T = aGv(U) sur T = v

Cette v.a.r V a les lois conditionnelles voulues. On a alors, en remarquant que

11 = 11T=n + 11T=a + 11T=v

et que11T=n.V = 11T=n.Gn(U), 11T=a.V = 11T=a.Ga(U) et 11T=v.V = 11T=v.Gv(U)

que

E(V ) = E(11.V ) = E(11T=n.V + 11T=a.V + 11T=v.V )

= E(11T=n.V ) + E(11T=a.V ) + E(11T=v.V )

= E(11T=n.Gn(U)) + E(11T=a.Gn(U)) + E(11T=v.Gn(U))

Comme, par indépendance de T et U ,

E(11T=n.Gn(U)) = E(11T=n).E(Gn(U)) = p.50

et similairement pour les autres termes de la somme, on a le résultat attendu.Concernant la loi de V , le résultat sera plus facilement exprimable à l’issue du prochain chapitre mais on peut

donner la formule de transfert générique pour V en effectuant un calcul similaire au précédent, pour une fonctionh : R→ R positive ou telle que E(h(V )) admet une espérance, on a

E(h(V )) =

∫ +∞

−∞h(v).δV (v) dv

δV (v) =

p

100 + q75 + r

50 si 0 ≤ v ≤ 50p

100 + q75 si 50 < v ≤ 75

p100 si 75 < v ≤ 100

0 sinon

Page 55: Notes de cours 02 - Freejcleger.math.free.fr/maths/2017/docs/2017-ndc-02... · 2018-08-29 · 3 Là, c’est de la physique! Balistique Pour le problème de la sagaie, les variables

55

En effet, introduisons, comme dans le calcul de E(V ) les variables T , U et les fonctions Gn, Ga et Gv. On aalors, en remarquant que

11T=n.h(V ) = 11T=n.h(Gn(U)), 11T=a.h(V ) = 11T=a.h(Ga(U)) et 11T=v.h(V ) = 11T=v.h(Gv(U))

que

E(h(V )) = E(11T=n.h(Gn(U))) + E(11T=a.h(Gn(U))) + E(11T=v.h(Gn(U)))

Comme, par indépendance de T et U ,

E(11T=n.h(Gn(U))) = E(11T=n).E(h(Gn(U))) = p.1

100

∫ 100

0h(v) dv

et similairement pour les autres termes de la somme,

E(11T=a.h(Ga(U))) = q.1

75

∫ 75

0h(v) dv = q.

1

75

∫ 100

0h(v).110≤v≤75 dv

et

E(11T=v.h(Gv(U))) = r.1

50

∫ 50

0h(v) dv = r.

1

50

∫ 100

0h(v).110≤v≤50 dv

En regroupant les termes, on obtient

E(h(V )) =

∫ 100

0h(v)

( p

100+

q

75110≤v≤75 +

r

50110≤v≤50

)dv

Ce qui peut se traduire facilement en le résultat attendu.