PolyTunis A Perrut PDF
PolyTunis A Perrut PDF
PolyTunis A Perrut PDF
A. Perrut
contact : Anne.Perrut@univ-lyon1.fr
2
Table des matières
1 Le modèle probabiliste 5
1.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.2 Espace des possibles, événements . . . . . . . . . . . . . . . . . . . . . . . . 6
1.3 Probabilité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.4 Indépendance et conditionnement . . . . . . . . . . . . . . . . . . . . . . . . 9
1.5 Répétitions indépendantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.6 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
4 Théorèmes limites 39
4.1 Loi des grands nombres . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
4.2 Théorème central limite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
4.3 Intervalles de confiance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
4.4 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
3
4 TABLE DES MATIÈRES
5 Tests statistiques 47
5.1 Tests d’hypothèses . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
5.2 Test d’ajustement du chi-deux . . . . . . . . . . . . . . . . . . . . . . . . . 49
5.3 Test d’indépendance du chi-deux . . . . . . . . . . . . . . . . . . . . . . . . 52
5.4 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
A Cardinaux et dénombrement 57
B Tables statistiques 61
B.1 Fonction de répartition de la loi normale centrée réduite . . . . . . . . . . . 61
B.2 Fractiles de la loi normale centrée réduite . . . . . . . . . . . . . . . . . . . 63
B.3 Fractiles de la loi du χ2 (ν = nombre de degrés de liberté) . . . . . . . . . . 64
Le modèle probabiliste
1.1 Introduction
Les probabilités vont nous servir à modéliser une expérience aléatoire, c’est-à-dire
un phénomène dont on ne peut pas prédire l’issue avec certitude, et pour lequel on décide
que le dénouement sera le fait du hasard.
Exemples :
- l’enfant à naı̂tre sera une fille,
- l’équipe de l’OL va battre l’OM lors du prochain match qui les opposera,
- le dé va faire un nombre pair.
La première tâche qui vous attend est de décrire les différentes issues possibles de
cette expérience aléatoire. Puis on cherche à associer à chacune de ces éventualités un
nombre compris entre 0 et 1 qui mesure la chance qu’elles ont de se réaliser. Comment
interpréter/fixer ce nombre, appelé probabilité ? Il existe plusieurs manières de voir.
- Proportion :
On lance un dé. Quelle est la probabilité de A=”obtenir un chiffre pair”? Chaque face du
dé a la même chance, et il y en a 6. Quant aux chiffres pairs, ils sont 3. D’où, intuitivement,
P (A) = 63 = 1/2.
- Fréquence :
Un enfant est attendu. Quelle est la probabilité que ce soit une fille ? On a observé un
grand nombre de naissances. Notons kn le nombre de filles nées en observant n naissances.
Alors
kn
P (fille) = lim
n→+∞ n
5
6 CHAPITRE 1. LE MODÈLE PROBABILISTE
Attention aux valeurs des probabilités ! Elles sont choisies de manière arbitraire par le
modélisateur et il faut les manipuler avec soin.
On étudie une expérience aléatoire. L’espace des possibles ou univers décrit tous
les résultats possibles de l’expérience. Chacun de ces résultats est appelé événement
élémentaire. On note souvent l’espace des possibles Ω et un résultat élémentaire ω. Un
événement est un sous-ensemble de Ω, ou une réunion d’événements élémentaires. On dit
qu’un événement est réalisé si un des événements élémentaires qui le constitue est réalisé.
Les événements sont des ensembles, représentés souvent par des lettres capitales.
Exemples :
- Match OL-OM : Ω = {OL gagne, OM gagne, match nul}. Donc Ω est composé de trois
événements élémentaires. On peut considérer par exemple l’événement qui correspond à
“Lyon ne gagne pas”.
- On lance un dé : Ω = {1, 2, ..., 6}. On peut s’intéresser à l’événement A=“on obtient un
chiffre pair”, ie A = {2, 4, 6}.
- On lance deux dés : Ω = {1, ..., 6} × {1, ..., 6} = {(i, j) : 1 ≤ i ≤ 6, 1 ≤ j ≤ 6}. Ici, un
événement élémentaire ω est un couple (i, j), où i représente le résultat du premier dé et
j celui du second.
- On lance trois fois une pièce de monnaie. Les événements élémentaires vont décrire le plus
précisément possible le résultat de cette expérience. Donc un événement élémentaire ω est
un triplet (r1 , r2 , r3 ) qui donne les résultats des trois lancers (dans l’ordre). L’événement
B : “on obtient pile au deuxième lancer” est
L’événement B est réalisé si on obtient l’un des événements élémentaires listés ci-avant. Il
n’est parfois pas nécessaire de connaı̂tre tous ces détails. On pourra choisir : ω représente
le nombre de “face” obtenus. Alors, Ω = {0, 1, 2, 3}. Le modèle est beaucoup plus simple,
mais ne permet pas de décrire des événements tels que B.
1.3 Probabilité
Définition 1 Une probabilité est une application sur P(Ω), l’ensemble des parties de Ω,
telle que :
- 0 ≤ P (A) ≤ 1, pour tout événement A ⊂ Ω
X
- P (A) = P (ω), pour tout événement A
ω∈A
X
- P (Ω) = P (ω) = 1
ω∈Ω
Définition 3 Soit une expérience aléatoire et Ω l’espace des possibles associé. Une pro-
babilité sur Ω est une application, définie sur l’ensemble des événements, qui vérifie :
- axiome 1 : 0 ≤ P (A) ≤ 1, pour tout événement A
- axiome 2 : pour toute suite d’événements (Ai )i∈N , deux à deux incompatibles,
³[ ´ X
P Ai = P (Ai )
i∈N i∈N
- axiome 3 : P (Ω) = 1
NB : les événements (Ai )i∈N sont deux à deux incompatibles, si pour tous i 6= j, Ai ∩Aj = ∅.
Exemple important : probabilité uniforme
Soit Ω un ensemble fini. Il arrive, comme quand on lance un dé équilibré, que les événe-
ments élémentaires ont tous la même probabilité. On parle alors d’événements élémentaires
équiprobables. Notons p la probabilité de chaque événement élémentaire. Alors
X X
1 = P (Ω) = P (ω) = p = p × card(Ω)
ω∈Ω ω∈Ω
1
D’où p = P (ω) = , pour tout ω. La probabilité ainsi définie sur l’ensemble Ω
card(Ω)
s’appelle probabilité uniforme. La probabilité d’un événement A se calcule facilement :
X card(A)
P (A) = P (ω) =
card(Ω)
ω∈A
Attention ! Cette formule n’est valable que lorsque les événements élémentaires
sont bien équiprobables. Dans ce cas, il suffit de savoir calculer le cardinal des ensembles
considérés pour calculer les probabilités.
1.4. INDÉPENDANCE ET CONDITIONNEMENT 9
Définition 5 Étant donnés deux événements A et B, avec P (A) > 0, on appelle pro-
babilité de B conditionnellement à A, ou sachant A, la probabilité notée P (B|A) définie
par
P (A ∩ B)
P (B|A) =
P (A)
On peut écrire aussi P (A ∩ B) = P (B|A)P (A).
Exemple 6 Une urne contient r boules rouges et v boules vertes. On en tire deux, l’une
après l’autre (sans remise). Quelle est la probabilité d’avoir deux boules rouges ?
Choisissons Ω qui décrit les résultats de l’expérience précisément.
Un événement élémentaire est un couple (x, y) où x est la couleur de la première boule
tirée et y la couleur de la seconde.
Soit A l’événement “la première boule est rouge” et B l’événement “la seconde boule est
rouge”.
r−1 r
P (A ∩ B) = P (B|A)P (A) = ·
r+v−1 r+v
Proposition 7 (Formule des probabilités totales) Soit A un événement tel que 0 <
P (A) < 1. Pour tout événement B, on a
P (B) = P (B ∩ A) + P (B ∩ Ac )
Exemple 6 (suite) : quelle est la probabilité pour que la seconde boule tirée soit rouge ?
On garde le même formalisme.
Définition 8 Soit (Ai )i∈I une famille d’événements. On l’appelle partition de Ω si elle
vérifie les deux conditions :
(i) ∪i∈I Ai = Ω
(ii) les Ai sont deux à deux incompatibles : pour tous i 6= j, Ai ∩ Aj = ∅.
Proposition 9 (Formule des probabilités totales généralisée) Soit (Ai )i∈I une par-
tition de Ω, telle que P (Ai ) > 0, pour tout i ∈ I. Alors, pour tout événement B,
X
P (B) = P (B|Ai )P (Ai )
i∈I
La formule des probabilités totales permet de suivre les étapes de l’expérience aléatoire
dans l’ordre chronologique. Nous allons maintenant voir une formule à remonter le temps...
Proposition 10 (Formule de Bayes) Soit A et B deux événements tels que 0 < P (A) <
1 et P (B) > 0. Alors,
P (B|A)P (A)
P (A|B) =
P (B|A)P (A) + P (B|Ac )P (Ac )
preuve :
P (A ∩ B) P (B|A)P (A)
P (A|B) = =
P (B) P (B)
et on conclut en remplaçant P (B) par son expression donnée par la formule des probabilités
totales. ¤
Proposition 11 (Formule de Bayes généralisée) Soit (Ai )i∈I une partition de Ω, telle
que P (Ai ) > 0, pour tout i ∈ I. Soit un événement B, tel que P (B) > 0. Alors, pour tout
i ∈ I,
P (B|Ai )P (Ai )
P (Ai |B) = P
j∈I P (B|Aj )P (Aj )
1.5. RÉPÉTITIONS INDÉPENDANTES 11
P (F |TA )P (TA )
P (TA |F ) =
P (F |TA )P (TA ) + P (F |TB )P (TB )
0.052 ∗ 1/3
= = 0.279
0.052 ∗ 1/3 + 0.067 ∗ 2/3
P (A ∩ B) = P (A)P (B)
1 1
P (ω) = P ((x, y)) = = = PE ({x})PF ({y})
card(Ω) np
Comme on a la probabilité uniforme sur {P, F } et sur {1, ..., 6}, on a finalement la proba-
bilité uniforme sur Ω et
1
∀ω ∈ Ω, P (ω) = = 1/12
card(Ω)
Le chevalier de Méré :
le Chevalier de Méré avait constaté qu’il obtenait plus souvent 11 que 12 avec trois dés.
Pourtant, le nombre de combinaisons dont la somme fait 12 est le même que le nombre de
combinaisons dont la somme fait 11. Alors ?
1.6 Exercices
Exercice 1 – Proposer un univers Ω pour les expériences aléatoires suivantes et dénombrer
les résultats possibles :
1) On lance un dé.
2) On lance 2 dés.
3) On tire trois cartes dans un jeu .
4) On place les 5 lettres qui forment “proba” au hasard sur une réglette de Scrabble.
5) On place les 6 lettres qui forment “erreur” au hasard sur une réglette de Scrabble.
Calculer P (B), P (A ∩ B c ), P (B ∩ Ac ).
Exercice 3 – Supposons que les faces d’un dé sont truquées de telle manière que les numé-
ros impairs ont chacun la même chance d’apparaı̂tre, chance qui est deux fois plus grande
que pour chacun des numéros pairs. On jette le dé. Quelle est la probabilité d’obtenir un
nombre supérieur ou égal à 4 ?
Exercice 4 – Un parking contient douze places alignées. Huit voitures s’y sont garées au
hasard, et l’on observe que les quatre places libres se suivent. Est-ce surprenant ?
1.6. EXERCICES 13
Exercice 5 — La probabilité qu’un objet fabriqué à la chaı̂ne ait un défaut est de 0, 01.
Trouver la probabilité que, dans un lot de 100 objets, il y ait au moins un objet défectueux.
Quelle est la probabilité qu’il y ait, dans un tel lot, exactement un objet défectueux ?
Exercice 7 — Un nouveau vaccin a été testé sur 12500 personnes ; 75 d’entre elles, dont 35
femmes enceintes, ont eu des réactions secondaires nécessitant une hospitalisation. Parmi
les 12500 personnes testées, 680 personnes sont des femmes enceintes.
1. Quelle est la probabilité pour une femme enceinte, d’avoir une réaction secondaire si
elle reçoit un vaccin ?
2. Quelle est la probabilité pour une personne non enceinte, d’avoir une réaction secon-
daire ?
Exercice 8 — Dans une usine, la machine A fabrique 60% des pièces, dont 2% sont
défectueuses.
La machine B fabrique 30% des pièces, dont 3% sont défectueuses.
La machine C fabrique 10% des pièces, dont 4% sont défectueuses.
1. On tire une pièce au hasard dans la fabrication. Quelle est la probabilité qu’elle soit
défectueuse ?
2. On tire une pièce au hasard dans la fabrication. Elle est défectueuse. Quelle est la
probabilité qu’elle ait été fabriquée par la machine A ? par la machine B ? par la machine
C?
Exercice 9 — Dans une jardinerie : 25% des plantes ont moins d’un an, 60% ont de 1
à 2 ans, 25% ont des fleurs jaunes, 60% ont des fleurs roses, 15% ont des fleurs jaunes et
moins d’un an, 3% ont plus de 2 ans et n’ont ni fleurs jaunes, ni fleurs roses. 15% de celles
qui ont de 1 à 2 ans, ont des fleurs jaunes, 15% de celles qui ont de 1 à 2 ans, n’ont ni
fleurs jaunes ni fleurs roses. On suppose que les fleurs ne peuvent pas être à la fois jaunes
et roses.
On choisit une plante au hasard dans cette jardinerie.
1. Quelle est la probabilité qu’elle ait moins d’un an et des fleurs roses ?
2. Quelle est la probabilité qu’elle ait des fleurs roses, sachant qu’elle a plus de 2 ans ?
3. Quelle est la probabilité qu’elle ait plus de deux ans et des fleurs jaunes ?
14 CHAPITRE 1. LE MODÈLE PROBABILISTE
Exercice 10 — Deux chauffeurs de bus se relaient sur la même ligne. Lors d’une grève,
le premier a 60% de chances de faire grève et le second 80%. Pendant la prochaine grève,
quelle est la probabilité pour qu’un seul des deux chauffeurs fasse grève ?
Exercice 11 — Une loterie comporte 500 billets dont deux seulement sont gagnants.
Combien doit-on acheter de billets pour que la probabilité d’avoir au moins un billet
gagnant soit supérieure ou égale à 0.5 ?
Exercice 12 — 1. Dans une classe de 36 élèves, quelle est la probabilité pour que deux
élèves au moins soient nés le même jour ? (on considèrera que l’année compte 365 jours,
et que toutes les dates d’anniversaires sont indépendantes et équiprobables).
2. Généraliser ce résultat pour une classe de n élèves. Tracer le résultat obtenu.
Chapitre 2
Le travail sur les événements devient vite fastidieux, ainsi nous allons maintenant nous
restreindre à étudier des grandeurs numériques obtenues pendant l’expérience aléatoire.
2.1 Définitions
Définition 17 Une variable aléatoire (v.a.) X est une fonction définie sur l’espace fon-
damental Ω, qui associe une valeur numérique à chaque résultat de l’expérience aléatoire
étudiée. Ainsi, à chaque événement élémentaire ω, on associe un nombre X(ω).
Exemple 18 On lance trois fois une pièce et on s’intéresse au nombre X de fois ou PILE
apparaı̂t. Il y a deux manières de formaliser cette phrase. Tout d’abord, à chaque événement
élémentaire ω, on associe X(ω). Ainsi,
15
16 CHAPITRE 2. VARIABLES ALÉATOIRES DISCRÈTES
Une variable qui ne prend qu’un nombre dénombrable de valeurs est dite discrète, sinon,
elle est dite continue (exemples : hauteur d’un arbre, distance de freinage d’une voiture
roulant à 100 km/h). Les v.a. continues seront étudiées plus tard.
Définition 19 La loi d’une variable aléatoire discrète X est la liste de toutes les valeurs
différentes que peut prendre X avec les probabilités qui leur sont associées. On utilisera
souvent une formule, plutôt qu’une liste.
Exemple 18 : nous avons déjà la liste de tous les événements élémentaires et ils sont
équiprobables, de probabilité 1/8. D’après la composition des événements [X = k], pour
k = 0, ..., 3, on peut déduire facilement la loi de X.
valeur de X (événement) [X = 3] [X = 2] [X = 1] [X = 0]
composition de l’événement {PPP} {PPF,PFP,FPP} {PFF,FPF,FFP} {FFF}
probabilité 1/8 3/8 3/8 1/8
F (x) = P [X ≤ x]
Exemple : X est le nombre de Face quand on lance trois fois une pièce. On a vu que la loi
de X est
D’où,
0 si x < 0,
1/8 si 0 ≤ x < 1,
F (x) = 4/8 si 1 ≤ x < 2,
7/8 si 2 ≤ x < 3,
1 si x≥3
Remarque : deux v.a. ayant même loi ont même fonction de répartition.
Pour une v.a. discrète, la fonction de répartition est une fonction en escalier, avec un saut
en chaque valeur k de X(Ω) et la hauteur de ces sauts est la probabilité P (X = k).
Une fois la loi d’une v.a. établie, on peut calculer, comme pour une série statistique,
un indicateur de position (l’espérance) et un indicateur de dispersion (la variance).
2.1. DÉFINITIONS 17
¤
Définition 24 La variance d’une v.a. discrète X est le réel positif
h i X
Var(X) = E (X − E[X])2 = (k − E[X])2 P [X = k] = E[X 2 ] − E[X]2
k
et l’écart-type de X est la racine carrée de sa variance.
Remarque : l’espérance n’a pas toujours un sens quand X(Ω) est infini. Dans ce cas, X a
une espérance si
X
|k|P (X = k) < ∞
k∈X(Ω)
L’espérance d’une v.a. est la moyenne des valeurs que peut prendre X, pondérée par les
probabilités de ces valeurs. On appelle souvent l’espérance tout simplement moyenne de
X : elle correspond à une valeur moyenne autour de laquelle sont réparties les valeurs que
peut prendre X. L’écart-type (ou la variance) mesure la dispersion de la v.a. X autour de
sa valeur moyenne E[X].
L’espérance et sa variance ne dépendent de X qu’à travers sa loi : deux variables qui ont
même loi ont même espérance, même variance.
Exemple 18 : nous avons la loi du nombre X de PILE quand on lance trois fois une pièce.
3
X 1 3 3 1 12 3
E[X] = kP [X = k] = 3 · +2· +1· +0· = =
8 8 8 8 8 2
k=0
3
X
2 2
Var(X) = E[X ] − E[X] = k 2 P [X = k] − E[X]2
k=0
µ !2
1 3 3 1 3
= 3 · + 22 · + 12 · + 02 · −
2
8 8 8 8 2
3
=
4
18 CHAPITRE 2. VARIABLES ALÉATOIRES DISCRÈTES
nbr de PILE [X = 3] [X = 2] [X = 1] [X = 0]
probabilité 0.125 0.375 0.375 0.125
fréquence observée 0.2 0.6 0.1 0.1
Quand le nombre d’essais augmente, les fréquences observées sont de plus en plus
proches des valeurs théoriques données par la loi de probabilité (preuve plus tard). C’est
pourquoi, quand on ne peut pas déterminer la loi d’une v.a. aussi facilement que dans
cet exemple, on considère que les fréquences empiriques (c’est-à-dire mesurées sur un
échantillon) sont des valeurs approchées des probabilités. Il n’en reste pas moins qu’il
ne faut pas assimiler ces deux objets, et bien comprendre la différence entre la moyenne
théorique, calculée à partir de la loi de probabilité, et la moyenne empirique, calculée à
partir de quelques observations.
Définition 25 Deux v.a. X et Y sont dites indépendantes si, pour tous i et j, les événe-
ments {X = i} et {Y = j} sont indépendants, ie
P [X = i, Y = j] = P [X = i]P [Y = j]
Proposition 26 (La formule des probabilités totales) Soient X et Y deux v.a.. Pour
tout i ∈ X(Ω),
X
P [X = i] = P [X = i|Y = j]P [Y = j]
j∈Y (Ω)
preuve : on peut appliquer la formule des probabilités totales 9 car les événements Y = j
forment une partition de Ω. ¤
Exemple 27 On lance deux dés équilibrés et on note X et Y les deux chiffres obtenus.
Soit Z = X + Y . Quelle est la loi de Z ?
2.2. INDÉPENDANCE ET CONDITIONNEMENT 19
Méthode 1 : bien sûr, dans ce cas fini, on peut faire un tableau à double entrée avec la
valeur que prend X, la valeur que prend Y et la valeur de Z.
X\Y 1 2 3 4 5 6
1 2 3 4 5 6 7
2 3 4 5 6 7 8
3 4 5 6 7 8 9
4 5 6 7 8 9 10
5 6 7 8 9 10 11
6 7 8 9 10 11 12
Les deux dés ne se téléphonent pas avant de décider sur quelle face ils vont tomber : leurs
résultats sont indépendants. Donc
6
X
P [Z = j] = P [Z = j|X = i]P [X = i]
i=1
6
1X
= P [X + Y = j|X = i]
6
i=1
6
1X
= P [Y = j − i|X = i]
6
i=1
X6
1
= P [Y = j − i]
6
i=1
et il vient
X
E[X + Y ] = (x + y)P (X = x, Y = y)
x,y
X X
= xP (X = x, Y = y) + yP (X = x, Y = y)
x,y x,y
X X
= xP (X = x) + yP (Y = y) = E[X] + E[Y ]
x y
Pour le second point, on montre tout d’abord que E(XY ) = E(X)E(Y ), la suite venant
facilement. Ainsi,
X
E[XY ] = xyP (X = x, Y = y)
x,y
X
= xyP (X = x)P (Y = y)
x,y
µX ¶µ X ¶
= xP (X = x) yP (Y = y)
x y
= E(X)E(Y )
P [Y = 1] = p, P [Y = 0] = q = 1 − p
On dit alors que Y suit une loi de Bernoulli de paramètre p, notée B(p). La v.a. Y a
pour espérance p et pour variance p(1 − p). En effet, E[Y ] = 0 × (1 − p) + 1 × p = p et
Var(Y ) = E[Y 2 ] − E[Y ]2 = E[Y ] − E[Y ]2 = p(1 − p).
Un schéma de Bernoulli est la répétition n fois de la même épreuve dans les mêmes
conditions.
Schéma de Bernoulli :
1) Chaque épreuve a deux issues : succès [S] ou échec [E].
2) Pour chaque épreuve, la probabilité d’un succès est la même, notons P (S) = p et
P (E) = q = 1 − p.
3) Les n épreuves sont indépendantes : la probabilité d’un succès ne varie pas, elle ne
dépend pas des informations sur les résultats des autres épreuves.
2.3. SCHÉMA DE BERNOULLI ET LOI BINOMIALE 21
Soit X la v.a. qui représente le nombre de succès obtenus lors des n épreuves d’un
schéma de Bernoulli. Alors on dit que X suit une loi binomiale de paramètres (n, p),
notée B(n, p). Cette loi est donnée par :
µ ¶
n k
P (X = k) = p (1 − p)n−k pour tout 0 ≤ k ≤ n
k
¡ ¢
où nk = k!(n−k)!
n!
.
En effet, on peut tout d’abord observer que le nombre de succès est un entier nécessai-
rement compris entre 0 et le nombre d’épreuves n. D’autre part, l’événement {X = k}
est une réunion d’événements élémentaires et chacun de ces événements élémentaires est
une suite de longueur n de la forme ω =[SSES...E] avec k S et n − k E. Un tel événement
élémentaire a la probabilité
P (ω) = pk (1 − p)n−k
Proposition 29 Si X est une v.a. de loi B(n, p), l’espérance de X vaut np et sa variance
np(1 − p).
(preuve)
Exemple 30 (échantillon avec remise) On considère une population avec deux caté-
gories d’individus, A et B. On choisit de manière équiprobable un individu dans la popu-
lation. On note le résultat de l’épreuve, c’est-à-dire si l’individu appartient à la catégorie
A ou B. Puis on le remet dans le lot et on recommence : on choisit à nouveau un individu
dans la population... Cela constitue notre schéma de Bernoulli.
Supposons que les individus de la catégorie A sont en nombre NA dans la population qui
contient N individus. Alors pour chaque épreuve de Bernoulli, la probabilité d’avoir un
individu de la catégorie A (ce que nous appellerons un succès) est p = NA /N . Le nombre
d’individus, présents dans l’échantillon, qui appartiennent à la catégorie A est une va-
riable aléatoire, car sa valeur dépend du choix de l’échantillon, c’est-à-dire de l’expérience
aléatoire.
Quel est le nombre X d’individus de la catégorie A dans l’échantillon ? D’après ce qu’on
vient de voir, on est en présence d’un schéma de Bernoulli où NA /N est la probabilité de
succès et n est le nombre d’épreuves : une épreuve est le tirage d’un individu et un succès
correspond à l’événement “l’individu appartient à la catégorie A”. Donc X suit une loi
binomiale B(n, NA /N ).
22 CHAPITRE 2. VARIABLES ALÉATOIRES DISCRÈTES
Exemple 31 On s’intéresse à l’infection des arbres d’une forêt par un parasite. Soit p la
proportion d’arbres infectés. On étudie 4 arbres. Si un arbre est infecté, on dit qu’on a un
succès, sinon un échec. Soit X le nombre d’arbres infectés, parmi les 4. Alors X suit la
loi binomiale B(4, p).
¡¢
P (X = 0) = 40 q 4 = q 4 , Loi binomiale pour n=4, p=1/5
¡4¢ 1 3
P (X = 1) = 1 p q = 4pq 3 ,
0.4
¡¢
P (X = 2) = 42 p2 q 2 = 6p2 q 2 ,
0.3
¡¢
P (X = 3) = 43 p3 q 1 = 4p3 q,
probabilites
¡¢
0.2
P (X = 4) = 44 p4 = p4 .
Pour p = 1/5, on obtient les va-
0.1
leurs :
0.0
0 1 2 3 4
valeurs de X
Loi binomiale pour n=5, p=0.5 Loi binomiale pour n=10, p=0.5
0.20
0.25
probabilites
probabilites
0.15
0.10
0.05
0.00
0 1 2 3 4 5 0 2 4 6 8 10
valeurs de X valeurs de X
Loi binomiale pour n=10, p=0.2 Loi binomiale pour n=10, p=0.8
0.30
0.30
0.20
0.20
probabilites
probabilites
0.10
0.10
0.00
0.00
0 2 4 6 8 10 0 2 4 6 8 10
valeurs de X valeurs de X
Autrement dit, une v.a de loi B(n, p) est une somme de n v.a indépendantes de loi B(p).
2.4. TROIS AUTRES LOIS DISCRÈTES 23
On suppose que les résultats concernant les 15 objets sont indépendants. Soit X le nombre
d’objets résistants à la suite du nouveau traitement. Alors X suit une loi B(15, 0.5) et
P [X ≤ 6] = P [X = 0] + P [X = 1] + · · · + P [X = 6]
µ ¶ µ ¶ µ ¶ µ ¶ µ ¶ µ ¶ µ ¶´
1 ³ 15 15 15 15 15 15 15
= 15
+ + + + + +
2 0 1 2 3 4 5 6
1
= (1 + 15 + 105 + 455 + 1365 + 3003 + 5005)
215
= 0.304
où p est toujours la probabilité de succès des épreuves de Bernoulli. On dit alors que Y
suit la loi géométrique de paramètre p, notée G(p).
et
µX
∞ ¶0 µ ¶0
k 1 1
x = =
1−x (1 − x)2
k=0
D’où, pour x = 1 − p,
∞
X ∞
X
E[Y ] = kP [X = k] = p k(1 − p)k−1 = p/p2 = 1/p
k=1 k=1
Cette loi est une approximation de la loi binomiale quand np est petit et n grand (en
pratique, n ≥ 50 et np ≤ 10). Une v.a. X de loi de Poisson de paramètre λ, notée P(λ),
vérifie
λk
∀k ∈ N, P [X = k] = exp(−λ)
k!
L’espérance et la variance de X sont égales à λ.
On utilise la loi de Poisson pour modéliser le nombre de tâches qui arrivent à un serveur
informatique pendant une minute, le nombre de globules rouges dans un ml de sang, le
nombre d’accidents du travail dans une entreprise pendant un an...
Dans le cas de l’approximation de la loi binomiale par la loi de Poisson, le paramètre de
la loi de Poisson est λ = np.
Mis à part le prestige dû à son nom, la loi uniforme est la loi de l’absence d’information.
Supposons qu’une v.a. X prenne les valeurs 1,2,...,n, mais que nous n’ayons aucune idée
de la loi de probabilité de X ; dans ce cas, après justification, on peut affecter à chaque
valeur le même poids : 1/n. Et
1
∀k = 1, ..., n, P [X = k] =
n
n+1 (n + 1)(n − 1)
E[X] = et Var(X) =
2 12
2.5 Exercices
Exercice 2 — On lance deux dés. Modéliser l’expérience. Quelle est la probabilité pour
obtenir au moins un 4 ? Quelle est la probabilité pour que le plus petit donne un nombre
inférieur ou égal à 4 ? Quelle est l’espérance de la somme des deux dés ?
Exercice 3 — On admet que le nombre d’accidents survenant sur une autoroute quoti-
diennement est une va qui suit la loi de Poisson de paramètre λ = 3. Calculer P [X = k]
pour k = 0, ..., 6. Faire une représentation graphique. Quelle est la probabilité qu’il y ait
au moins 2 accidents lors d’un jour donné ?
Exercice 4 — Pour ces expériences aléatoires, donner les espaces fondamentaux Ω et les
probabilités qui les décrivent. Puis, pour chacune des variables aléatoires que l’on étudie,
préciser le nom de la loi, ses paramètres et donner l’expression de P (X = k).
a) On lance un dé 20 fois. Quelle est la loi du nombre de 5 obtenus ? Quelle est la proba-
bilité d’obtenir moins de 3 fois un 5 ?
b) Une urne contient une boule blanche et une boule noire. On prend dans cette urne une
boule au hasard, on la remet et on ajoute une boule de la même couleur. Quelle est la loi
du nombre de boules blanches dans l’urne ?
c) On recommence ce petit jeu. Quelle est la nouvelle loi du nombre de boules blanches
dans l’urne ? Donner aussi la loi du nombre de boules noires et son espérance.
d) Au bord de l’A7, un étudiant fait du stop. En cette saison, un vingtième des automo-
bilistes s’arrête pour prendre un stoppeur. Quelle est la loi du nombre de véhicules que
l’étudiant verra passer avant qu’il ne trouve un chauffeur ? Quelle est la probabilité qu’il
monte dans la quatrième voiture qui passe ? Quelle est la probabilité qu’il voit passer au
moins 6 voitures qui ne s’arrêtent pas ?
dans ce carreau ? Quelle est la probabilité pour qu’on trouve 5 sites dans ce carreau ? Plus
de 5 sites ?
Exercice 8 — Un filtre à particules reçoit un flux de particules, dont le nombre par unité
de temps suit une loi de Poisson de paramètre λ. Il filtre ce flux de telle sorte que les
particules non toxiques sont rejetées dans l’air. Ces particules non toxiques sont présentes
en proportion p dans le gaz originel. Quelle est la loi du nombre de particules rejetées dans
l’air par unité de temps ?
On utilise des v.a. discrètes pour compter des événements qui se produisent de manière
aléatoire, et des v.a. continues quand on veut mesurer des grandeurs “continues” (distance,
masse, pression...).
pression
Cette représentation graphique n’est pas pertinente : on regroupe les valeurs pour tracer
un histogramme.
Suivant le nombre de classes choisi, on obtient différents tracés. On peut imaginer de
raffiner encore en faisant d’autres mesures avec des instruments de mesure plus précis.
27
28 CHAPITRE 3. VARIABLES ALÉATOIRES CONTINUES
1.2
1.0
1.0
1.0
0.8
0.8
0.8
0.6
0.6
0.6
0.4
0.4
0.4
0.2
0.2
0.2
0.0
0.0
0.0
0.5 1.0 1.5 2.0 2.5 3.0 1.0 1.5 2.0 2.5 0.5 1.0 1.5 2.0 2.5 3.0
On aurait alors une courbe, d’aire 1 comme les histogrammes, qui représente la manière
dont sont réparties les valeurs de la v.a. X (voir les graphes et les données ci-dessus).
Cette courbe est la courbe d’une fonction appelée densité de probabilité ou simplement
densité. Une densité f décrit la loi d’une v.a. X en ce sens :
Z b
pour tous a, b ∈ R, P [a ≤ X ≤ b] = f (x)dx
a
et Z x
pour tout x ∈ R, F (x) = P [X ≤ x] = P [X < x] = f (u)du
−∞
On en déduit qu’une densité doit vérifier
Z
pour tout x ∈ R, f (x) ≥ 0 et f (x)dx = 1
R
P [x ≤ X ≤ x + ∆x] = f (x).∆x
quand cette intégrale a un sens. De plus, la variance de X est V ar(X) = E[X 2 ] − E[X]2 .
V ar(aX + b) = a2 V ar(X)
C’est la loi la plus importante. Son rôle est central dans de nombreux modèles probabilistes
et dans toute la statistique. Elle possède des propriétés intéressantes qui la rendent agréable
à utiliser.
Définition 39 Une v.a. X suit une loi normale (ou loi gaussienne ou loi de Laplace-
Gauss) N (0, 1) si sa densité f est donnée par
1 ³ x2 ´
f (x) = √ exp − , pour tout x ∈ R
2π 2
R
Remarque : vérifions que f est d’intégrale 1. Notons I = R f.
µZ ¶µ Z ¶
2
I = f (x)dx f (y)dy
R R
Z Z ³ x2 + y 2 ´
1
= exp − dxdy
2π R R 2
Rappel : si X suit une loi normale N (0, 1), alors pour tous a < b,
Z b ³ x2 ´
1
P [a ≤ X ≤ b] = √ exp − dx = ϕ(b) − ϕ(a)
2π a 2
où ϕ est la fonction de répartition de X. Rappelons que ϕ est une primitive de la densité f .
Mais il n’existe pas de forme analytique de la primitive de f . On doit donc lire les valeurs
de ϕ dans une table disponible en annexe B, ou la faire calculer par un logiciel adapté
(ex : excel, matlab, R).
La courbe de la densité de la loi normale N (0, 1) porte le nom de “courbe en cloche”.
Elle tend vers 0 en l’infini, est croissante sur R− , puis décroissante. Elle admet donc un
maximum en 0. On peut voir aussi qu’elle est symétrique, de centre de symétrie 0.
3.3. LA LOI NORMALE 31
−4 −2 0 2 4
preuve : le calcul de l’espérance est immédiat quand on a observé que xf (x) est une
fonction impaire. Le calcul de la variance se fait par une intégration par parties. Enfin,
montrons que X et −X ont même loi. Pour tous a, b ∈ R,
Z −a
P [a ≤ −X ≤ b] = P [−b ≤ X ≤ −a] = f (x)dx
−b
P [a ≤ −X ≤ b] = P [a ≤ X ≤ b]
P [a ≤ X ≤ b] = P [X ≤ b] − P [X ≤ a]
puis on lit les probabilités dans la table si a et b sont positifs. Pour trouver P [X ≤ −x]
quand x > 0, on utilise le fait que X et −X ont même loi :
P [X ≤ −x] = P [−X ≥ x] = P [X ≥ x] = 1 − P [X ≤ x]
32 CHAPITRE 3. VARIABLES ALÉATOIRES CONTINUES
P [−u ≤ X ≤ u] = 2P [X ≤ u] − 1
N(0,1)
N(0,3)
N(0,0.5)
0.6
0.4
0.2
0.0
−6 −4 −2 0 2 4 6
N(0,1)
N(2,1)
0.3
0.2
0.1
0.0
−4 −2 0 2 4 6
3.3. LA LOI NORMALE 33
X−m
Proposition 42 Si X suit une loi normale N (m, σ), Z = σ suit une loi normale
centrée réduite N (0, 1).
Proposition 43
E[X] = m et Var(X) = σ 2
On peut ainsi facilement se ramener à la loi normale centrée réduite. Comme la fonc-
tion de répartition ϕ de la loi normale centrée réduite est tabulée, on se ramènera même
systématiquement à cette loi pour calculer des probabilités. Plus précisément, si X est de
loi N (m, σ), et a et b sont deux réels, on calcule P [a ≤ X ≤ b] ainsi :
" # " #
a−m X −m b−m a−m b−m
P [a ≤ X ≤ b] = P ≤ ≤ =P ≤Z≤
σ σ σ σ σ
On peut aussi remarquer que si Z est de loi N (0, 1), alors −Z aussi et donc, pour u > 0,
P [−u ≤ Z ≤ u] = P [Z ≤ u] − P [Z ≤ −u] = P [Z ≤ u] − P [Z ≥ u]
= P [Z ≤ u] − (1 − P [Z ≤ u]) = 2P [Z ≤ u] − 1
Exemple : Soit X une v.a. de loi N (15, 4). Quelle est la probabilité P [10 ≤ X ≤ 22] ?
h 10 − 15 X − 15 22 − 15 i
P [10 ≤ X ≤ 22] = P ≤ ≤ = P [−1.25 ≤ Y ≤ 1.75]
4 4 4
où Y suit une loi N (0, 1). Ainsi,
Important
Soit Y une v.a. de loi N (0, 1).
P [−1 ≤ Y ≤ 1] = 0.6826
P [−2 ≤ Y ≤ 2] = 0.9544
P [−3 ≤ Y ≤ 3] = 0.9973
P [m − σ ≤ X ≤ m + σ] = 0.6826
P [m − 2σ ≤ X ≤ m + 2σ] = 0.9544
P [m − 3σ ≤ X ≤ m + 3σ] = 0.9973
Définition 44 Une v.a. X est dite de loi exponentielle E(λ) si sa densité est donnée par
(
0 si x < 0
f (x) =
λ exp(−λx) si x ≥ 0
De plus,
1 1
E[X] = , Var(X) =
λ λ2
Proposition 46 La loi exponentielle vérifie la propriété d’absence de mémoire. Soit X
un v.a. de loi exponentielle. Alors pour tous s, t > 0,
preuve :
Théorème 48 Soit U une v.a. de loi uniforme sur [0, 1]. Alors Y = F −1 (U ) a pour
fonction de répartition F .
P (F −1 (U ) ≤ x) = P (U ≤ F (x)) = F (x)
Exemple : pour simuler une réalisation d’une v.a. de la loi exponentielle E(λ), il suffit de
calculer − log(1 − u)/λ où u est un nombre uniformément réparti entre 0 et 1.
3.6 Exercices
Exercice 1 — Montrer que si X est une variable aléatoire de loi normale N (0, 1), alors
la variable aléatoire Z = σX + m suit une loi normale centrée réduite N (m, σ).
Exercice 3 — La largeur (en cm) d’une fente dans une pièce fabriquée en aluminium
est distribuée selon une loi normale de paramètres µ = 2 et σ = 0, 012. Les limites de
tolérance sont données comme étant 2, 000 ± 0, 012. Quel sera le pourcentage de pièces
défectueuses ?
P [X ≤ 3] = 0, 5517 et P [X ≥ 7] = 0, 0166
Exercice 5 — Dans une usine d’emballage, un automate remplit des paquets de café de
250g. On sait que l’automate verse en fait une quantité de café variable, régie par une
loi normale de moyenne réglable et d’écart-type 3. Quelle doit être la moyenne théorique
choisie pour que 90% des clients achètent bien au moins 250g de café ?
Exercice 6 — Dans ce problème, les durées des trajets sont supposées de loi normale.
1) Un directeur de société habite dans la ville A. Il part de chez lui à 8h45 et se rend
en voiture à son bureau qui ouvre à 9h. La durée de son trajet est, en moyenne, de 13
minutes, avec un écart-type de 3 minutes. Quelle est la probabilité que le directeur arrive
en retard ?
2) La secrétaire du directeur habite en A, elle va au bureau avec le train de 8h32 ; elle
3.6. EXERCICES 37
descend à la station B. Elle prend ensuite le bus qui part de B à 8h50 (sans attendre
le train), pour aller de B à son bureau. La durée du trajet en train a pour moyenne 16
minutes, pour écart-type 2 minutes, et la durée du trajet en bus a pour moyenne 9 minutes
et pour écart-type 1 minute. Les durées de trajet en train et en bus sont indépendantes.
Quelle est la probabilité que la secrétaire arrive à l’heure ?
3) Quelle est la probabilité pour que le directeur ou la secrétaire (c’est-à-dire l’un au
moins des deux) arrive à l’heure, les durées des trajets du directeur ou de la secrétaire
étant supposées indépendantes ?
Exercice 7 —Soit X une v.a. continue dont la densité est donnée par
(
a(9x − 3x2 ) pour 0 < x < 3
f (x) =
0 sinon
1) Calculer la constante a.
2) Déterminer P [X > 1] et P [1/2 < X < 3/2].
3) Quelle est la fonction de répartition de X ?
4) Calculer l’espérance et la variance de X.
Exercice 8 — Soit X une v.a. continue de loi uniforme sur [a, b], où a et b sont deux réels
√ √
positifs tels que a < b. Soient c et d positifs avec a < c < d < b. Écrire P [c < X 2 < d]
sous forme d’une intégrale entre c et d. En déduire la densité de la v.a. X 2 .
Exercice 9 — Soit X une v.a. de loi exponentielle E(1). Calculer P [X ≤ 2] et P [X > 0.5].
Déterminer la densité de Y = 3X. De quelle loi s’agit-il ?
38 CHAPITRE 3. VARIABLES ALÉATOIRES CONTINUES
Chapitre 4
Théorèmes limites
Considérons une suite (Xn )n≥1 de v.a. indépendantes et de même loi. Supposons que
ces v.a. ont une espérance, notée m et une variance, notée σ 2 .
Théorème 49
et c’est terminé. ¤
Théorème 52 (Loi des grands nombres) Quand n est grand, X n est proche de m
avec une forte probabilité. Autrement dit,
39
40 CHAPITRE 4. THÉORÈMES LIMITES
Var(X n ) σ2
P (|X n − m| > ε) ≤ = −→ 0
ε2 ε2 n
On dit que X n converge en probabilité vers m.
À la i-ième expérience (1 ≤ i ≤ n), on associe une v.a. Yi égale à 1 si A est réalisé, 0 sinon.
P P
Alors Yi décrit le nombre de fois où A a été réalisé et fA = n1 Yi décrit la fréquence
d’observation de A. Comme les Yi sont supposés de même loi, indépendants, de moyenne
P (A) et de variance P (A)(1 − P (A)), on peut appliquer la loi des grands nombres pour
conclure que fA converge, quand n tend vers l’infini vers P (A).
Plus généralement, soit X une v.a. dont on ne connaı̂t pas la loi. Alors la loi des grands
nombres implique qu’une observation répétée de la v.a. X permet d’avoir une idée plus ou
moins précise de la loi de X.
En conséquence, si par exemple on lance un grand nombre de fois un dé, la fréquence
d’apparition du 6 doit être proche de 1/6. Des questions restent en suspens : qu’est-ce
qu’un ”grand nombre de fois“, que signifie ”proche de 1/6“. Le théorème central limite va
apporter des réponses.
Corollaire 55 Quand n est grand, la loi binomiale B(n, p) est proche de la loi normale
p
N (np, np(1 − p))
preuve : Soient X1 , ..., Xn des v.a. de Bernoulli B(p) indépendantes. Soit Sn = X1 +· · ·+Xn .
On sait que Sn suit la loi binomiale B(n, p). Rappelons que l’espérance commune des Xi
est p et leur variance est p(1 − p). D’après le théorème central limite, en observant que
X n = Sn /n, il vient :
S − np
p n est proche de la loi N (0, 1)
np(1 − p)
p
autrement dit, Sn est proche de la loi N (np, np(1 − p)). ¤
4.3. INTERVALLES DE CONFIANCE 41
Cette approximation est importante car les probabilités relatives à la loi binomiale sont
difficiles à calculer quand n est grand.
Pour améliorer l’approximation, on effectue une “correction de continuité” qui permet de
lier loi discrète et loi continue. Ainsi, en pratique, si X est une v.a. de loi binomiale B(n, p),
avec n ≥ 30, np ≥ 5 et n(1 − p) ≥ 5, on peut approcher la loi de X par la loi normale
p
N (np, np(1 − p)) de cette manière : pour 0 ≤ k ≤ n,
P [X ≤ k] ' P [Y ≤ k + 0.5]
p
où Y suit une loi N (np, np(1 − p)).
Et pour tous a < b,
D’après les propriétés de la loi normale, quand n est grand (mettons supérieur à 20),
on sait que
√ √
P [m − 2σ/ n ≤ X n ≤ m + 2σ/ n] = 0.954
42 CHAPITRE 4. THÉORÈMES LIMITES
Ce qui peut se traduire ainsi : quand on estime m par X n , l’erreur faite est inférieure
√
à 2σ/ n, pour 95,4% des échantillons. Ou avec une probabilité de 95,4%, la moyenne
√ √
inconnue m est dans l’intervalle [X n − 2σ/ n, X n + 2σ/ n].
Définition 57 Soit Z une v.a.. Le fractile supérieur d’ordre α de la loi de Z est le réel z
qui vérifie
P [Z ≥ z] = α
P [Z ≤ z] = α
où zα/2 est le fractile supérieur d’ordre α/2 de la loi normale N (0, 1).
preuve :
· ¸
√ √ Xn − m
P [X n − zα/2 σ/ n ≤ m ≤ X n + zα/2 σ/ n] = P − zα/2 ≤ √ ≤ zα/2
σ/ n
= P [−zα/2 ≤ Z ≤ zα/2 ]
où Z suit une loi normale centrée réduite. Par définition de zα/2 , cette probabilité vaut
bien 1 − α. ¤
Seules quelques valeurs de α sont utilisées habituellement. Les trois valeurs communes
sont :
- α = 0.01, et z0.005 = 2.58,
- α = 0.05, et z0.025 = 1.96,
- α = 0.1, et z0.05 = 1.645.
Voici deux exemples, l’un théorique et l’autre pratique.
4.3. INTERVALLES DE CONFIANCE 43
Exemple 59 Soit un caractère X qui suit une loi de Poisson de paramètre inconnu λ
(ex : nombre de suicides ayant lieu dans le métro lyonnais chaque année). On rappelle
que le paramètre d’une loi de Poisson est aussi sa moyenne. On cherche à estimer par un
intervalle de confiance le paramètre λ. Supposons que λ vaut 5.2 et générons 25 échantillons
de taille 20 de loi de Poisson P(5.2) pour visualiser des intervalles de confiance qui auraient
pu être donnés suite à un échantillonage sur 20 années.
7
6
5
4
5 10 15 20 25
Exemple 60 Voici 30 mesures (en décibels) du bruit occasionné par le trafic routier le
long de la nationale 7 :
57 43 55 59 52 57 50 52 60 49 56 56 52 58 55
58 54 52 56 53 59 50 55 51 54 53 53 56 55 58
xi ni fi Fi
43 1 0.033 0.033
49 1 0.033 0.066
50 2 0.066 0.133
51 1 0.033 0.167
52 4 0.133 0.3
53 3 0.1 0.4
54 2 0.066 0.466
55 4 0.133 0.6
56 4 0.133 0.733
57 2 0.066 0.8
58 3 0.1 0.9
59 2 0.066 0.966
60 1 0.033 1
Tout d’abord, observons une valeur extrême (43) trop petite : les données n’ont pas l’air
44 CHAPITRE 4. THÉORÈMES LIMITES
60
55
50
45
homogène (mesure le dimanche, ou appareil déréglé). Je préfère l’enlever avant l’étude, car
elle risque de fausser la moyenne empirique et la variance. Il reste donc 29 observations.
On cherche un intervalle de confiance pour le bruit moyen occasionné par le trafic routier.
Mais il nous manque l’écart-type de ce bruit. Le calcul est donc impossible.
Quand l’écart-type théorique de la loi du caractère X étudié n’est pas connu, on l’estime
par l’écart-type empirique sn−1 . Comme on dispose d’un grand échantillon (de taille supé-
rieure à 20), l’erreur commise est petite. L’intervalle de confiance, de niveau de confiance
1 − α devient : · ¸
sn−1 sn−1
x̄n − zα/2 √ , x̄n + zα/2 √
n n
où
n
1 X
s2n−1 = (xi − x)2
n−1
i=1
d’où l’intervalle
· ¸
1.96 ∗ 2.9553 1.96 ∗ 2.9553 £ ¤
54.6552 − √ , 54.6552 + √ = 53.5796, 55.7308
29 29
Le bruit moyen occasionné par le trafic routier de la nationale 7 est compris entre 53,58
et 55,73, avec un niveau de confiance de 95%.
Tout ce qui concerne les moyennes s’applique aussi aux proportions. On considère
une caractéristique que possède une proportion p d’individus dans la population. Soit
un échantillon de taille n pris dans la population et X le nombre d’individus dans cet
échantillon qui possède la caractéristique étudiée. Alors
X
p̂ =
n
4.4. EXERCICES 45
est un estimateur de p. De plus, on a déjà vu que X suit une loi binomiale B(n, p) et que
cette loi peut être approchée par une loi normale :
X − np p̂ − p
Z=p =p
np(1 − p) p(1 − p)/n
4.4 Exercices
Exercice 1 – Une enquête marketing a pour but de vérifier si les cibles potentielles
seraient tentées par un nouveau produit. Il a été montré que 56% des gens sont favorables
au nouveau produit. Pour aller plus loin, on interroge à nouveau 200 personnes. Quelle est
la loi du nombre de clients potentiels parmi les 200 ? Par quelle loi peut-on l’approcher ?
Calculer P [X > 100] et P [100 ≤ X ≤ 150].
On souhaite maintenant demander des précisions à un grand nombre de personnes favo-
rables au produit, mettons 100 personnes. Déterminer la taille de l’échantillon de personnes
à interroger pour que notre échantillon contienne au moins 100 personnes favorables, avec
une probabilité supérieure ou égale à 95%.
Exercice 3 – On suppose que le poids d’un nouveau né est une variable normale d’écart-
type égal à 0,5 kg. Le poids moyen des 49 enfants nés au mois de janvier 2004 dans l’hôpital
de Charleville-Mézières a été de 3,6 kg.
a) Déterminer un intervalle de confiance à 95% pour le poids moyen d’un nouveau né dans
cet hôpital.
b) Quel serait le niveau de confiance d’un intervalle de longueur 0,1 kg centré en 3,6 pour
ce poids moyen ?
Exercice 4 – On veut étudier la proportion p de gens qui vont au cinéma chaque mois.
On prend donc un échantillon de taille n = 100. Soit N le nombre de personnes dans
l’échantillon qui vont au cinéma mensuellement.
1) Quelle est la loi de N ? Par quelle loi peut-on l’approcher et pourquoi ? En déduire une
approximation de la loi de F = N/n.
2) On observe une proportion f de gens qui vont chaque mois au cinéma. Donner la forme
d’un intervalle de confiance pour p, de niveau de confiance 1 − α.
3) Applications numériques : f = 0, 1, 1 − α = 90%, 95%, 98%.
Chapitre 5
Tests statistiques
Dans cet exemple, la moyenne observée sur l’échantillon devra être significativement diffé-
rente de 270 pour que H0 soit rejetée. Dans ce cas, il existera toujours une probabilité de se
tromper (H0 est vraie, mais on la rejette), car le fait de travailler à partir d’un échantillon
47
48 CHAPITRE 5. TESTS STATISTIQUES
entraı̂ne nécessairement une incertitude. On fixe cette probabilité, qui doit être petite, à α
avec souvent α = 0.05. On dit que le test est de niveau α. On pourrait bien sûr diminuer
cette probabilité, mais alors la règle de décision nous conduirait à toujours accepter H0 et
ce n’est pas satisfaisant. Il existe par ailleurs une probabilité de se tromper en acceptant
H0 , mais nous ne l’étudierons pas.
Il est raisonnable de penser que les échantillons dont la moyenne empirique X n est
inférieure à un certain seuil c < 270 vont conduire à rejeter H0 . Ainsi, la règle de décision
revient à déterminer une région de rejet de H0 de la forme X n ≤ c. La probabilité α sera
dans ce cas
P [X n ≤ c] = α quand H0 est vraie
Une fois α fixée, on peut déterminer c. En effet, on sait que quand H0 est vraie, X n suit
√
approximativement une loi normale N (270, 24/ 38). Ainsi,
· ¸ · ¸
X n − 270 c − 270 c − 270
α = P [X n ≤ c] = P √ ≤ √ =P Z≤ √
24/ 38 24/ 38 24/ 38
où Z suit une loi normale centrée réduite. Or on a noté zα le fractile supérieur de Z d’ordre
α, défini par P [Z ≤ −zα ] = P [Z ≥ zα ] = α. Ainsi, pour α = 0.05,
c − 270
√ = −zα = −z0.05 = −1.645
24/ 38
Une fois la région de rejet définie, il est facile de mesurer, si c’est pertinent, la force
avec laquelle on rejette H0 . Reprenons l’exemple précédent. On a fixé un seuil −zα pour
la statistique Z, mais plus la valeur de Z observée sera petite, plus le rejet de H0 se fera
avec force. Ainsi, on calcule la p-valeur (p-value en anglais) qui est la probabilité sous H0
pour que la statistique de test prenne une valeur plus extrême que celle qu’on observe.
Une p-valeur extrêmement petite (inférieure à 0,001) signifie que le test sera extrêmement
significatif : on rejette H0 avec une probabilité de se tromper très proche de 0. Une p-valeur
comprise entre 0.001 et 0.01 correspond à un test très significatif. Une p-valeur entre 0.01
et 0.05 correspond à un test significatif et une p-valeur supérieure à 0.05 conduit à accepter
H0 .
donc on accepte H0 .
- On observe une moyenne empirique égale à 260. Alors
√
zobs = (260 − 270)/(24/ 38) = −2.57 < −zα
donc on rejette H0 . De plus, la p-valeur vaut P [Z < −2.57] = 0.005. Le test est donc très
significatif.
Dans la plupart des cas, l’écart-type est inconnu. On l’estime alors, comme pour les
intervalles de confiance, par S l’écart-type empirique.
Quand on effectue un test de la moyenne, on peut vouloir tester si la moyenne est diffé-
rente de la valeur µ0 contenue dans H0 , ou si elle est supérieure ou inférieure. Dans chacun
de ces trois cas, la région de rejet aura une forme différente. Considérons la statistique
X n − µ0
Z= √
S/ n
Puis on calcule une distance entre ces deux ensembles d’effectifs, définie par
³ ´2
XK nobs (Ak ) − nth (Ak )
d2obs =
nth (Ak )
k=1
Si cette distance est grande, on rejettera l’hypothèse H0 . Le seuil est déterminé grâce à
une loi continue appelée loi du chi-deux à K − 1 degrés de liberté et notée χ2K−1 . Ainsi, si
cα est le fractile d’ordre α de cette loi, la région de rejet de H0 est de la forme
d2obs ≥ cα
p = P [χ2K−1 ≥ d2obs ]
où χ2K−1 est une v.a. de loi du chi-deux à K − 1 degrés de liberté et d2obs est la distance
observée.
Comment choisit-on les classes et le nombre K de classes ? Le test est valide quand
l’effectif théorique de chaque classe est supérieur à 5. Donc le nombre K de classes doit
être inférieur à n/5. On choisira n/5 si ce nombre est inférieur à 25 et 25 sinon.
Dans un grand nombre de cas, on veut vérifier que l’échantillon provient d’une loi,
sans connaı̂tre les paramètres de cette loi : on veut vérifier que la loi est normale, ou
géométrique, mais sans préciser la valeur de la moyenne ni de la variance. On ne peut plus
calculer les effectifs théoriques. On estime alors les paramètres, et on calcule la distance
du chi-deux. Le nombre de degrés de liberté sera dans ce cas K − l − 1 où l est le nombre
de paramètres qu’on a dû estimer.
classe A0 A1 A2 A3 A4 A5
nth 15.7 18.8 11.3 4.5 1.4 0.3
Or chacun des effectifs théoriques doit être supérieur à 5. Il faut donc regrouper les 3
dernières classes et on obtient le tableau
classe A0 A1 A2 A3
nth 15.7 18.8 11.3 6.2
nobs 18 18 8 8
La valeur observée étant plus petite, on accepte l’hypothèse Poisson, au risque 5%.
mesures 71 72 73 74 75 77 78 79 80 81 82 84
effectifs observés 1 1 1 1 1 1 1 4 3 3 4 6
mesures 85 86 87 88 90 91 94
effectifs observés 6 2 1 1 1 1 1
On veut tester si cette série peut provenir d’une loi normale. On a besoin d’estimer deux
paramètres, la moyenne (par la moyenne empirique) et l’écart-type (par l’écart-type empi-
rique).
x̄40 = 82.075 et s40 = 4.98
On dispose d’un échantillon de taille 40. Le nombre de classes sera donc 8. On les choisit de
telle sorte que chacune d’elle ait la probabilité 1/8, de telle sorte que les effectifs théoriques
soient tous égaux à 5.
La partition pour la loi normale N (0, 1) est obtenue en lisant les tables
genre de voiture
neuve d’occasion
comptant 15 5 20
paiement
à crédit 45 35 80
60 40 100
P [X = xi , Y = yj ] = P [X = xi ]P [Y = yj ]
5.4. EXERCICES 53
et on obtient
(3 − 0.5)2 (3 − 0.5)2 (3 − 0.5)2 (3 − 0.5)2
D2 = + + + = 1.63
12 8 48 32
De plus, P [χ21 ≥ 3.84] = 0.05 et 3.84 est bien plus grand que la valeur observée 1.63. On
accepte donc l’hypothèse d’indépendance H0 : il n’y a pas de relation entre le genre de
voiture achetée et le mode de paiement.
5.4 Exercices
Exercice 1 – Dans un centre avicole, des études antérieures ont montré que la masse d’un
oeuf choisi au hasard peut être considérée comme la réalisation d’une variable aléatoire
normale X, de moyenne m et de variance σ 2 . On admet que les masses des oeufs sont
indépendantes les unes des autres. On prend un échantillon de n = 36 oeufs que l’on pèse.
Les mesures sont données (par ordre croissant) dans le tableau suivant :
Exercice 3 – On utilise une nouvelle variété de pommes de terre dans une exploitation
agricole. Le rendement de l’ancienne variété était de 41.5 tonnes à l’ha. La nouvelle est
cultivée sur 100 ha, avec un rendement moyen de 45 tonnes à l’ha et un écart-type de
11.25. Faut-il, au vu de ce rendement, favoriser la culture de la nouvelle variété ?
Exercice 4 – Dans une agence de location de voitures, le patron veut savoir quelles sont
les voitures qui n’ont roulé qu’en ville pour les revendre immédiatement. Pour cela, il y a
dans chaque voiture une boı̂te noire qui enregistre le nombre d’heures pendant lesquelles la
voiture est restée au point mort, au premier rapport, au deuxième rapport,..., au cinquième
rapport. On sait qu’une voiture qui ne roule qu’en ville passe en moyenne 10% de son temps
au point mort, 5% en première, 30% en seconde, 30% en troisième, 20% en quatrième, et
5% en cinquième. On décide de faire un test du χ2 pour savoir si une voiture n’a roulé
qu’en ville ou non.
1) Sur une première voiture, on constate sur 2000 heures de conduite : 210 h au point
mort, 94 h en première, 564 h en seconde, 630 h en troisième, 390 h en quatrième, et 112
h en cinquième. Cette voiture n’a-t-elle fait que rester en ville ?
2) Avec une autre voiture, on obtient les données suivantes : 220 h au point mort, 80 h en
première, 340 h en seconde, 600 h en troisième, 480 h en quatrième et 280 h en cinquième.
Exercice 5 – Une chaı̂ne d’agences immobilières cherche à vérifier que le nombre de biens
vendus par agent par mois suit une loi de Poisson de paramètre λ = 1, 5.
1) On observe 52 agents pendant un mois dans la moitié nord de la France. On trouve
la répartition suivante : 18 agents n’ont rien vendu, 18 agents ont vendu 1 bien, 8 agents
ont vendu 2 biens, 5 agents ont vendu 3 biens, 2 agents ont vendus 4 biens, et un agent a
vendu 5 biens. Avec un test du χ2 , chercher s’il s’agit bien de la loi de Poisson attendue.
2) Répondre à la même question avec les 52 agents dans la moitié sud de la France : 19
5.4. EXERCICES 55
agents n’ont rien vendu, 20 agents ont vendu un bien, 7 agents 2 biens, 5 agents 3 biens
et 1 agent 6 biens.
12.6 12.0 20.9 14.2 16.2 15.3 10.4 22.1 19.8 15 12.8 20 11.8 20.6 21.3
11.7 18 9.1 15 15.2 15.1 14.7 13.3 21.7 15.4 16.7 15.6 17.1 7.2 12.6
Cardinaux et dénombrement
Définition 65 Soit A un ensemble fini. Le cardinal de A, noté |A|, est le nombre d’élé-
ments que contient A.
|A ∪ B| = |A| + |B| − |A ∩ B|
Définition 71 Soit A un ensemble fini. Une permutation de A est une manière d’ordon-
ner, d’arranger les éléments de A.
57
58 ANNEXE A. CARDINAUX ET DÉNOMBREMENT
A649 = 49 ∗ 48 ∗ 47 ∗ 46 ∗ 45 ∗ 44 = 10.068.347.520
Mais on peut gagner les 6 bons numéros quel que soit l’ordre de sortie des 6 numéros...
- manière de voir 2 : on regarde les 6 nombres sortis sans s’occuper de l’ordre d’arrivée.
On a alors ω = {x1 , ..., x6 }. D’où Ω est l’ensemble des combinaisons de 6 nombres pris
dans {1, ..., 49}. Quel est le nombre de tirages différents ?
µ ¶
49 49 ∗ 48 ∗ 47 ∗ 46 ∗ 45 ∗ 44
= = 13.983.816
6 6∗5∗4∗3∗2
Tables statistiques
61
62 ANNEXE B. TABLES STATISTIQUES
Z z
1
F (z) = P [Z ≤ z] = √ exp(−x2 /2)dx
−∞ 2π
z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0 0.5000 0.5040 0.5080 0.5120 0.5160 0.5199 0.5239 0.5279 0.5319 0.5359
0.1 0.5398 0.5438 0.5478 0.5517 0.5557 0.5596 0.5636 0.5675 0.5714 0.5753
0.2 0.5793 0.5832 0.5871 0.5910 0.5948 0.5987 0.6026 0.6064 0.6103 0.6141
0.3 0.6179 0.6217 0.6255 0.6293 0.6331 0.6368 0.6406 0.6443 0.6480 0.6517
0.4 0.6554 0.6591 0.6628 0.6664 0.6700 0.6736 0.6772 0.6808 0.6844 0.6879
0.5 0.6915 0.6950 0.6985 0.7019 0.7054 0.7088 0.7123 0.7157 0.7190 0.7224
0.6 0.7257 0.7291 0.7324 0.7357 0.7389 0.7422 0.7454 0.7486 0.7517 0.7549
0.7 0.7580 0.7611 0.7642 0.7673 0.7704 0.7734 0.7764 0.7794 0.7823 0.7852
0.8 0.7881 0.7910 0.7939 0.7967 0.7995 0.8023 0.8051 0.8078 0.8106 0.8133
0.9 0.8159 0.8186 0.8212 0.8238 0.8264 0.8289 0.8315 0.8340 0.8365 0.8389
1 0.8413 0.8438 0.8461 0.8485 0.8508 0.8531 0.8554 0.8577 0.8599 0.8621
1.1 0.8643 0.8665 0.8686 0.8708 0.8729 0.8749 0.8770 0.8790 0.8810 0.8830
1.2 0.8849 0.8869 0.8888 0.8907 0.8925 0.8944 0.8962 0.8980 0.8997 0.9015
1.3 0.9032 0.9049 0.9066 0.9082 0.9099 0.9115 0.9131 0.9147 0.9162 0.9177
1.4 0.9192 0.9207 0.9222 0.9236 0.9251 0.9265 0.9279 0.9292 0.9306 0.9319
1.5 0.9332 0.9345 0.9357 0.9370 0.9382 0.9394 0.9406 0.9418 0.9429 0.9441
1.6 0.9452 0.9463 0.9474 0.9484 0.9495 0.9505 0.9515 0.9525 0.9535 0.9545
1.7 0.9554 0.9564 0.9573 0.9582 0.9591 0.9599 0.9608 0.9616 0.9625 0.9633
1.8 0.9641 0.9649 0.9656 0.9664 0.9671 0.9678 0.9686 0.9693 0.9699 0.9706
1.9 0.9713 0.9719 0.9726 0.9732 0.9738 0.9744 0.9750 0.9756 0.9761 0.9767
2 0.9772 0.9778 0.9783 0.9788 0.9793 0.9798 0.9803 0.9808 0.9812 0.9817
2.1 0.9821 0.9826 0.9830 0.9834 0.9838 0.9842 0.9846 0.9850 0.9854 0.9857
2.2 0.9861 0.9864 0.9868 0.9871 0.9875 0.9878 0.9881 0.9884 0.9887 0.9890
2.3 0.9893 0.9896 0.9898 0.9901 0.9904 0.9906 0.9909 0.9911 0.9913 0.9916
2.4 0.9918 0.9920 0.9922 0.9925 0.9927 0.9929 0.9931 0.9932 0.9934 0.9936
2.5 0.9938 0.9940 0.9941 0.9943 0.9945 0.9946 0.9948 0.9949 0.9951 0.9952
2.6 0.9953 0.9955 0.9956 0.9957 0.9959 0.9960 0.9961 0.9962 0.9963 0.9964
2.7 0.9965 0.9966 0.9967 0.9968 0.9969 0.9970 0.9971 0.9972 0.9973 0.9974
2.8 0.9974 0.9975 0.9976 0.9977 0.9977 0.9978 0.9979 0.9979 0.9980 0.9981
2.9 0.9981 0.9982 0.9982 0.9983 0.9984 0.9984 0.9985 0.9985 0.9986 0.9986
Grandes valeurs de z :
P [Z < z] 0.000 0.001 0.002 0.003 0.004 0.005 0.006 0.007 0.008 0.009 0.010
0.00 Inf 3.0902 2.8782 2.7478 2.6521 2.5758 2.5121 2.4573 2.4089 2.3656 2.3263 0.99
0.01 2.3263 2.2904 2.2571 2.2262 2.1973 2.1701 2.1444 2.1201 2.0969 2.0749 2.0537 0.98
0.02 2.0537 2.0335 2.0141 1.9954 1.9774 1.96 1.9431 1.9268 1.911 1.8957 1.8808 0.97
0.03 1.8808 1.8663 1.8522 1.8384 1.825 1.8119 1.7991 1.7866 1.7744 1.7624 1.7507 0.96
0.04 1.7507 1.7392 1.7279 1.7169 1.706 1.6954 1.6849 1.6747 1.6646 1.6546 1.6449 0.95
0.05 1.6449 1.6352 1.6258 1.6164 1.6072 1.5982 1.5893 1.5805 1.5718 1.5632 1.5548 0.94
0.06 1.5548 1.5464 1.5382 1.5301 1.522 1.5141 1.5063 1.4985 1.4909 1.4833 1.4758 0.93
0.07 1.4758 1.4684 1.4611 1.4538 1.4466 1.4395 1.4325 1.4255 1.4187 1.4118 1.4051 0.92
0.08 1.4051 1.3984 1.3917 1.3852 1.3787 1.3722 1.3658 1.3595 1.3532 1.3469 1.3408 0.91
0.09 1.3408 1.3346 1.3285 1.3225 1.3165 1.3106 1.3047 1.2988 1.293 1.2873 1.2816 0.90
0.10 1.2816 1.2759 1.2702 1.2646 1.2591 1.2536 1.2481 1.2426 1.2372 1.2319 1.2265 0.89
0.11 1.2265 1.2212 1.216 1.2107 1.2055 1.2004 1.1952 1.1901 1.185 1.18 1.175 0.88
0.12 1.175 1.17 1.165 1.1601 1.1552 1.1503 1.1455 1.1407 1.1359 1.1311 1.1264 0.87
0.13 1.1264 1.1217 1.117 1.1123 1.1077 1.1031 1.0985 1.0939 1.0893 1.0848 1.0803 0.86
0.14 1.0803 1.0758 1.0714 1.0669 1.0625 1.0581 1.0537 1.0494 1.045 1.0407 1.0364 0.85
0.15 1.0364 1.0322 1.0279 1.0237 1.0194 1.0152 1.011 1.0069 1.0027 0.9986 0.9945 0.84
0.16 0.9945 0.9904 0.9863 0.9822 0.9782 0.9741 0.9701 0.9661 0.9621 0.9581 0.9542 0.83
0.17 0.9542 0.9502 0.9463 0.9424 0.9385 0.9346 0.9307 0.9269 0.923 0.9192 0.9154 0.82
0.18 0.9154 0.9116 0.9078 0.904 0.9002 0.8965 0.8927 0.889 0.8853 0.8816 0.8779 0.81
0.19 0.8779 0.8742 0.8705 0.8669 0.8633 0.8596 0.856 0.8524 0.8488 0.8452 0.8416 0.80
0.20 0.8416 0.8381 0.8345 0.831 0.8274 0.8239 0.8204 0.8169 0.8134 0.8099 0.8064 0.79
0.21 0.8064 0.803 0.7995 0.7961 0.7926 0.7892 0.7858 0.7824 0.779 0.7756 0.7722 0.78
0.22 0.7722 0.7688 0.7655 0.7621 0.7588 0.7554 0.7521 0.7488 0.7454 0.7421 0.7388 0.77
0.23 0.7388 0.7356 0.7323 0.729 0.7257 0.7225 0.7192 0.716 0.7128 0.7095 0.7063 0.76
0.24 0.7063 0.7031 0.6999 0.6967 0.6935 0.6903 0.6871 0.684 0.6808 0.6776 0.6745 0.75
0.25 0.6745 0.6713 0.6682 0.6651 0.662 0.6588 0.6557 0.6526 0.6495 0.6464 0.6433 0.74
0.26 0.6433 0.6403 0.6372 0.6341 0.6311 0.628 0.625 0.6219 0.6189 0.6158 0.6128 0.73
0.27 0.6128 0.6098 0.6068 0.6038 0.6008 0.5978 0.5948 0.5918 0.5888 0.5858 0.5828 0.72
0.28 0.5828 0.5799 0.5769 0.574 0.571 0.5681 0.5651 0.5622 0.5592 0.5563 0.5534 0.71
0.29 0.5534 0.5505 0.5476 0.5446 0.5417 0.5388 0.5359 0.533 0.5302 0.5273 0.5244 0.70
0.30 0.5244 0.5215 0.5187 0.5158 0.5129 0.5101 0.5072 0.5044 0.5015 0.4987 0.4959 0.69
0.31 0.4959 0.493 0.4902 0.4874 0.4845 0.4817 0.4789 0.4761 0.4733 0.4705 0.4677 0.68
0.32 0.4677 0.4649 0.4621 0.4593 0.4565 0.4538 0.451 0.4482 0.4454 0.4427 0.4399 0.67
0.33 0.4399 0.4372 0.4344 0.4316 0.4289 0.4261 0.4234 0.4207 0.4179 0.4152 0.4125 0.66
0.34 0.4125 0.4097 0.407 0.4043 0.4016 0.3989 0.3961 0.3934 0.3907 0.388 0.3853 0.65
0.35 0.3853 0.3826 0.3799 0.3772 0.3745 0.3719 0.3692 0.3665 0.3638 0.3611 0.3585 0.64
0.36 0.3585 0.3558 0.3531 0.3505 0.3478 0.3451 0.3425 0.3398 0.3372 0.3345 0.3319 0.63
0.37 0.3319 0.3292 0.3266 0.3239 0.3213 0.3186 0.316 0.3134 0.3107 0.3081 0.3055 0.62
0.38 0.3055 0.3029 0.3002 0.2976 0.295 0.2924 0.2898 0.2871 0.2845 0.2819 0.2793 0.61
0.39 0.2793 0.2767 0.2741 0.2715 0.2689 0.2663 0.2637 0.2611 0.2585 0.2559 0.2533 0.60
0.40 0.2533 0.2508 0.2482 0.2456 0.243 0.2404 0.2378 0.2353 0.2327 0.2301 0.2275 0.59
0.41 0.2275 0.225 0.2224 0.2198 0.2173 0.2147 0.2121 0.2096 0.207 0.2045 0.2019 0.58
0.42 0.2019 0.1993 0.1968 0.1942 0.1917 0.1891 0.1866 0.184 0.1815 0.1789 0.1764 0.57
0.43 0.1764 0.1738 0.1713 0.1687 0.1662 0.1637 0.1611 0.1586 0.156 0.1535 0.151 0.56
0.44 0.151 0.1484 0.1459 0.1434 0.1408 0.1383 0.1358 0.1332 0.1307 0.1282 0.1257 0.55
0.45 0.1257 0.1231 0.1206 0.1181 0.1156 0.113 0.1105 0.108 0.1055 0.103 0.1004 0.54
0.46 0.1004 0.0979 0.0954 0.0929 0.0904 0.0878 0.0853 0.0828 0.0803 0.0778 0.0753 0.53
0.47 0.0753 0.0728 0.0702 0.0677 0.0652 0.0627 0.0602 0.0577 0.0552 0.0527 0.0502 0.52
0.48 0.0502 0.0476 0.0451 0.0426 0.0401 0.0376 0.0351 0.0326 0.0301 0.0276 0.0251 0.51
0.49 0.0251 0.0226 0.0201 0.0175 0.015 0.0125 0.01 0.0075 0.005 0.0025 0.0000 0.50
0.010 0.009 0.008 0.007 0.006 0.005 0.004 0.003 0.002 0.001 0.000 P [Z < z]
64 ANNEXE B. TABLES STATISTIQUES
HH P
ν
HH 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 0.95 0.975 0.99 0.995 0.999
H
1 0.016 0.064 0.148 0.275 0.455 0.708 1.074 1.642 2.706 3.841 5.024 6.635 7.879 10.828
2 0.211 0.446 0.713 1.022 1.386 1.833 2.408 3.219 4.605 5.991 7.378 9.21 10.597 13.816
3 0.584 1.005 1.424 1.869 2.366 2.946 3.665 4.642 6.251 7.815 9.348 11.345 12.838 16.266
4 1.064 1.649 2.195 2.753 3.357 4.045 4.878 5.989 7.779 9.488 11.143 13.277 14.86 18.467
5 1.61 2.343 3 3.655 4.351 5.132 6.064 7.289 9.236 11.07 12.833 15.086 16.75 20.515
6 2.204 3.07 3.828 4.57 5.348 6.211 7.231 8.558 10.645 12.592 14.449 16.812 18.548 22.458
7 2.833 3.822 4.671 5.493 6.346 7.283 8.383 9.803 12.017 14.067 16.013 18.475 20.278 24.322
8 3.49 4.594 5.527 6.423 7.344 8.351 9.524 11.03 13.362 15.507 17.535 20.09 21.955 26.124
9 4.168 5.38 6.393 7.357 8.343 9.414 10.656 12.242 14.684 16.919 19.023 21.666 23.589 27.877
10 4.865 6.179 7.267 8.295 9.342 10.473 11.781 13.442 15.987 18.307 20.483 23.209 25.188 29.588
11 5.578 6.989 8.148 9.237 10.341 11.53 12.899 14.631 17.275 19.675 21.92 24.725 26.757 31.264
12 6.304 7.807 9.034 10.182 11.34 12.584 14.011 15.812 18.549 21.026 23.337 26.217 28.3 32.909
13 7.042 8.634 9.926 11.129 12.34 13.636 15.119 16.985 19.812 22.362 24.736 27.688 29.819 34.528
14 7.79 9.467 10.821 12.078 13.339 14.685 16.222 18.151 21.064 23.685 26.119 29.141 31.319 36.123
15 8.547 10.307 11.721 13.03 14.339 15.733 17.322 19.311 22.307 24.996 27.488 30.578 32.801 37.697
16 9.312 11.152 12.624 13.983 15.338 16.78 18.418 20.465 23.542 26.296 28.845 32 34.267 39.252
17 10.085 12.002 13.531 14.937 16.338 17.824 19.511 21.615 24.769 27.587 30.191 33.409 35.718 40.79
18 10.865 12.857 14.44 15.893 17.338 18.868 20.601 22.76 25.989 28.869 31.526 34.805 37.156 42.312
19 11.651 13.716 15.352 16.85 18.338 19.91 21.689 23.9 27.204 30.144 32.852 36.191 38.582 43.82
20 12.443 14.578 16.266 17.809 19.337 20.951 22.775 25.038 28.412 31.41 34.17 37.566 39.997 45.315
21 13.24 15.445 17.182 18.768 20.337 21.991 23.858 26.171 29.615 32.671 35.479 38.932 41.401 46.797
22 14.041 16.314 18.101 19.729 21.337 23.031 24.939 27.301 30.813 33.924 36.781 40.289 42.796 48.268
23 14.848 17.187 19.021 20.69 22.337 24.069 26.018 28.429 32.007 35.172 38.076 41.638 44.181 49.728
24 15.659 18.062 19.943 21.652 23.337 25.106 27.096 29.553 33.196 36.415 39.364 42.98 45.559 51.179
25 16.473 18.94 20.867 22.616 24.337 26.143 28.172 30.675 34.382 37.652 40.646 44.314 46.928 52.62
26 17.292 19.82 21.792 23.579 25.336 27.179 29.246 31.795 35.563 38.885 41.923 45.642 48.29 54.052
27 18.114 20.703 22.719 24.544 26.336 28.214 30.319 32.912 36.741 40.113 43.195 46.963 49.645 55.476
28 18.939 21.588 23.647 25.509 27.336 29.249 31.391 34.027 37.916 41.337 44.461 48.278 50.993 56.892
29 19.768 22.475 24.577 26.475 28.336 30.283 32.461 35.139 39.087 42.557 45.722 49.588 52.336 58.301
30 20.599 23.364 25.508 27.442 29.336 31.316 33.53 36.25 40.256 43.773 46.979 50.892 53.672 59.703
31 21.434 24.255 26.44 28.409 30.336 32.349 34.598 37.359 41.422 44.985 48.232 52.191 55.003 61.098
32 22.271 25.148 27.373 29.376 31.336 33.381 35.665 38.466 42.585 46.194 49.48 53.486 56.328 62.487
33 23.11 26.042 28.307 30.344 32.336 34.413 36.731 39.572 43.745 47.4 50.725 54.776 57.648 63.87
34 23.952 26.938 29.242 31.313 33.336 35.444 37.795 40.676 44.903 48.602 51.966 56.061 58.964 65.247
35 24.797 27.836 30.178 32.282 34.336 36.475 38.859 41.778 46.059 49.802 53.203 57.342 60.275 66.619
40 29.051 32.345 34.872 37.134 39.335 41.622 44.165 47.269 51.805 55.758 59.342 63.691 66.766 73.402
45 33.35 36.884 39.585 41.995 44.335 46.761 49.452 52.729 57.505 61.656 65.41 69.957 73.166 80.077
50 37.689 41.449 44.313 46.864 49.335 51.892 54.723 58.164 63.167 67.505 71.42 76.154 79.49 86.661
Annexe C
Nous allons voir ici comment décrire simplement des données en trois phases :
- présentation des données,
- représentations graphiques,
- calcul de résumés numériques.
On considère une population P qui est l’ensemble des individus concernés par l’étude
statistique. Un échantillon est un sous-ensemble de cette population. Les données statis-
tiques sont des mesures effectuées sur les individus de l’échantillon.
On cherche à étudier un caractère ou variable de cette population à partir des obser-
vations faites sur l’échantillon. Une variable peut être qualitative (oui/non, homme/femme...)
ou quantitative (à valeurs dans R). On mesure cette variable sur l’échantillon et on ob-
tient ainsi les observations ou données.
Dans la suite, on distinguera trois cas suivant que la variable étudiée est une :
- variable quantitative discrète (elle ne prend qu’un nombre fini ou dénombrable de
valeurs ; en général il s’agit d’entiers)
- variable quantitative continue (variable quantitative qui n’est pas discrète)
- variable qualitative.
65
66 ANNEXE C. STATISTIQUE DESCRIPTIVE UNIVARIÉE
Exemple 78 “The World Almanac and Book of Facts” (1975) a publié le nombre des
grandes inventions mises au point chaque année entre 1860 et 1959, soit
5 3 0 2 0 3 2 3 6 1 2 1 2 1 3 3 3 5 2 4 4 0 2 3 7 12 3 10 9 2 3 7 7
233624352240425233658366052226344
2247533022213422111214432141110020
Notons y = (y1 , ..., yn ) la suite des observations rangées par ordre croissant, n étant la
taille de l’échantillon. Des données de ce type sont à présenter dans un tableau statistique
dont la première colonne est l’ensemble des r observations distinctes (ou modalités),
classées par ordre croissant et notées x1 , ..., xr . Puis on leur fait correspondre dans une
seconde colonne leurs effectifs, c’est-à-dire leurs nombres d’occurence, notés n1 , ..., nr .
P
Alors i ni = n. On indique aussi les fréquences fi = ni /n et les fréquences cumulées
P
Fi = ij=1 fj (1 ≤ i ≤ r). La plupart du temps, on donnera les fréquences sous forme de
pourcentage. Pour notre exemple 78, on obtient
xi ni fi Fi
0 9 0.09 0.09
1 12 0.12 0.21
2 26 0.26 0.47
3 20 0.20 0.67
4 12 0.12 0.79
5 7 0.07 0.86
6 6 0.06 0.92
7 4 0.04 0.96
8 1 0.01 0.97
9 1 0.01 0.98
10 1 0.01 0.99
12 1 0.01 1
1.0
25
0.8
20
0.6
15
Fn(x)
0.4
10
0.2
5
0.0
0
0 2 4 6 8 10 0 2 4 6 8 10 12
Pour les données de l’exemple 78, on obtient : s2n−1 (y) = 5, 081, sn−1 = 2, 254, le premier
quartile est 2, le troisième 4 et l’espace interquartile vaut donc 2. L’amplitude est 12.
12
10
8
6
4
2
0
0.10
0.08
densite/250
0.06
0.04
0.02
0.00
45 50 55 60
masse
Exemple 82 On a interrogé des étudiants qui se rongent les ongles. Voici les circons-
tances pendant lesquelles ils pratiquent cette mauvaise habitude.
activité fréquence
regarder la télévision 58
lire un journal 21
téléphoner 14
conduire une auto 7
faire ses courses 3
autre 12
50
40
30
20
10
0
71