[go: up one dir, main page]

0% ont trouvé ce document utile (0 vote)
160 vues52 pages

Introduction à la Statistique 2019-2020

Ce document présente les concepts de base de la statistique descriptive. Il définit les termes clés comme la population, l'échantillon, les caractères qualitatifs et quantitatifs. Le document décrit également les paramètres numériques comme la moyenne, la médiane et les représentations graphiques.

Transféré par

syntyche n zebo
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
160 vues52 pages

Introduction à la Statistique 2019-2020

Ce document présente les concepts de base de la statistique descriptive. Il définit les termes clés comme la population, l'échantillon, les caractères qualitatifs et quantitatifs. Le document décrit également les paramètres numériques comme la moyenne, la médiane et les représentations graphiques.

Transféré par

syntyche n zebo
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
Vous êtes sur la page 1/ 52

Statistique 1

UCAO-IEG : Licence 1
Année Universitaire 2019-2020

Prof. Armel YODE


Université Félix Houphouet Boigny
UFR Mathématiques et Informatique
2
Armel Yodé

Nous avons confiance en Dieu ; que tous les autres apportent


des justificatifs. [Edwards Deming, Professeur de statistique, 1900
-1993]

Armel Yodé 3
Armel Yodé

Armel Yodé 4
Table des matières

1 Introduction 9
1.1 Terminologie de base . . . . . . . . . . . . . . . . . . . . 9
1.2 Caractères . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.2.1 Caractère qualitatif . . . . . . . . . . . . . . . . 10
1.2.2 Caractère quantitatif . . . . . . . . . . . . . . . . 11
1.2.2.1 Caractère quantitatif discret . . . . . . 11
1.2.2.2 Caractère quantitatif continu . . . . . . 11
1.3 Effectif, fréquences . . . . . . . . . . . . . . . . . . . . . 12
1.4 Présentation générale des tableaux statistiques . . . . . 13

2 Représentations graphiques 15
2.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . 15
2.2 Diagrammes à secteurs . . . . . . . . . . . . . . . . . . . 15
2.3 Diagramme en barres, diagramme en bâtons . . . . . . . 17
2.4 Histogramme . . . . . . . . . . . . . . . . . . . . . . . . 19
2.5 Diagramme de fréquences cumulées . . . . . . . . . . . . 21
2.5.1 Cas d’un caractère qualitatif ordinal . . . . . . . 21
2.5.2 Cas d’un caractère quantitatif discret . . . . . . 21
2.5.3 Cas d’un caractère quantitatif continu . . . . . . 23

3 Paramètres numériques 27
3.1 Paramètres de tendance centrale . . . . . . . . . . . . . 27
3.1.1 Le mode . . . . . . . . . . . . . . . . . . . . . . . 27
3.1.1.1 Caractère quantitatif discret . . . . . . 27
3.1.1.2 Caractère quantitatif continu . . . . . . 27
3.1.1.3 Remarques . . . . . . . . . . . . . . . . 28
3.1.2 La moyenne arithmétique . . . . . . . . . . . . . 28
3.1.2.1 Données brutes . . . . . . . . . . . . . 28

5
Armel Yodé

3.1.2.2 Données rangées : caractère quantitatif


discret . . . . . . . . . . . . . . . . . . 29
3.1.2.3 Données rangées : caractère quantitatif
continu . . . . . . . . . . . . . . . . . . 29
3.1.2.4 Remarques . . . . . . . . . . . . . . . . 29
3.1.3 La moyenne géométrique . . . . . . . . . . . . . 29
3.1.4 La moyenne harmonique . . . . . . . . . . . . . . 29
3.1.5 La moyenne quadratique . . . . . . . . . . . . . . 30
3.1.6 La médiane . . . . . . . . . . . . . . . . . . . . . 30
3.1.6.1 Caractère quantitatif discret . . . . . . 30
3.1.6.2 Caractère quantitatif continu . . . . . 30
3.1.6.3 Remarques . . . . . . . . . . . . . . . . 30
3.1.7 Les quantiles . . . . . . . . . . . . . . . . . . . . 31
3.1.8 Boı̂te à moustaches . . . . . . . . . . . . . . . . . 32
3.2 Paramètres de dispersion . . . . . . . . . . . . . . . . . 33
3.2.1 L’étendue . . . . . . . . . . . . . . . . . . . . . . 34
3.2.2 L’écart moyen absolu . . . . . . . . . . . . . . . 34
3.2.3 Variance, écart-type . . . . . . . . . . . . . . . . 35
3.2.4 L’écart inter-quartile . . . . . . . . . . . . . . . . 36
3.2.5 Le Coefficient de variation . . . . . . . . . . . . . 36
3.3 Les paramètres de concentration . . . . . . . . . . . . . 36
3.3.1 La médiale . . . . . . . . . . . . . . . . . . . . . 37
3.3.2 L’écart entre médiane et médiale . . . . . . . . . 39
3.3.3 La courbe de Lorenz . . . . . . . . . . . . . . . . 39
3.3.4 L’indice de Gini . . . . . . . . . . . . . . . . . . 39
3.4 Paramètres de forme . . . . . . . . . . . . . . . . . . . . 40
3.4.1 Moments . . . . . . . . . . . . . . . . . . . . . . 40
3.4.2 Asymétrie . . . . . . . . . . . . . . . . . . . . . . 41
3.4.3 L’aplatissement . . . . . . . . . . . . . . . . . . . 42

4 Indices statistiques 45
4.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . 45
4.2 Indices élémentaires . . . . . . . . . . . . . . . . . . . . 45
4.2.1 Définitions . . . . . . . . . . . . . . . . . . . . . 45
4.2.2 Propriétés d’un indice . . . . . . . . . . . . . . . 46
4.2.2.1 Circularité (ou transférabilité ou tran-
sitivité) . . . . . . . . . . . . . . . . . . 46
4.2.2.2 Réversibilité . . . . . . . . . . . . . . . 47
4.3 Indices synthétiques . . . . . . . . . . . . . . . . . . . . 47
4.3.1 Indice de Laspeyres . . . . . . . . . . . . . . . . 48

Armel Yodé 6
Armel Yodé

4.3.2 Indice de Paasche . . . . . . . . . . . . . . . . . 48


4.3.3 L’indice de Fisher . . . . . . . . . . . . . . . . . 48
4.3.4 Comparaison . . . . . . . . . . . . . . . . . . . . 49
4.3.5 Indices de prix, de quantité et de valeur . . . . . 51

Armel Yodé 7
Armel Yodé

Armel Yodé 8
Chapitre 1

Introduction

La statistique est l’ensemble des méthodes et des techniques desti-


nées à la collecte, l’exploration, l’analyse et l’interprétation des données.
Elle a pour objectif de mettre en évidence des informations cachées dans
ces données en vue généralement de prendre une décision concernant le
phénomène ayant généré ces données. La statistique se divise générale-
ment en deux grandes parties :
- la statistique descriptive qui a pour but d’obtenir un résumé des
données ;
- la statistique inférentielle qui a pour but d’utiliser les données
afin de tester des hypothèses, de rechercher des modèles ou de
faire des prévisions.

1.1 Terminologie de base


Population : C’est l’ensemble sur lequel porte l’étude statistique.
La population que l’on envisage en statistique dépend du do-
maine que l’on traite, et peut donc aussi bien être constituée
d’êtres humains que d’animaux, d’objets, voire d’événements.
Individu ou unité statistique : C’est un élément de la popula-
tion.
Echantillon : C’est un sous-ensemble de la population ; l’échan-
tillon doit être représentatif de la population, c’est à dire qu’il
doit refléter fidèlement sa composition et sa complexité ; en ef-
fet, les informations obtenues à partir de l’échantillon doivent

9
Armel Yodé

pouvoir être étendues, sans erreur grave, à l’ensemble de la po-


pulation.
Enquête statistique : C’est l’opération consistant à collecter des
données sur l’ensemble des individus d’un échantillon ou éven-
tuellement la population entière.
Recensement : C’est la collecte des données effectuée sur toute la
population.
Sondage : C’est la collecte des données effectuée sur un échantillon
de la population.
Caractère : C’est une grandeur ou un attribut observable sur un
individu. Parfois, on emploie le terme de variable statistique au
lieu de caractère.
Modalité : C’est un état du caractère ; les modalités d’un carac-
tère sont exhaustives et incompatibles, c’est à dire que chaque
individu présente une et une seule modalité du caractère.
Série statistique : C’est la suite des valeurs du caractère observée
sur chaque individu de l’ensemble étudié (population ou échan-
tillon).

1.2 Caractères
On distingue deux types de caractères : le caractère qualitatif et le
caractère quantitatif.

1.2.1 Caractère qualitatif


Le caractère est dit qualitatif si ses modalités sont non mesurables.
Le caractère qualitatif est dit ordinal s’il existe un ordre entre ses mo-
dalités. Dans le cas contraire, il est dit qualitatif nominal.
Exemple 1. Caractère qualitatif ordinal.
- Population : la classe.
- Individu : un étudiant
- Caractère : décision du jury
- Modalités : ajourné, passable, assez-bien, bien, très bien.
Exemple 2. Caractère qualitatif nominal.
- Population : la classe.

Armel Yodé 10
Armel Yodé

- Individu : un étudiant
- Caractère : groupe sanguin.
- Modalités : A, B, AB et O.

1.2.2 Caractère quantitatif


Lorsque les modalités d’un caractère sont mesurables, on dit que ce
caractère est quantitatif.

1.2.2.1 Caractère quantitatif discret


Le caractère quantitatif est dit discret lorsqu’il ne peut prendre que
des valeurs isolées notées par exemple x1 , x2 , . . . , xk où k est le nombre
de modalités.

Exemple 3. - Population : le personnel d’une entreprise


- Individu : un employé
- Caractère : nombre d’enfants
- Modalités : 0, 1, 2, 3, 4, 5, 6 et 7.

1.2.2.2 Caractère quantitatif continu


Le caractère quantitatif est dit continu lorsqu’il peut prendre n’im-
porte quelle valeur d’un intervalle de l’ensemble des nombres réels R.
Dans ce cas, l’intervalle des valeurs possibles est divisé en k classes

[a0 , a1 [, [a1 , a2 [, . . . , [ak−1 , ak [, où a0 < a1 < . . . < ak−1 < ak .


a +a
aj−1 et aj sont les frontières de la j-ième classe, cj = j−12 j est le
centre de celle-ci. L’amplitude de cette classe est aj − aj−1 . Dans la
suite, on supposera que les observations d’une classe sont concentrées
au centre.

Exemple 4. - Population : l’ensemble des ouvriers d’une entre-


prise
- Individu : un ouvrier
- Caractère : salaire mensuel net (en milliers francs)
- Modalités : [80, 100[, [100, 110[, [110, 120[, [120, 130[ et [130, 150[.

Armel Yodé 11
Armel Yodé

La répartition en classes des données nécessite de déefinir a priori le


nombre de classes J et donc l’amplitude de chaque classe. Il existe des
formules qui nous permettent détablir le nombre de classes et l’intervalle
de classe (l’amplitude) pour une série statistique de n observations.
— La règle de Sturge : J = 1 + (3.3 ∗ log10 (n)
— La règle de Yule :J = 2.5n1/4 .
L’intervalle de classe est obtenue ensuite de la manière suivante : lon-
gueur de l’intervalle = (xmax − xmin )/J, ou xmax (resp. xmin ) désigne
la plus grande (resp. la plus petite) valeur observée.

1.3 Effectif, fréquences


On observe un caractère X présentant k modalités, sur n individus.
L’effectif ni de la i-ème modalité du caractère est le nombre d’individus
qui possède cette modalité. On a

k
X
n = n1 + . . . + nk = ni .
i=1

On appelle fréquence de la i-ème modalité le rapport


ni
fi = .
n
La fréquence est la proportion par rapport au nombre d’observations,
des individus pour lesquels le caractère prend la valeur xi ou appartient
à la classe [ai , ai+1 [. Elle est un nombre réel compris entre 0 et 1. Nous
avons
Xk
fi = 1.
i=1

On exprime la fréquence souvent en pourcentage.

On suppose que les modalités du caractère quantitatif étudié sont ran-


gées par ordre croissant. L’effectif cumulé croissant de la i-ème moda-
lité est la somme des effectifs des modalités inférieures ou égales à cette
modalité :
Xi
Ni = nj .
j=1

Armel Yodé 12
Armel Yodé

La fréquence cumulée croissante de la i-ème modalité est la somme des


fréquences des modalités inférieures ou égales à cette modalité :
i
X
Fi = fj .
j=1

Cette fréquence représente la proportion des observation inférieures ou


égales à la i-ème modalité du caractère quantitatif si il est discret ou
bien inférieures à la borne supérieure du i-ème intervalle s’il est continu.

L’effectif cumulé décroissant de la i-ème modalité est la somme des


effectifs des modalités supérieures ou égales à cette modalité :
k
X
Di = nj
j=i

La fréquence cumulée décroissante de la i-ème modalité est la somme


des fréquences des modalités supérieures ou égales à cette modalité :
k
X
Gi = fj .
j=i

1.4 Présentation générale des tableaux sta-


tistiques
On considère un échantillon de taille n issu d’une population. Pour
chaque individu, on fait une observation concernant le caractère X
comportant k modalités M1 , M2 ,. . . , Mk . On obtient une série statis-
tique x1 , . . . , xn . Les données recueillies, appelées données brutes, sont
soumises à un premier traitement afin d’en faciliter à la fois la présen-
tation et l’exploitation. Cela consiste à classer chacun des n individus
dans les k sous-ensembles définis par les diverses modalités du carac-
tère X. Pour chaque modalité Mi , on pourra inscrire dans le tableau
statistique son effectif ni , son effectif cumulé croissant ou décroissant,
sa fréquence fi et sa fréquence cumulée croissante ou décroissante. On
prendra toujours soin de préciser dans la présentation du tableau :
- la population étudiée et le caractère ;
- l’origine du renseignement.

Armel Yodé 13
Armel Yodé

Modalité Effectif Effectif Cumulé Fréquence Fréquence cumulée


M1 n1 n1 f1 = nn1 F1 = f 1
M2 n2 n1 + n2 f2 = nn2 F2 = f1 + f2
.. .. .. .. ..
. . . . .
j j
nj
X X
Mj nj n= ni fj = n Fj = fi
i=1 i=1
.. .. .. .. ..
. . . . .
X k k
X
nk
Mk nk n= ni fk = n Fk = fi = 1
i=1 i=1

Table 1.1 – Tableau statistique d’un caractère

La présentation des données sous forme de tableaux est intéressante car


elle propose un premier résumé. On dégage ainsi les tendances de la po-
pulation. Ces tableaux vont nous permettre de faire des représentations
graphiques. L’idée sera de rendre compte visuellement du résumé que
nous avons commencé. Ensuite, pour les caractères quantitatifs, nous
chercherons à résumer numériquement l’information.

Armel Yodé 14
Chapitre 2

Représentations
graphiques

2.1 Introduction
La représentation graphique a pour objectif de visualiser la distribu-
tion des données. Dans ce chapitre, nous passons en revue les principales
représentations graphiques utilisées dans les analyses statistiques. Se-
lon le type de variable statistique étudié, on a recours à des graphiques
différents.

2.2 Diagrammes à secteurs


Les diagrammes à secteurs conviennent pour représenter les effectifs
et les fréquences des caractères qualitatifs ou des caractères quantitatifs
discrets. Un diagramme en secteurs est un graphique constitué d’un
cercle divisé en secteurs dont les angles au centre sont proportionnels
aux effectifs (ou aux fréquences). L’angle αi d’une modalité d’effectif
ni ou de fréquence fi est donné en dégrés par

ni
αi = × 360 = fi × 360.
n

Exemple 5. Caractère qualitatif :

15
Armel Yodé

Continent Effectif Fréquence (%)


Afrique 168238 44.7
Europe 164542 43.72
Amérique 27540 7.32
Asie 15058 4.00
Océanie 1014 0.27
Total 376392 100

Table 2.1 – Répartition des touristes et visiteurs arrivés à l’aéoroport


Félix Houphouet-Boigny par continent de provenance en 1999
Source : Ministère de l’Economie et des Finances, 2007.

Afrique

Oceanie
Asie

Amerique

Europe

Armel Yodé 16
Armel Yodé

2.3 Diagramme en barres, diagramme en


bâtons
Les diagrammes en barres et les diagrammes en bâtons conviennent
pour représenter les fréquences des caractères qualitatifs ou quantitatifs
discrets. Les modalités du caractère sont en abscisse et les fréquences
sont en ordonné. Dans le cas d’un caractère qualitatif nominal, la posi-
tion des modalités n’a pas de signification particulière. Si le caractère
est qualitatif ordinal ou quantitatif discret, on placera les modalités
dans leur ordre naturel.
— Le digramme en barres : à chaque modalité du caractère,
on associe un rectangle de base constante dont la hauteur est
proportionnelle à la fréquence.
— Le diagramme en bâtons : à chaque modalité du caractère,
on fait correspondre un segment vertical de longueur proportion-
nelle à la fréquence de cette modalité.

Exemple 6. Le tableau suivant donne la répartition selon le groupe


sanguin de 50 individus pris au hasard dans une population :

Groupe sanguin A B AB O
Effectif 25 10 12 3

1. Déterminer la variable statistique et son type.

Variable statistique : groupe sanguin


Nature : qualitative nominale.
2. Donnez une représentation graphique qui fasse apparaı̂tre l’im-
portance relative des différents groupes sanguins.

Nous pouvons faire un diagramme en barres ou un diagramme


en secteurs

Exemple 7. A Cauphygombokro, en vue d’instaurer la taxe d’habita-


tion, une enquête portant sur le nombre de pièces du logement occupé
a été réalisée auprès des ménages. Cette enquête a donné les résultats
suivants :

Armel Yodé 17
Armel Yodé

25
20
15
10
5
0

A B AB O

Figure 2.1 – Diagramme en barres de la répartition des individus selon


le groupe sanguin

Armel Yodé 18
Armel Yodé

Nomrbe de pièces Nombre de ménages


1 20
2 40
3 40
4 60
5 40

1. Caractériser la distribution (population, individu, caractère, na-


ture du caractère, modalités)
Population : l’ensemble des ménages de Cauphygombokro
Individu : un ménage
Caractère : nombre de pièces du logement occupé
Modalités : 1,2,3,4,5.
2. Tracer le diagramme en bâtons.

2.4 Histogramme
L’histogramme est la représetation graphique de la distribution des
effectifs ou des fréquences d’une variable statistique continue. Pour
construire l’histogramme, on place en abscisse les différentes extrémités
ai des classes, puis on trace, pour chaque classe, un rectangle parallèle
aux axes, de telle sorte que la partie parallèle à l’axe des abscisses ait
une longueur correspondant à l’amplitude de la classe et que la surface
du rectangle soit proportionnelle à l’effectif (ou à la fréquence) de la
classe (ceci afin de bien visualiser l’importance de chaque classe).
- Choix de l’unité d’amplitude u : on retiendra par exemple le
pgcd des diverses amplitudes.
- Expression des amplitudes dans cette nouvelle unité d’ampli-
tude :
ai − ai−1
ei =
u
- La hauteur hi de chaque rectangle est égale à
fi
hi =
ai
de telle sorte que la surface des rectangles représentatifs est égale
à la fréquence de la classe correspondante.

Armel Yodé 19
Armel Yodé

60
50
40
30
20
10
0

1 2 3 4 5

Figure 2.2 – Diagramme en bâtons de la répartition des ménages selon


le nombre d’enfants

Armel Yodé 20
Armel Yodé

Salaire Effectif Fréquence (%) Fréquence cumulées (%)


[80, 100[ 26 18.6 18.6
[100, 110[ 33 23.5 42.1
[110, 120[ 64 45.8 87.9
[120, 130[ 7 5.0 92.9
[130, 150[ 10 7.1 100
Total 140 100

Table 2.2 – Répartition des ouvriers selon leur salaire mensuel net (en
milliers francs).

Exemple 8. Traçons l’histogramme des fréquences.

2.5 Diagramme de fréquences cumulées


2.5.1 Cas d’un caractère qualitatif ordinal
2.5.2 Cas d’un caractère quantitatif discret
C’est la représentation graphique de la fonction FX définie par

0 si x < x1

FX (x) = Fi si xi ≤ x < xi+1 i = 1, . . . , k − 1,

1 si x ≥ xk

ou

0 si x < x1

FX (x) = Ni si xi ≤ x < xi+1 i = 1, . . . , k − 1,

n si x ≥ xk

Exemple 9. Répartition des ménages selon le nombre de pièces du


logement occupé

Eff Freq FreqCum


1 20 10 10
2 40 20 30
3 40 20 50
4 60 30 80
5 40 20 100

Armel Yodé 21
Armel Yodé

0.04
0.03
0.02
0.01
0.00

80 100 110 120 130 150

Figure 2.3 – Histogramme des fréquences de la répartition des ouvriers


selon leur salaire mensuel net

Armel Yodé 22
Armel Yodé

0 si x < 1


10 si 1 ≤ x < 2




30 si 2 ≤ x < 3
F (x) =


 50 si 3 ≤ x < 4
80 si 4 ≤ x < 5





100 x ≥ 5

2.5.3 Cas d’un caractère quantitatif continu


La courbe cumulative est la représentation graphique de la fonction
cumulative. Les observations étant groupées par classe, on ne connait
de cette fonction que les valeurs qui correspondent aux extrémités su-
périeures de chaque classe et pour lesquelles elle est égale à la fréquence
cumulée Fi :
F (ai ) = Fi
Exemple 10. Dans notre exemple, nous avons :

F (80) = 0
F (100) = 0.186
F (110) = 0.421
F (120) = 0.879
F (130) = 0.929
F (150) = 1.

Armel Yodé 23
Armel Yodé

1.0
0.8
0.6
0.4
0.2
0.0

0 1 2 3 4 5 6

Figure 2.4 – Courbe cumulative de la répartition des ménages selon


le nombre de pièces du logement occupé

Armel Yodé 24
Armel Yodé

1.0
0.8
0.6
0.4
0.2
0.0

80 100 110 120 130 150

Figure 2.5 – Courbe cumulative de la répartition des ouvriers selon


leur salaire mensuel net.

Armel Yodé 25
Armel Yodé

Armel Yodé 26
Chapitre 3

Paramètres numériques

On distingue les paramètres de tendance centrale (ou de position ou


de localisation), les paramètres de dispersion, les paramètres de concen-
tration et les paramètres de forme.

3.1 Paramètres de tendance centrale


Les paramètres de tendance centrale ont pour objet de résumer la
série d’observations par une valeur considérée comme représentative.
Selon les cas, certains sont plus appropriés que d’autres.

3.1.1 Le mode
Le mode peut être calculé pour tous les types de caractère (quanti-
tatif ou qualitatif). Le mode n’est pas nécessairement unique.

3.1.1.1 Caractère quantitatif discret


Le mode d’un caractère quantitatif discret est la valeur pour laquelle
la fréquence est la plus élevée. Graphiquement, le mode est la modalité
qui correspond au sommet du diagramme en bâton.

3.1.1.2 Caractère quantitatif continu


Le mode est plus difficile à définir dans le cas d’un caractère quanti-
tatif continu. Lorsque les données sont regroupées en classes, on définit

27
Armel Yodé

Figure 3.1 – Détermination du mode dans le cas d’un caractère continu

la classe modale. La classe modale n’est pas la classe de plus grande fré-
quence mais la classe de plus grande densité c’est à dire de plus grande
fréquence par amplitude. Il est néanmoins possible de déterminer une
valeur unique comme mode.

La classe modale [xi , xi+1 [ étant déterminée, le mode M0 est égale est :
∆1
M0 = x i + (xi+1 − xi ).
∆1 + ∆2
Lorsque les classes adjacentes à la classe modale ont des densités de
fréquences égales, le mode coincide avec le centre de la classe modale.

3.1.1.3 Remarques
- Le mode dépend beaucoup de la répartition en classes.
-

3.1.2 La moyenne arithmétique


3.1.2.1 Données brutes
Pour une série statistique x1 , x2 , . . . , xn , on définit la moyenne par
n
1X
x̄n = xi .
n i=1

Armel Yodé 28
Armel Yodé

C’est la somme de toutes les observations divisée par le nombre total


des observations.

3.1.2.2 Données rangées : caractère quantitatif discret


Pour un caractère quantitatif discret dont les n observations sont
rangées selon ses k modalités x1 , . . . , xk d’effectifs respectifs n1 , . . . , nk ,
la moyenne est
k
1X
x̄n = ni xi .
n i=1

3.1.2.3 Données rangées : caractère quantitatif continu


Pour un caractère quantitatif continu dont les n observations ont
été réparties dans k intervalles ([ai−1 , ai [)i=1,...,k , la moyenne est
k
1X
x̄ = ni ci
n i=1
ai−1 + ai
où ci = est le centre de la classe [ai−1 , ai [.
2

3.1.2.4 Remarques
- La moyenne n’est pas nécessairement une valeur observable du
caractère.
- La moyenne est sensible aux valeurs extrêmes ou atypiques.

3.1.3 La moyenne géométrique


La moyenne géométrique est définie par
v
u n Y n 1/n
uY
G = n t xni i = xni i xi ≥ 0.
i=1 i=1

3.1.4 La moyenne harmonique


La moyenne harmonique, H, est l’inverse de la moyenne arithmé-
tique des inverses des obervations :
n
H = Pk n .
i
i=1 xi

Armel Yodé 29
Armel Yodé

3.1.5 La moyenne quadratique


La moyenne quadratique est définie par
v
u
u1 X k
Q= t ni x2i .
n i=1

Remarque 1. Pour toute série statistique, l’inégalité suivante est vé-


rifiée :
H < G < x̄n < Q.

3.1.6 La médiane
La médiane Me est la valeur du caractère pour laquelle la fréquence
cumulée est égale à 0.5. Elle correspond donc au centre de la série
statistique classée par ordre croissant ou à la valeur pour laquelle 50%
des valeurs observées sont supérieures et 50% sont inférieures.

3.1.6.1 Caractère quantitatif discret


On procède ainsi après avoir rangé les n observations x1 , x2 , . . . , xn
par ordre croissant x(1) ≤ x(2) ≤ . . . ≤ x(n) :
- si n est impair, alors n = 2m + 1 et la médiane est la valeur
Me = x(m+1) .
- si n est pair, alors n = 2m et une médiane est une valeur quel-
conque entre x(m) et x(m+1) ; (x(m) , x(m+1) ) est appelé intervalle
médian. Dans ce cas, on prend souvent le milieu comme médiane,
c’est à dire
x(m) + x(m+1)
Me = .
2

3.1.6.2 Caractère quantitatif continu


On utilisera la méthode de l’interpolation linéaire exposée ci-dessous.

3.1.6.3 Remarques
- La médiane peut être calculéee pour un caractère quantitatif et
pour un caractère qualitatif ordinal.
- La médiane est plus robuste que la moyenne car elle n’est pas
influencée par les valeurs extrêmes.
- La médiane est influencée par le nombre d’observations.

Armel Yodé 30
Armel Yodé

3.1.7 Les quantiles


Le quantile d’ordre α est la valeur xα du caractère qui laisse une
proportion α des observations en dessous et 1 − α des observations au
dessus d’elle. Les fractiles sont les quantiles qui partitionnent les don-
nées triées en classes de taille égale. Les fractiles les plus utilisés sont
les quartiles, les déciles et les centiles.

Les quartiles sont au nombre de trois.


- Le premier quartile Q1 est le quantile d’ordre 14 ; c’est la valeur
du caractère telle qu’il ait 25% des observations qui lui soient
inférieures et 75% supérieures.
- Le deuxième quartile Q2 est le quantile d’ordre 21 , est la médiane.
- Le troisième quartile Q3 est la quantile d’ordre 34 ; c’est la valeur
du caractère telle que 75% des observations lui soient inférieures
et 25% supérieures.
Les quartiles Q1 , Q2 et Q3 partagent la série ordonnée en quatre groupes
de même effectif (25% chacun).
Remarque 2. Un décile est l’une des neuf valeurs qui partagent la
série ordonnée en 10 groupes de même effectif (10% chacun). Un centile
est l’une des cent valeurs qui partagent la série ordonnée en 100 groupes
de même effectif (1% chacun).
Détermination pratique de la médiane
On utilise le tableau des effectifs cumulés ou des fréquences cumulées.

Caractère quantitatif discret : s’il existe une modalité xj du ca-


ractère telle que Nj−1 < αn ≤ Nj ou Fj−1 < α ≤ Fj alors le quantile
d’ordre α est xj .
Caractère quantitatif continu : soit la première classe dont la fré-
quence empirique est supérieure ou égale à α. Notons là Ci = [ai−1 , ai [
et appelons Fi sa fréquence cumulée. Si Fi = α, le quantile est ai .
Dans le cas contraire, Fi > α, considérons les points de coordonnées
(ai−1 , Fi−1 ) et (ai , Fi ), Fi−1 est la fréquence cumulée de la classe pré-
cédant Ci si elle existe, 0 sinon. La droite passant par ces deux points
passe par un point d’ordonées α dont l’abscisse est xα .

ai−1 Fi−1
xα α
ai Fi

Armel Yodé 31
Armel Yodé

On tire xα à partir de la formule suivante :


xα − ai−1 ai − ai−1
= .
α − Fi−1 Fi − Fi−1
Par suite
α − Fi−1
xα = ai−1 + (ai − ai−1 ) .
Fi − Fi−1
Exemple 11. Détermination des quartiles.
On considère le tableau statistique 8.

100 18.6
Q1 25
110 42.1

Par suite
25 − 18.6
Q1 = 100 + (110 − 100) = 102.72
42.1 − 18.6
110 42.1
Q2 50
120 87.9
Par suite
50 − 42.1
Q2 = 110 + (120 − 110) = 111.72
87.9 − 42.1
110 42.1
Q3 75
120 87.9
Par suite
75 − 42.1
Q3 = 110 + (120 − 110) = 117.18
87.9 − 42.1

3.1.8 Boı̂te à moustaches


La boı̂te à moustaches ou boxplot est un diagramme qui permet de
représenter la distribution d’un caractère. Ce diagramme est composé
de :
- un rectangle qui s’étend du premier au troisième quartile ; le
rectangle est divisé par une ligne correspondant à la médiane ;

Armel Yodé 32
Armel Yodé

- ce rectangle est complété par deux segments de droites ; pour les


dessiner, on calcule d’abord les bornes

b− = Q1 − 1.5(Q3 − Q1 )

b+ = Q3 + 1.5(Q3 − Q1 ).
Les valeurs au-délà des moustaches sont des valeurs hors norme
éventuellement suspectes ou aberrantes mais pas nécessairement.
Ce diagramme est utilisé notamment pour comparer un même caractère
dans deux ou plusieurs échantillons de tailles différentes.

3.2 Paramètres de dispersion


Exemple 12. Deux groupes d’étudiants ont été observés selon la note
obtenue en statistique descriptive :

Groupe 1 2 5 10 10 10 15 18
Groupe 2 8 9 10 10 10 11 12

Pour le groupe 1 : M01 = Me1 = X 1 = 10


Pour le groupe 2 : M02 = Me2 = X 2 = 10.
On remarque que les deux séries présentent un même mode, une même

Armel Yodé 33
Armel Yodé

médiane et une même moyenne. Cependant, leur distribution se fait


d’une manière nettement différente. En effet, contrairement au groupe
1, les notes du groupe 2 ne s’écartent pas trop des valeurs centrales
(M e = X̄ = 10). Ainsi, les indicateurs de tendance centrale peuvent
s’avèrer insuffisant pour permettre à eux seuls de résumer et de com-
parer deux ou plusieurs séries statistiques, d’où la nécessité de calculer
d’autres indicateurs dits de dispersion.
Les paramètres de dispersion servent à préciser la variabilité de la
série statistique, c’est à dire à résumer l’éloignement de l’ensemble des
observations par rapport à leur tendance centrale.

3.2.1 L’étendue
On appelle étendue l’écart entre la plus grande valeur et la plus
petite valeur. Posons
xmin = min(x1 , . . . , xn ) xmax = max(x1 , . . . , xn ).
L’etendue est définie par
E = xmax − xmin .
Plus l’étendue est faible, plus la série est moins dispersée. L’inconvé-
nient majeur de l’étendue est qu’il ne dépend que des valeurs extrêmes
qui sont souvent exceptionnelles et aberrantes.

3.2.2 L’écart moyen absolu


Pour un caractère quantitatif discret dont les n observations sont
rangées selon ses k modalités x1 , . . . , xk d’effectifs respectifs n1 , . . . , nk ,
l’écart absolu moyen est le nombre
k
1X
EM A = ni | xi − x̄n | .
n i=1

Pour un caractère quantitatif continu dont les n observations ont été


réparties dans k intervalles ([ai , ai+1 [)i=1,...,k , l’écart absolu moyen est
le nombre
k
1X
EM A = ni | ci − x̄n |,
n i=1
ai + ai+1
où ci = est le centre de la classe [ai , ai+1 [.
2

Armel Yodé 34
Armel Yodé

Remarque 3. On appelle écart absolu par rapport à la médiane Me :

k
1X
EM A1 = n i | x i − Me | .
n i=1

Cet indicateur de dispersion tient compte de tous les écarts entre


les valeurs observées et la moyenne arithmétique. Son inconvénient est
qu’il n’est pas commode pour le calcul algébrique vu la présence de
l’expression de la valeur absolue. Une solution alternative consiste à
considérer la moyenne des carrés des écarts et de calculer ensuite la
racine carrée.

3.2.3 Variance, écart-type


Pour un caractère quantitatif discret dont les n observations sont
rangées selon ses k modalités x1 , . . . , xk d’effectifs respectifs n1 , . . . , nk ,

k
1X
σ2 = ni (xi − x̄)2 .
n i=1

Pour un caractère quantitatif continu dont les n observations ont été


réparties dans k intervalles ([ai , ai+1 [)i=1,...,k , la variance est

k
1X
σ2 = ni (ci − x̄)2 .
n i=1

ai + ai+1
où ci = est le centre de la classe [ai , ai+1 [.
2
L’écart-type σ est la racine carrée de la variance.

La variance mesure la dispersion des valeurs autour de la moyenne. La


variance est exprimée dans le carré de l’unité de mesure de la variable.
C’est la raison pour laquelle on ne doit pas interpréter la variance mais
plutôt sa racine carrée : l’écart-type. L’écart-type est utilisé comme un
indicateur de la dispersion de la série statistique. Plus il est grand, plus
la dispersion des observations autour de la moyenne de la variable est
forte, plus la population est hétérogène.

Armel Yodé 35
Armel Yodé

3.2.4 L’écart inter-quartile


L’intervalle interquartile est l’intervalle [Q1 , Q3 ]. L’écart interquar-
tile est défini par
IQ = Q3 − Q1 .

Nous avons 50% des observations qui se trouvent entre Q1 et Q3 . Ainsi,


50% des observations s’étalent sur un intervalle de longueur égale à
Q3 − Q1 . Plus l’intervalle interquartiles est petit, plus la dispersion est
faible et plus la population est homogène.
Cette quantité mesure la dispersion autour de la médiane. Plus IQ est
grand, plus il existe des valeurs éloignées de la médiane.

3.2.5 Le Coefficient de variation


Le coefficient de variation CV est défini comme le rapport de l’écart-
type à la moyenne :
σ
CV = .

C’est un nombre sans dimension qui mesure la proportion de la moyenne
expliquée par l’écart-type. Le coefficient de variation permet de compa-
rer deux ou plusieurs distributions exprimées dans des unités différentes
et qui n’ont pas le même ordre de grandeur (les moyennes sont diffé-
rentes). Le coefficient de variation est souvent exprimé en pourcentage.
Plus le coefficient de variation est faible, plus la dispersion est faible et
plus la population est homogène.

3.3 Les paramètres de concentration


La notion de concentration tient une place importante dans les
études économiques ; on parle de concentration des entreprises, de concen-
tration du pouvoir ou de la richesse, etc. L’étude de concentration ne
s’applique qu’à des variables statistiques continues à valeurs positives
et cumulables. Il est clair qu’elle ne peut s’appliquer à des ensembles
d’individus classés selon l’âge, la taille ou le poids, parce que la somme
des âges par exemple d’une population n’a pas de signification. Elle a
pour but de mesurer les inégalités de répartition d’une masse totale.

Armel Yodé 36
Armel Yodé

3.3.1 La médiale
La médiale est la valeur du caractère qui partage la valeur totale
ou la masse totale en deux parties égales. La médiale se détermine par
interpolation linéaire sur les valeurs globales relatives cumulées crois-
santes.
Soit X un caractère continu dont les observations sont rangées dans les
classes [ai−1 , ai [, k = 1, . . . , k. Soit ni l’effectif de la classe [ai−1 , ai [ et
ai−1 + ai
ci = son centre.
2
• On appelle ni ci la valeur globale (v.g.) associée à la classe [ai−1 , ai [.
Xn
• ni ci est appelée valeur totale ou masse totale du caractère
i=1
étudié.
ni ci
• qi = n est la valeur globale relative (v.g.r.) associée à la
X
n i ci
i=1
classe [ai−1 , ai [. qi désigne la part, dans la valeur totale, detenur
par les individus ayant une valeur du caractère appartenant à la
classe [ai−1 , ai [.
i
X
• V (ai ) = Vi = qj est appelée valeur globale relative cumulée
j=1
croissante (v.g.r.c.c). Elle indique la part, dans la valeur totale,
detenue par les individus ayant une valeur du caractère appar-
tenant à la classe [ai−1 , ai [.

La médiale M vérifie V (M ) = 0.5. La détermination de la médiale


se fait en deux étapes :
1. Soit la première classe [ai−1 , ai [ dont la valeur globale relative
cumulée croissante Vi est supérieure ou égale à 0.5. Si Vi = 0.5
alors la médiale est M = Fi . Sinon, nous avons Vi−1 < 0.5 < Vi .
2. Par interpolation linéaire, on calcule la valeur de la médiale :

ai−1 Vi−1
M 0.5
ai Vi

Armel Yodé 37
Armel Yodé

Modalié Effectif Centre Valeur Valeur gloable Valeur gloable


globale relative relative cumulée
a0 +a1 n1 c1
[a0 , a1 [ n1 c1 = 2 n1 c1 q1 = Pk V1 = q1
i=1 n1 c1
a1 +a2 n2 c2
[a1 , a2 [ n2 c2 = 2 n2 c2 q2 = Pk V2 = q1 + q2
i=1 ni ci
.. .. .. .. .. ..
. . . . . .
.. .. .. .. .. ..
. . . . . .
ai−1 +ai ni ci Pi
[ai−1 , ai [ ni ci = 2 ni ci qi = Pk Vi = j=1 qj
i=1 ni ci
.. .. .. .. .. ..
. . . . . .
.. .. .. .. .. ..
. . . . . .
a0 +a1 nk ck Pk
[ak−1 , ak [ nk ck = 2 nk ck qk = Pk Vk = j=1 qj =1
i=1 ni ci
Total n

Table 3.1 – Tableau de calcul de la médiale

ai − ai−1 M − ai−1 0.5 − Vi−1


= ⇔ M = ai−1 + (ai − ai−1 ).
Vi − Vi−1 0.5 − Vi−1 Vi − Vi−1
Exemple 13. La médiale est le niveau de salaire qui divise en deux
la masse salariale : les salaires inférieurs à la médiale représentent la
moitié de la masse salariale et ceux supérieurs à la médiale représentent
aussi la moitié de la masse salariale.

Classe de salaire Effectif Centre Masse Valeur globale Valeur glaobale


(en milliers francs) de classe salariale relative relative cumulée
[80, 100[ 26 90 2340 15.15 15.15
[100, 110[ 33 105 3465 22.44 37.59
[110, 120[ 64 115 7360 47.67 85.26
[120, 130[ 7 125 875 5.67 90.93
[130, 150[ 10 140 1400 9.07 100
Total 140 15440

110 37.59
M 50
120 85.26

Armel Yodé 38
Armel Yodé

50 − 37.59
M = 110 + (120 − 110) × .
65.26 − 37.59

3.3.2 L’écart entre médiane et médiale


On appelle écart médiale-médiane d’une série statistique, le nombre
défini par :
∆M = M − Me .
Cet écart nous fournit un premier renseignement sur la concentration
d’une distribution statistique.
• Si ∆M = 0 ⇔ M = Me alors alors la concentration est nulle et
la répartition de la valeur totale est parfaitement égalitaire.
• Si ∆M 6= 0 alors la répartition de la valeur totale n’est pas
égalitaire. Cependant, aucune information sur l’intensité de cette
inégalité ne peut être avancée.
• Pour comparer la concentration de deux ou plusieurs séries sta-
∆M
tistiques, on peut utiliser le rapport . La concentration
E
d’une série est d’autant plus forte que le rapport est élevé. (E
représente l’etendue de la série).

3.3.3 La courbe de Lorenz


La courbe de Lorenz est obtenue en reliant, par des segments de
droites, les points de coordonnées (Fi , Vi ), i = 0, . . . , k avec (F0 , V0 ) =
(0, 0). Plus la courbe de Lorenz s’éloigne de la première bissectrice, plus
la concentration est forte et plus la répartition est inégalitaire.

3.3.4 L’indice de Gini


L’indice de Gini ou coefficient de Gini mesure le niveau d’inégalité
de la répartition d’une variable dans la population. L’indice de Gini est
compris entre 0 (égalité parfaite) et 1 (inégalité parfaite). Une baisse
de l’indice de Gini indique une diminution globale des inégalités. A
l’inverse, une élévation de l’indice reflète une augmentation globale des
inégalités.
Le coefficient de Gini se calcule à partir de la courbe de Lorenz. Pour
l’obtenir, il faut diviser l’aire de la zone hachuré en rouge, c’est-à-dire
l’espace entre la première bissectrice (représente l’égalité parfaite) et
la courbe de Lorenz (distribution observée des revenus disponible), par

Armel Yodé 39
Armel Yodé

l’aire du rectangle bleu. On obtient ainsi un rapport qui est le coefficient


de Gini (voir figure 3.2).

Figure 3.2 –

L’indice de Gini I est alors


k
X ni
I = 2S = 1 − (Vi + Vi−1 ).
i=1
n

3.4 Paramètres de forme


Les paramètres de forme permettent d’avoir une idée staisfaisante
et plus précise sur la forme de la distribution. On distingue les coeffi-
cients d’asymétrie et les coefficients d’aplatissement.
Une distribution est dite symétrique si les observations également dis-
persées de part et d’autre de la valeur centrale. Dans le cas contraire,
la distribution est dite asymétrique ou dissymétrique.

3.4.1 Moments
Pour un caractère quantitatif discret dont les n observations sont
rangées selon ses k modalités x1 , . . . , xk d’effectifs respectifs n1 , . . . , nk ,
le moment centré d’ordre r est défini par
k
1X
µr = ni (xi − x̄)r .
n i=1

Armel Yodé 40
Armel Yodé

Pour un caractère quantitatif continu dont les n observations ont été


réparties dans k intervalles ([ai , ai+1 [)i=1,...,k , le moment centré d’ordre
r est défini par
k
1X
µr = ni (ci − x̄)r ,
n i=1

ai + ai+1
où ci = est le centre de la classe [ai , ai+1 [.
2
Remarque 4. µ0 = 1, µ1 = 0 et µ2 est la variance.

3.4.2 Asymétrie
Le coefficient d’asymétrie de Pearson
Dans une distribution faiblement asymétrique, c’est la position du
mode par rapport à la moyenne (ou à la médiane) qui caractérise l’asy-
métrie. Le coefficient d’asymétrie de Pearson est défini par :

X̄ − M0
s= .
σ

Le coefficient d’asymétrie de Fisher


Le Coefficient d’asymétrie de Fisher permet de quantifier le degré de
déviation de la forme de la distribution par rapport à une distribution
symétrique. Il est défini par
µ3
s= 3/2
.
µ2

Le coefficient d’asymétrie de Yule


On compare ici létalement de la courbe de distribution à gauche de
la médiane et l’étalement à droite et à rapporter leur diiférence à leur
somme. Le coefficient d’asymétrie de Yule est défini par :

(Q3 − Q2 ) − (Q2 − Q1 ) Q1 + Q3 − 2Q2


s= = .
Q3 − Q1 Q3 − Q1

Armel Yodé 41
Armel Yodé

Figure 3.3 – s = 0 : la distribution symétrique.

Figure 3.4 – s > 0 : la distribution étalée à droite.

Interprétation
Quelque soit la formule adoptée, nous avons l’interprétation sui-
vante. Ces coefficients n’ont d’intérât que dans la mesure où ils per-
mettent de comparer les formes de deux ou plusieurs distributions ;
bien entendu, les comparaison ne sont valables que si la même formule
est retenue pour les diverses distributions.
1. s = 0 indique une distribution parfaitement symétrique. Dans
ce cas Me = M0 = x̄.
2. s > 0 indique une distribution unimodale étalée vers la droite.
Dans ce cas M0 < Me < x̄
3. s < 0 indique une distribution unimodale étalée vers la gauche.
Dans ce cas x̄ < Me < M0

3.4.3 L’aplatissement
Le coefficient d’aplatissement (kurtosis) permet de mesurer le re-
lief ou la platitude d’une courbe issue d’une distribution de fréquences.
On compare la courbe de fréquence de la distribution à la courbe de
fréquence de la distribution normale considérée comme la distribution

Armel Yodé 42
Armel Yodé

Figure 3.5 – s < 0 : la distribution étalée à gauche.

Figure 3.6 – γ = 0 : la distribution est normale.

idéale. On fait apparaı̂tre ainsi l’aplatissement ou l’allongement au voi-


sinage du mode. Quand la courbe est plus aplatie que la courbe nor-
male, on dit qu’elle est platicurtique ; quand elle est plus aigue, on dit
qu’elle est leptocurtique ; une courbe normale est dite mésocurtique. Le
coefficient d’aplatissement de Fisher est :
µ4
γ= −3 µ2 6= 0.
µ22
1. γ = 0 : la distribution est normale
2. γ > 0 : la distribution est aigue.

3. γ < 0 : la distribution est aplatie.

Figure 3.7 – γ > 0 : la distribution est aigue.

Armel Yodé 43
Armel Yodé

Figure 3.8 – γ < 0 : la distribution est aplatie.

Remarque 5. Les coefficients de kurtosis et de skewness peuvent être


utilisés pour s’assurer que les variables suivent une distribution nor-
male. On estime que le coefficient de symétrie ou skewness doit être
inférieur à 1 et le coefficient d’aplatissement ou kurtosis doit être infé-
rieur à 1.5 pour considérer que la variable suit bien une loi normale.

Armel Yodé 44
Chapitre 4

Indices statistiques

4.1 Introduction
Un indice est un instrument statistique permettant de caractériser
la variation relative d’un ensemble complexe entre deux situations de
temps ou de lieu appelées date de référence et date courante. Deux
catégories d’indices peuvent être distinguées selon le type de grandeur
étudiée. Ainsi, si l’on considère le prix d’un produit, la production d’une
entreprise donnée, le cours de l’action d’une société particulière, il s’agit
de grandeurs simples au sens où la grandeur est un nombre ne prenant
qu’une seule valeur dans une situation donnée. Les indices calculés sur
la base de ces grandeurs sont appelés indices élémentaires. En re-
vanche, le niveau général des prix, la production industrielle, le cours
des actions sont des grandeurs complexes dans la mesure où leur calcul
nécessite d’agréger un ensemble de valeurs hétérogènes (prix des diffé-
rents produits, production de diverses industries, cours de différentes
actions). Les indices calculés sur la base de ces grandeurs sont appelés
indices synthétiques.

4.2 Indices élémentaires


4.2.1 Définitions
Soit X une grandeur prenant la valeur Xt à la date t. La date peut
se rapporter au temps, à l’espace ou à l’évolution de tout autre critère.

45
Armel Yodé

Définition 1. On appelle indice élémentaire de la grandeur X à la


date t par rapport à la date 0 la quantité définie par
Xt
It/0 = .
X0
Exemple 14. La populaion ivoirienne est passée de 16 millions en
1998 à 22 millions en 2013. L’indice de la population ivoirienne en
2013 par rapport à 1998 est I2013/1998 = 137.5, soit une augmentation
de 37.5% en 15 ans.
L’indice élémentaire est le plus simple de tous les indices. Il permet
d’évaluer l’évolution de X entre la date de reférence 0 et la date cou-
rante t. Etant sans dimension, il permet aussi de comparer l’évolution
de deux ou plusieurs grandeurs de nature éventuellement différentes,
mesurées en unités différentes sur une même période.
Remarque 6. Un indice élémentaire It/0 est équivalent à une varia-
tion pourcentage de (It/0 − 1) ∗ 100.
Remarque 7. Dans la pratique, on exprime un indice élémentaire en
pourcentage :
Xt
It/0 = 100 × .
X0

4.2.2 Propriétés d’un indice


4.2.2.1 Circularité (ou transférabilité ou transitivité)
L’indice de la date 0 par rapport à la date de référence t doit être
égal au produit de l’indice de la date t par rapport à la date u par
l’indice de la date u par rapport à la date 0 :
It/0 = It/u × Iu/0 .
La circularité permet de changer de base en passant de la date de
référence 0 à la date de référence u. En effet, nous obtenons
It/0
It/u = .
Iu/0
La circularité entraı̂ne la propriété d’enchaı̂nement :
It/0 = It/t−1 × It−1/t−2 × · · · × I1/0 .
On obtient l’indice à la date t par rapport à la date 0 en faisant le pro-
duit des indices intermédiaires d’une date par rapport à la précédente.
On dit alors que l’on peut chaı̂ner les évolutions.

Armel Yodé 46
Armel Yodé

4.2.2.2 Réversibilité

L’indice de la date de référence par rapport à la date t doit être égal


à l’inverse de l’indice de la date t par rapport à la date de référence :

1
I1/0 = .
I0/1

Cette propriété est intéressante lorsqu’on se refère à un critère autre


que le temps.

4.3 Indices synthétiques


Les indices élémentaires retracent l’évolution d’une seule grandeur
parfaitement définie et homogène. Pour suivre les variations de gran-
deurs complexes qui sont composées d’un nombre plus ou moins impor-
tant de grandeurs simples, on utilise les indices synthétiques. Un indice
synthétique groupe en un nombre unique des indices élémentaires de
même nature. Toute la difficulté réside dans le choix des règles qui dé-
termineront l’indice synthétique. On établit alors une distinction entre
l’indice simple et l’indice pondéré :
a) L’indice est simple lorsque les indices élémentaires qui com-
posent l’indice synthétique entrent une fois et une fois seulement
dans le calcul.
b) L’indice est pondéré lorsque les indices élémentaires composants
n’entrent pas pour parties égales dans le calcul. Cette manière de
faire est déterminée par le souci d’accorder plus d’importance à
certains produits plutôt qu’à d’autres. On affecte donc à chaque
indice élémentaire un poids ou coefficient de pondération dif-
férent, compte tenu de l’importance que l’ont veut attribuer à
chaque produit, et l’on obtient un indice synthétique qui est une
moyenne pondérée des indices élémentaires composants.
Un indice synthétique est une combinaison d’indices élémentaires. Les
trois indices synthétiques classiques sont le Laspeyres, le Paasche et le
Fisher.
Soit X une grandeur complexe constituée de k grandeurs simples

X 1, . . . , X k .

Armel Yodé 47
Armel Yodé

L’indice élémentaire de la grandeur simple X i à la date t par rapport


à la date de reférence 0 est défini par

i Xti
It/0 = .
X0i

Soient
- ω0i l’importance relative de la grandeur simple X i à la date de
référence 0
- ωti l’importance relative de la grandeur simple X i à la date cou-
rante t

4.3.1 Indice de Laspeyres


Définition 2. L’indice de Laspeyres est la moyenne arithmétique pon-
dérée des indices élémentaires par les coefficients de pondération de la
date de référence ω0i :
Xk
Lt/0 = ω0i It/0
i
.
i=1

L’indice de Laspeyres ne présente ni la propriété de circularité, ni celle


de la reversibilité.

4.3.2 Indice de Paasche


Définition 3. L’indice de Paasche est la moyenne harmonique pondéré
des indices élémentaires par les ωti de la date courante :
k
1 X ωti
=
Pt/0 Ii
i=1 t/0

L’indice de Paasche ne possède ni la propriété de circularité ni celle de


la réversibilité.

4.3.3 L’indice de Fisher


Définition 4. L’indice de Fisher est la moyenne géométrique des in-
dices de Laspeyres et de Paasche :
q
Ft/0 = Lt/0 × Pt/0 .

Armel Yodé 48
Armel Yodé

L’avantage de l’indice de Fisher est qu’il jouit de la propriété de ré-


versibilité. Ce qui fait de lui un outil privilégié dans les comparaisons
géographiques.

4.3.4 Comparaison
Il n’existe pas de critère général permettant de statuer sur la supé-
riorité d’un indice synthétique par rapport à un autre. Il est cependant
possible de présenter les principaux avantages et inconvénients de ceux-
ci.
Supposons que l’on étudie l’évolution de la consommation d’un pa-
nier composé de plusieurs biens.
— Indice de Laspeyres. Les coefficients de pondération sont
fixes, c’est-à-dire que l’on suppose que la structure de la consom-
mation ne se modifie pas sur la période étudiée. En conséquence,
si l’on considère que les coefficients de pondération sont fixés à
la date de référence, plus la date courante est éloignée de cette
date, plus il est probable que la structure du panier de biens du
consommateur se soit modifiée et plus le risque que les coeffi-
cients de pondŕation soient obsolètes est important. Pour cette
raison, le principal inconvénient attribué à l’indice de Laspeyres
est qu’il tend à surestimer l’effet de l’évolution des prix sur le
pouvoir d’achat du consommateur dans la mesure où il ne tient
pas compte d’éventuelles substitutions entre les biens du panier
considéré.
— Indice de Paasche. Les coefficients de pondération sont ceux
de la date courante. Ceux-ci évoluent donc avec les prix, c’est-
à-dire que la part des différents biens au sein du panier consi-
déré évolue en même temps que les prix. Le calcul de l’indice
de Paasche nécessite en conséquence de disposer simultanément
des données relatives aux prix et aux quantités à chaque date
considéré (et non plus seulement des prix comme dans le cas
de l’indice de Laspeyres). Le principal inconvénient tient ici en
une difficulté de calcul supplémentaire liée à la disponibilité des
données, expliquant pourquoi l’indice de Laspeyres est plus fré-
quemment utilisé que l’indice de Paasche. Du fait de la variabi-
lité des coefficients de pondération, l’indice de Paasche tend, au
contraire de l’indice de Laspeyres, à sous-estimer l’effet de l’évo-
lution des prix sur le pouvoir d’achat du consommateur. Il est
important de souligner que les modifications de la structure de

Armel Yodé 49
Armel Yodé

consommation ne dépendent évidemment pas que de l’évolution


des prix relatifs des biens composant le panier.
— Agrégation. Les indices de Laspeyres et de Paasche ont des
structures de moyenne. On peut calculer la moyenne arithmé-
tique d’un ensemble à partir des moyennes des sous-ensembles
qui le composent. Il en résulte que l’indice de Laspeyres (resp.
de Paasche) d’un ensemble peut s’obtenir à partir des indices
des groupes formant cet ensemble en leur appliquant la formule
de Laspeyres (resp. de Paasche.

Exemple 15. Entre janvier 2006 et janvier 2010, l’évolution des prix
et du nombre d’exemplaires de journaux vendus en un mois par une
société de presse éditant trois journaux mensuels A, B et C a été la
suivante :

Jannvier 2013 Janvier 2017


Prix Quantité Prix Quantité
Journal A 1600 8000 1900 6500
Journal B 2600 4000 2950 5000
Journal C 3275 2000 4000 1500
1. La variation de recettes de la société de presse entre janvier 2013
et Janvier 2017 est de 11.26%, en effet :
33100000
V2017/2013 × 100 = × 100 ≈ 111, 26.
29750000
2. Cette variation fait intervenir un effet quantité et un effet prix
qu’on peut évaluer en calculant les indices des prix et des quan-
tités de Paasche et Laspeyres :
3. La variation de la valeur globale peut être décomposée en ses
deux effets prix et quantité. En effet, à partir de la formule

On peut établir le schéma de decomposition donné

Qualité Laspeyres Paasche Fisher


Réversibilité non non oui
1 1
mais : L0/t = Pt/0 mais : P0/t = Lt/0
Transitivité non non non
Agrégation oui oui non
Emploi Couramment utilisé peu utilisé quasiment inusité

Armel Yodé 50
Armel Yodé

4.3.5 Indices de prix, de quantité et de valeur


On s’interesse à l’évolution des dépenses concernant un groupe de
k biens de consommation étiquétés de 1 à k entre les dates 0 et 1. Nous
notons
pjt : prix du bien j à la date t
qtj : quantité du bien j à la date t.
La dépense consacrée au bien j à la date t est Dtj = pjt qtj . Le budget
total consacré au groupe de k biens de consommation est
k
X
Dt = pjt qtj .
j=1

On appelle coefficient budgétaire du bien j à la date t la part du budget


total consacré au bien j :
pj q j
ωtj = Pk t t j j
j=1 pt qt

Le coefficient budgétaire mesure l’importance relative des différents


biens dans le budget total.
Les indices élémentaires entre les dates 0 et 1 des grandeurs considérées
sont par définition :
pj
- I1/0 (pj ) = j1 : indice de prix du bien j
p0
q1j
- I1/0 (q j ) = : indice de quantité du bien j
q0j
pj1 q1j
- I1/0 (Dj ) = : indice de dépense du bien j
pj0 q0j
Ces trois indices sont liés par la relation suivante
I1/0 (Dj ) = I1/0 (pj )I1/0 (q j ).
L’indice de la dépense total est défini par
k
X
pj1 pj1
D1 j=1
I1/0 (D) = = k .
D0 X
pj0 pj0
j=1

Armel Yodé 51
Armel Yodé

Pour les indices de Laspeyres et de Paasche, les coefficients budgétaires


s’imposent comme coefficients de pondération.

Indice de Prix Quantité


X k X k
pj1 q0j pj0 q1j
j=1 j=1
Laspeyres L1/0 (p) = k
L1/0 (q) = k
X X
pj0 q0j pj0 q0j
j=1 j=1
k
X k
X
pj1 q1j pj1 q1j
j=1 j=1
Paasche P1/0 (p) = k
P1/0 (q) = k
X X
pj0 q1j pj1 q0j
j=1 j=1

Les indices de Laspeyres et de Paasche se présentent ainsi comme des


rapports de dépenses où le facteur (prix ou quantité) autre que celui
considéré est constant. L’indice de Laspeyres utilise les constantes de
la date de référence tandis que l’indice de Paasche utilise celles de la
date courante.

Armel Yodé 52

Vous aimerez peut-être aussi