[go: up one dir, main page]

0% ont trouvé ce document utile (0 vote)
210 vues29 pages

Chapitre 3:: Les Caractéristiques de Dispersion

Ce chapitre traite de la dispersion des données statistiques. Il présente plusieurs mesures de dispersion telles que la variance, l'écart-type, l'étendue et les quartiles. Ces concepts sont définis et illustrés avec des exemples.

Transféré par

yassine.elazhari.05
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
210 vues29 pages

Chapitre 3:: Les Caractéristiques de Dispersion

Ce chapitre traite de la dispersion des données statistiques. Il présente plusieurs mesures de dispersion telles que la variance, l'écart-type, l'étendue et les quartiles. Ces concepts sont définis et illustrés avec des exemples.

Transféré par

yassine.elazhari.05
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
Vous êtes sur la page 1/ 29

Chapitre 3:

Les caractéristiques de
dispersion
 L’étude de la tendance centrale d’une série
statistique est importante, mais reste
insuffisante. Deux séries peuvent avoir
même moyenne, même mode, même
médiane et être cependant très différentes
dans le cas où les observations peuvent
être plus au moins dispersées par rapport à
une même valeur centrale.
 Il est donc nécessaire d’introduire des
paramètres qui caractérisent la
dispersion des valeurs d’une série
statistique.
I- Variance et écart-type:
 1-1 Variance:
a) Définition: la variance d’une distribution statistique,
notée V(X) ou 2(X), est donnée par:
1 k
V ( X )   ni ( x i  x ) 2
n i 1
k
  f i ( xi  x) 2
i 1
Les xi sont les modalités dans le cas d’une v.s.d et
sont les centres de classes dans la cas d’une v.s.c.
b) Calcul pratique de la variance:
k k
1 1
V ( X )   ni ( x i  x )   ni x i  ( x)
2 2 2

n i 1 n i 1
k k
V ( X )   f i ( x i  x )   f x  ( x)
2 2
i i
2

i 1 i 1

V ( X )  x  ( x)
2 2
C- Propriétés de la variance:
 Soient a et b deux constantes
quelconques. On a alors:
 V(X+b) = V(X)
 V(aX) = a2 V(X)
 V(aX+b) = a2 V(X)
La variance est indépendante de l’origine
choisie, mais dépend de l’unité choisie.
La variance s’exprime au carré de l’unité de la
variable. On préfère alors utiliser sa racine
carrée qui est l’écart-type.
C- Ecart-type:
 Définition:
L’écart-type de X, noté X, est la racine
carrée de la variance:

1 k
 X  V (X )  
n i 1
n i ( x i  x ) 2

k
 
i 1
f i ( x i  x) 2
1
2

 k 2
  f i ( x i  x) 
 i 1 
Remarques :
1. L’écart-type est un paramètre de dispersion
qui s’exprime dans la même unité que le
observations xi.
2. L’écart-type est la moyenne quadratique des
écart à la moyenne arithmétique, on
l’appelle aussi: écart quadratique moyen
par rapport à la moyenne arithmétique.
3. La variance et l’écart-type ne peuvent
comparer la dispersion de deux variables
que si: elles ont la même unité.
C- Coefficient de variation:
 Le coefficient de variation, noté Cv, d’une
variable statistique positive de moyenne
arithmétique X et d’écart-type x est le
rapport: 
CV  X

 Cv est un paramètre de dispersion relative.


On l’utilise pour comparer deux séries
statistiques. Plus Cv est élevé, plus la
dispersion relative est forte.
Exercice 1:
 On donne la distribution suivante en
fréquences:
Classe [0 ; 10[ [10 ; 20[ [20 ; 30[ [30 ; 40[

Fréquence 0,10 0,20 0,30 0,40

 Calculer la variance, l’écart-type et le


coefficient de variation.
Correction :
2 2
fi xi x i
f i xi fi x i
Classe
[0 ; 10[ 0,10 5 25 0,50 2,5
[10 ; 20[ 0,20 15 225 3 45
[20 ; 30[ 0,30 25 625 7,5 187,5
[30 ; 40[ 0,40 35 1225 14 490
Total 1 --------- -------- 25 725
4
x   f i xi  25
i 1
4
V ( X )   ( f x )  ( x)  725  625  100
2
i i
2

i 1

 X  V ( X )  100  10
 X 10
CV    0,4
x 25
II- Les écarts simples:
 2-1 L’étendue:
 L’étendue d’une série statistique, noté E,
est la différence entre la plus grande et la
plus petite valeur de la variable statistique.
 Cas d’une v.s.d:
E = xmax – xmin
 Cas d’une v.s.c:
E = ek – e0
Exemple:
 Pour la série discrète suivante:
6 ; 12 ;19; 40 ; 50
E = 50-6 = 44

 Pour la série continue suivante:


[2 ; 10[ ; [10 ; 20[ ; [20 ; 30[ ; [30 ; 40[
E = e4 – e0 = 40 – 2= 38
2-2 Les quartiles:
 Les quartiles sont des valeurs qui partagent la
série statistique en 4 parties égales. On a trois
quartiles : Q1, Q2, Q3.
 Le premier quartile Q1 est la valeur de la série
statistique telle que 25% des observations lui sont
inférieures et 75% des observations lui sont
supérieures.
 Le deuxième quartile Q2 est la valeur de la série
statistique telle que 50% des observations lui sont
inférieures et 50% des observations lui sont
supérieures. Q2 est égal donc à la médiane.
 Le troisième quartile Q3 est la valeur de la
série statistique telle que 75% des
observations lui sont inférieures et 25% des
observations lui sont supérieures.

 L’intervalle interquartile ou l’écart


interquartile est la différence entre le
troisième et le premier quartile, soit
(Q3 - Q1). Il permet d’apprécier la dispersion
autour des valeurs centrales. Il contient
50% des observations.
Remarques :
 Q1, Q2 et Q3 partagent la population en 4
parties de même effectif:

e0 Q1 Q2 Q3 ek
 Pour comparer des distributions
statistiques différentes, on utilise l’écart
interquartile relatif:
Q3  Q1
Q r 
Q2
Exemple: ( Répartition des salaires
dans une entreprise)
Classe en DH ni fi (%) Ni Fi (%)
[3500 ; 3700[ 21 10,5 21 10,5
[3700 ; 4100[ 49 24,5 70 35
[4100 ; 4300[ 100 50 170 85
[4300 ; 4700[ 24 12 194 97
[4700 ; 5300 [ 6 3 200 100
Total 200 100 --------- ----------
 Calcul de Q1: (25% des individus ont une
modalité inférieure à Q1 )
 On a 10,5% des salariés ont un salaire
inférieur à 3700 Dh et 35% ont un salaire
inférieur à 4100 Dh. On a donc:
3700  Q1  4100

10,5  25  35
 Par interpolation linéaire, on aura:
25  10 ,5
Q1  3700  (4100  3700 ) 
35  10 ,5
Q1 = 3936,73 Dh
 Calcul de Q2: (50% des individus ont
une modalité inférieure à Q2 )
 On a 35% des salariés ont un salaire
inférieur à 4100 Dh et 85% ont un salaire
inférieur à 4300 Dh. On a donc:
4100  Q2  4300

35  50  85
 Par interpolation linéaire, on aura:
50  35
Q2  4100  (4300  4100) 
85  35
Q2 = 4160 Dh (Q2 = la médiane)
 Calcul de Q3: (75% des individus ont une
modalité inférieure à Q3 )
 On a 35% des salariés ont un salaire
inférieur à 4100 Dh et 85% ont un salaire
inférieur à 4300 Dh. On a donc:
4100  Q3  4300

35  75  85
 Par interpolation linéaire, on aura:
75  35
Q3  4100  (4300  4100) 
85  35
Q3 = 4260 Dh
Exercices corrigés:
 Exercice 1:
Les caractères suivants sont-ils qualitatifs
ou quantitatifs?
a)âge b) sexe c) taille
d) État matrimonial e) lieu de naissance
f) Taux de cholestérol g) la nationalité
Exercice 1 (correction):

 Les caractères b) ; d) ; e) et g) sont des


caractères qualitatifs car ils sont non
mesurable.

 Les caractères a) ; c) et f) sont des


caractères quantitatifs car à chaque
individu, on peut associer une valeur
numérique.
 Exercice 1:
 On considère l’ensemble des notes
obtenues, lors d’un examen noté sur 20,
par 50 étudiants:
10 08 03 12 13 09 12 09 12 11
11 11 08 05 13 14 14 06 12 16
07 11 10 10 02 15 12 10 01 14
11 07 08 10 13 09 13 09 07 13
11 19 09 04 10 08 09 06 07 14
1) Dépouiller ces données et présenter les
résultats dans un tableau. (on prendra les
classes suivantes: [0; 5[, [5; 7[, [7; 9[, [9; 11[,
[11; 13[, [13; 15[, [15; 20[ ).
2) Calculer les fréquences et les fréquences
cumulées.
3) Quelle est la proportion des étudiants ayant
une note inférieure à 9?
4) Quelle est la proportion des étudiants ayant
une note supérieure ou égale à 13?
5) Quelle est la proportion des étudiants ayant
une note comprise entre 5 et 20?
6) Quelle est la classe dont la densité est la plus
forte et celle dans la densité est plus faible?
Exercice 1 (correction):
 1)
classe ni
[0, 5[ 4
[5, 7[ 3
[7, 9[ 8
[9, 11[ 12
[11, 13[ 11
[13, 15[ 9
[15, 20[ 3
Total 50
j i
ni
fi  ; Fi  f1  f 2  ...  f i   f j
 2) 50 j 1
j 7
Fi  f i  f i 1  ...  f 7   f j
j i

classe ni fi Fi Fi

[0, 5[ 4 0,08 0,08 1


[5, 7[ 3 0,06 0,14 0,92
[7, 9[ 8 0,16 0,30 0,86
[9, 11[ 12 0,24 0,54 0,70
[11, 13[ 11 0,22 0,76 0,46
[13, 15[ 9 0,18 0,94 0,24
[15, 20[ 3 0,06 1 0,06
Total 50 1
 3) Proportion des étudiants ayant une note
inférieure à 9:
Il suffit de lire sur le tableau la fréquence
Cumulée croissante associée à la classe
[7; 9[ : F3 =0,30= 30% des étudiants ont une note
inférieure à 9 (qui ont au plus 9).

 4) Proportion des étudiants ayant une note


supérieure ou égale à 13:
Il suffit de lire sur le tableau la fréquence
Cumulée décroissante associée à la classe [13; 15[ :
0,24=24% des étudiants ont une note supérieure ou
égale
 5) On sait que la somme des fréquence est égale à
1. Donc, pour calculer la proportion des étudiants
ayant une note comprise entre 5 et 20, il suffit de
retrancher la fréquence associé à la première
classe [0; 5[ :
1-0,08 = 0,92 , donc: 92% des étudiants ont une
note comprise entre 5 et 20.
ni
classe ni fi ai di 
 6) 0,08
ai

[0, 5[ 4 5 0,8
[5, 7[ 3 0,06 2 1,5
[7, 9[ 8 0,16 2 4
[9, 11[ 12 0,24 2 6
[11, 13[ 11 0,22 2 5,5
[13, 15[ 9 0,18 2 4,5
[15, 20[ 3 0,06 5 0,6
Total 50 1
 la classe dont la densité est la plus forte est:
[9; 11[
 la classe dont la densité est la plus faible est:
[15; 20[

Vous aimerez peut-être aussi