BTS Statistiques à deux variables
I) Statistiques à une variable : rappel des principaux indicateurs statistiques
minimum effectif d'une valeur moyenne médiane
maximum effectif total variance 1er et 3ème quartiles
étendue fréquence écart-type écart interquartile
Exemple 1 : série brute
Voici les mesures la longueur en centimètre d'une série de barres de métal à la sortie d’une machine :
92,3 92,6 92,9 92,5 92,5 92,7 92,8 92,1
effectif total :
minimum : maximum : étendue :
moyenne : variance : écart-type :
Exemple 2 : série dépouillée
Voici un relevé de ventes hebdomadaires de voitures d'un vendeur sur 40 semaines :
[1, 3, 1, 1, 0, 3, 2, 2, 1, 2, 3, 2, 2, 3, 2, 1, 1, 4, 2, 0, 2, 1, 2, 2, 1, 2, 1, 0, 2, 1, 3, 0, 4, 3, 3, 1, 3, 2, 2, 1]
Nombre de voitures vendues 0 1 2 3 4
effectif 12 8
fréquence 0,1 0,3 0,05
moyenne : variance : écart-type :
1er quartile : médiane : 3e quartile :
Exemple 3 : regroupement par classes
On donne ci-dessous la masse en grammes de boîtes de fromage, relevées lors d'un contrôle.
322.9, 320.6, 324.0, 324.4, 326.5, 320.9, 327.4, 330.9, 327.4, 327.3, 322.8, 323.8, 325.8, 323.0, 321.5, 327.9, 320.0,
325.2, 326.9, 325.6, 322.4, 327.6, 323.9, 324.9, 327.1
classe [320 ; 322 [ [322 ; 324 [ [324 ; 326 [ [326 ; 328 [ [328 ; 330 [ [330 ; 332 [
centre de la classe 323
effectif 6 6 8 0
fréquence
effectif total :
minimum : maximum : étendue :
moyenne : variance : écart-type :
1er quartile : médiane : 3e quartile :
II) Statistiques à deux variables
On définit une série statistique à deux variables lorsqu'on étudie deux caractères d'une même population.
Dans une entreprise, on relève pendant six mois le nombre de commandes (𝑥𝑖 ) et le chiffre d'affaires réalisé (𝑦𝑖 ) .
La donnée des couples (𝑥; 𝑦) constitue une série à deux variables.
Nombre de commandes 𝑥𝑖 6 400 8 350 9 125 9 600 10 050 12 000
Chiffre d'affaires 𝑦𝑖 en k€ 250 320 335 350 370 400
Représentation graphique :
on représente le nuage des points
qui ont pour coordonnées (𝑥𝑖 ; 𝑦𝑖 )
Point moyen
On appelle point moyen du nuage le
point qui a pour coordonnées (𝑥̅ ; 𝑦̅)
Dans notre exemple :
𝐺( . . . ; . . . )
Droite d'ajustement : droite de régression linéaire
Lorsque le nuage de points semble s'étirer autour d'une droite ( ce n'est pas toujours le cas !), on cherche une
droite qui passe "au plus près" des points du nuage. Cette droite est appelée droite de régression linéaire.
Son équation, de la forme 𝑦 = 𝑎𝑥 + 𝑏 , est calculée par la méthode des moindres carrés.
Droite de régression linéaire avec la calculatrice
Coefficient de corrélation linéaire
Lorsqu'on étudie une série à deux variables (𝑥𝑖 ; 𝑦𝑖 ), le coefficient de corrélation linéaire est un indicateur pour
mesurer la dépendance linéaire entre les valeurs de 𝑥 et de 𝑦 c'est-à-dire savoir si la régression linéaire est adaptée.
𝑐𝑜𝑣(𝑥, 𝑦)
Le coefficient de corrélation de 𝑥 et 𝑦 est donné par 𝑟𝑥𝑦 =
𝜎(𝑥) × 𝜎(𝑦)
1
où 𝑐𝑜𝑣(𝑥; 𝑦) = 𝑛 ((𝑥1 − 𝑥̅ )(𝑦1 − 𝑦̅) + ⋯ + (𝑥𝑛 − 𝑥̅ )(𝑦𝑛 − 𝑦̅)) est la covariance de (𝑥, 𝑦)
Le coefficient de corrélation 𝑟𝑥𝑦 est compris entre -1 et 1.
Plus le coefficient est proche des valeurs extrêmes -1 et 1, plus la corrélation linéaire entre les variables est forte.
Cela ne dit pas qu'il y a une relation de causalité entre 𝑥 et 𝑦
- Si 𝑟𝑥𝑦 > 0, les valeurs de 𝑦 ont tendance à croître quand les valeurs de 𝑥 augmentent.
- Si 𝑟𝑥𝑦 < 0, les valeurs de 𝑦 ont tendance à décroître quand les valeurs de 𝑥 augmentent.
- Si 𝑟𝑥𝑦 = 0, les variations des variables 𝑥 et 𝑦 sont indépendantes.
Exemples de coefficients de corrélation :
PROF
le coefficient de corrélation linéaire ne donne pas le coefficient directeur de la droite de régression linéaire
Point moyen : 𝐺(9254; 337,5) Equation de la droite de régression linéaire : 𝑦 = 0,027076𝑥 + 86,932
Propriété : La droite d’ajustement de 𝑦 en 𝑥 a pour équation 𝑦 = 𝑎𝑥 + 𝑏, avec :
𝑐𝑜𝑣(𝑥, 𝑦)
• 𝑎=
𝑣𝑎𝑟(𝑥)
• 𝑏 = 𝑦̅ − 𝑎𝑥̅
1
où 𝑐𝑜𝑣(𝑥; 𝑦) = 𝑛 ((𝑥1 − 𝑥̅ )(𝑦1 − 𝑦̅) + ⋯ + (𝑥𝑛 − 𝑥̅ )(𝑦𝑛 − 𝑦̅)) est la covariance de (𝑥, 𝑦)
1
et 𝑣𝑎𝑟(𝑥) = 𝑛 ((𝑥1 − 𝑥̅ )2 + ⋯ + (𝑥𝑛 − 𝑥̅ )2 ) est la variance de 𝑥.
Droite de régression linéaire avec la calculatrice
Avec TI :
- « STAT » puis « Edite » et saisir les valeurs de 𝑥𝑖 dans L1 et les valeurs de 𝑦𝑖 dans L2.
- à nouveau « STAT » puis « CALC » et « RegLin(ax+b) ».
- Saisir L1, L2
Droite de régression linéaire avec la calculatrice
Avec CASIO :
- menu « STAT ».
- Saisir les valeurs de 𝑥𝑖 dans List1 et les valeurs de 𝑦𝑖 dans List2.
- Sélectionner « CALC » puis « SET ».
- Choisir List1 pour 2Var XList et List2 pour 2Var YList puis « EXE ».
- Sélectionner « REG » puis « X » et « aX+b »
BTS Statistiques à deux variables
I) Statistiques à une variable : rappel des principaux indicateurs statistiques
minimum effectif d'une valeur moyenne médiane
maximum effectif total variance 1er et 3ème quartiles
étendue fréquence écart-type écart interquartile
Exemple 1 : série brute
Voici les mesures la longueur en centimètre d'une série de barres de métal à la sortie d’une machine :
92,3 92,6 92,9 92,5 92,5 92,7 92,8 92,1
effectif total : 8 nombre total de valeurs de la série
minimum : 92,1 maximum : 92,9 étendue : 92,9 − 92,1 = 0,8
moyenne : 92,55 variance : 0,06 écart-type : 0,245
Exemple 2 : série dépouillée
Voici un relevé de ventes hebdomadaires de voitures d'un vendeur sur 40 semaines :
[1, 3, 1, 1, 0, 3, 2, 2, 1, 2, 3, 2, 2, 3, 2, 1, 1, 4, 2, 0, 2, 1, 2, 2, 1, 2, 1, 0, 2, 1, 3, 0, 4, 3, 3, 1, 3, 2, 2, 1]
Nombre de voitures vendues 0 1 2 3 4
effectif 4 12 14 8 2
fréquence 0,1 0,3 0,35 0,2 0,05
moyenne : 1,8 variance : 1,06 écart-type : 1,03
1er quartile : 1 médiane : 2 3e quartile : 2
25% des valeurs sont inférieures à 1 50% des valeurs sont inférieures à 2 75% des valeurs sont inférieures à 2
Exemple 3 : regroupement par classes
On donne ci-dessous la masse en grammes de boîtes de fromage, relevées lors d'un contrôle.
322.9, 320.6, 324.0, 324.4, 326.5, 320.9, 327.4, 330.9, 327.4, 327.3, 322.8, 323.8, 325.8, 323.0, 321.5, 327.9, 320.0,
325.2, 326.9, 325.6, 322.4, 327.6, 323.9, 324.9, 327.1
classe [320 ; 322 [ [322 ; 324 [ [324 ; 326 [ [326 ; 328 [ [328 ; 330 [ [330 ; 332 [
centre de la classe 321 323 325 327 329 331
effectif 4 6 6 8 0 1
fréquence 0.16 0.24 0.24 0.32 0 0.04
Effectif total : 25
minimum : 321 maximum : 331 étendue : 10
moyenne : 324.76 variance : 6.182 écart-type : 2.486
1er quartile : 323 médiane : 325 3e quartile : 327