[go: up one dir, main page]

0% ont trouvé ce document utile (0 vote)
124 vues5 pages

Serie 1 AD

Télécharger au format docx, pdf ou txt
Télécharger au format docx, pdf ou txt
Télécharger au format docx, pdf ou txt
Vous êtes sur la page 1/ 5

Université de Sfax Niveau 

: 1ère année
Module: 
SPSS : Analyse de données
Responsable de cours et de TD:  Filière :MP-Marketing digital
Mme Hentati Kanoun Ines
Institut des Hautes Etudes
Commerciales Année Universitaire : 2021-2022

Série N°1
(Analyse en Composantes Principales)

Etude de cas
Le tableau de données suivant regroupe 10 étudiants sur lesquels on a observé la note sur 20 de quatre
modules : le module de Probabilité, le module d’Informatique, le module de Mathématiques et le module
de langue.
Individus Probabilité Informatique Mathématiques Langue
1 14.97 12.4 11.55 8.24
2 13.15 12.55 11.4 13.64
3 12,7 9,75 16,95 10,94
4 14,48 7,45 16,35 8,58
5 11,76 13,5 8,55 11,88
6 7,88 9,25 15,05 10,8
7 15,56 11 11,9 7,76
8 12,33 9,3 10,65 9,32
9 13,9 12,1 10,9 9,08
10 10,15 10,85 11,55 8,76

On souhaite réaliser une Analyse en Composantes Principales Normée (ACP) sur ce tableau de données
afin d’enextraire une information.
1) Compléter le tableau suivant :

Variables Moyennes Ecarts-types


Probabilité …. 2,2113
Informatique 10,815 1,7782
Mathématiques 12,485 ….
Langue …. ….

2) Le tableau des données centrées réduites regroupant les 10 étudiants est présenté comme suit :

Individus Probabilité Informatique Mathématiques Langue


1 …. 0,8913 -0,3637 -0.9400
2 0,2089 …. -0,4221 2,1178
3 0,0054 -0.5989 …. 0,5889
4 0,8104 -1,8924 1.5035 ….
5 -0,42 1,5099 -1,5307 1,1212
6 -2,1743 -0,8801 0,9978 0,5096
7 1,2988 0,10404 -0,2276 -1,2118
8 -0,1619 -0,85198 -0,7138 -0,3284
9 0,5481 0,72264 -0,6166 -0,4643

Page 1 sur 5
10 -1,1478 0,01968 -0,3637 -0,6455

Compléter le tableau des données centrées réduites (en justifiant le calcul de chaque valeur trouvée).

3) Dans le cadre de l’ACP normée, il convient de diagonaliser une matrice. Laquelle ? Justifier à l’aide
d’un produit matriciel votre réponse (pas de valeurs numériques).

4) L’utilisation d’un logiciel a permis d’obtenir la matrice des corrélations suivantes :

Commenter brièvement les coefficients 0,1513 et -0,7679.

5) Quels sont les variables les plus fortement corrélées entre eux ?

6) Quelle est la propriété qui permet sans calcul de déterminer l’inertie totale ? Combien vaut-elle dans
le cas présent ?

7) La réalisation de l’ACP a donné les valeurs propres suivantes :

Calculer la dernière valeur propre.

8) Calculer l’inertie associée à chacun des axes.

9) Selon le critère de la moyenne (critère de Kaiser) combien d’axes doit-on conserver ? Justifier votre
réponse.

10) Les composantes principales issues de l’analyse sont les suivantes :

Identifiant Comp.1 Comp.2 Comp.3 Comp.4


1 -0,625 -1,4957 0,0011 -0,4976
2 -1,61 1,0861 1,3466 0,2721
3 1,3616 0,7184 1,0829 -0,4238
4 2,4754 -0,695 0,5518 0,3769
5 -2,3618 0,6727 -0,1164 0,1093
6 1,2207 2,1638 -0,7192 -0,261
7 0,0798 -1,7913 -0,0071 -0,0514
8 0,24 -0,1581 -0,701 0,8919
9 -0,7903 -0,8614 -0,1427 -0,1775
10 0,0097 0,3605 -1,296 -0,2389

Comment peut-on identifier les individus qui contribuentfortement à la formation de chacun des axes ?
Justifier votre réponse.
11) On souhaite déterminer la contribution des individus à la formation de chacun des axes. Dans ce but,
rappeler la formule qui permet de réaliser ces calculs, puis compléter le tableau suivant :

Page 2 sur 5
Individus CTA1(i) (%) CTA2(i) (%)
1 2,09 …..
2 13,85 8,64
3 9,9 3,78
4 32,73 3,54
5 ….. 3.31
6 ….. …..
7 0,03 23,5
8 0,31 0,18
9 3,34 5,43
10 0 0,95

12) Déterminer explicitement les individus qui contribuent significativement à la formation des deux
premiers axes.

13) On souhaite maintenant déterminer les qualités de représentation des individus sur chacun des axes
puis sur le plan principal. Dans ce but, rappeler les formules permettant de réaliser ces calculs, puis
compléter le tableau suivant :

Individu
Quali (1) (%) Quali (2) (%) Quali (1 × 2) (%)
s
1 13,59 77,8 …..
2 ….. 20,84 …..
3 49,81 13,87 …..
4 86,83 6,84 …..
5 92,11 7,47 …..
6 22,05 69,29 …..
7 0.197 ….. …..
8 4,21 1,82 …..
9 ….. 52,31 …..
10 0 6,96 …..

14) Quels sont les individus qui sont bien représentés et les individus mal représentés dans le plan
principal ?

15) Les coordonnées des variables sur les deux premiers axes (corrélation entre la variable j et la
composante k) sont présentées par le tableau suivant :

Page 3 sur 5
Corr(j,1) Corr(j,2)
Probabilité -0,07 -0,85
Informatique -0,95 -0,08
Mathématique 0,88 0,20
s
Langue -0,41 0,76

Identifier les variables corrélées avec chacun des axes (on précisera si la corrélation est positive ou
négative).
16) La représentation graphique des variables montre qu'elles sont toutes très bien représentées dans le
plan (Facteur 1, Facteur 2). Justifier cette affirmation.
17) Quelles sont les variables qui jouent un rôle dominant dans la formation du premier et du
deuxième axe.

Page 4 sur 5
5

Vous aimerez peut-être aussi