Master BioStat sous SPSS1 .pdf



Nom original: Master_BioStat sous SPSS1.pdf

Ce document au format PDF 1.5 a été généré par TeX / MiKTeX pdfTeX-1.40.17, et a été envoyé sur fichier-pdf.fr le 13/03/2018 à 08:07, depuis l'adresse IP 154.148.x.x. La présente page de téléchargement du fichier a été vue 317 fois.
Taille du document: 3.8 Mo (91 pages).
Confidentialité: fichier public


Aperçu du document


Universit´
e Moulay Ismail
Facult´
e des Sciences de Mekn`
es
Master
BIOSTATISTIQUE SOUS SPSS

Enseignant: Sghir Aissa
Ann´
ee universitaire: 2018–2019

10

15

C

0

V

5

D

M
1

2

3

4

5

6

8

Table des mati`
eres
1 Statistique descriptive univari´
ee
1.1 Introduction . . . . . . . . . . . . . . . . . .
1.2 Statistique descriptive univari´ee . . . . . . .
1.2.1 Vocabulaires . . . . . . . . . . . . .
1.2.2 Param`etres de position . . . . . . . .
1.2.3 Param`etres de dispersion . . . . . .
1.3 Utilisation d’une calculatrice Casio fx-82MS

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

4
4
5
5
11
14
15

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

17
17
18
19
19
20
21
23
24

3 Statistique descriptive bivari´
ee
3.1 Deux variables qualitatives (tableau de contingence) . . . . . . . . . . . .
3.2 Une variable quantitative et une variable qualitative (boˆıte `a moustache) .
3.3 Deux variables quantitatives (r´egression lin´eaire et pr´ediction) . . . . . . .
3.4 Utilisation des calculatrices Casio fx-82ES et fx-82MS . . . . . . . . . . .
3.5 SPSS: R´egression lin´eaire et coefficients . . . . . . . . . . . . . . . . . . .
3.6 TP 2 sous SPSS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

26
26
28
30
33
35
37

. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
puis fx-82ES

2 Le logiciel SPSS
2.1 D´emarrage . . . . . . . . . . . . . . . . . . . .
2.2 Affichage des variables et affichage des donn´ees
2.3 Valeurs et ´etiquette . . . . . . . . . . . . . . . .
2.4 La fenˆetre Viewer . . . . . . . . . . . . . . . . .
2.5 Transformation des variables . . . . . . . . . .
2.6 Param`etres des variables et diagrammes . . . .
2.7 Courbe de la fonction de r´epartition . . . . . .
2.8 TP 1 sous SPSS . . . . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

4 Analyse en composantes Principales (ACP)
39
4.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
4.2 Pratique de l’ACP sous SPSS . . . . . . . . . . . . . . . . . . . . . . . . . 40
4.3 TP 3 sous SPSS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50

2

`
TABLE DES MATIERES

Sghir Aissa

5 Notion de probabilit´
es et variables al´
eatoires
5.1 Vocabulaires . . . . . . . . . . . . . . . . . . .
5.2 Notion de probabilit´es . . . . . . . . . . . . . .
5.3 Notion de variables al´eatoires . . . . . . . . . .
5.3.1 Variables al´eatoires discr`etes . . . . . .
5.3.2 Variables al´eatoires continues . . . . . .

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

´
6 Echantillonnage
et estimation
´
6.1 Echantillonnage . . . . . . . . . . . . . . . . . . . . . .
6.1.1 Introduction . . . . . . . . . . . . . . . . . . .
6.1.2 Distribution d’´echantillonnage de la moyenne .
6.1.3 Distribution d’´echantillonnage de la proportion
6.1.4 Distribution d’´echantillonnage de la variance .
6.2 Estimation . . . . . . . . . . . . . . . . . . . . . . . .
6.2.1 Estimation ponctuelle . . . . . . . . . . . . . .
6.2.2 Estimation par intervalle de confiance . . . . .

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

51
51
52
53
54
55

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

58
58
58
60
62
63
64
64
64

7 Tests des hypoth`
eses
7.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7.2 Tests de conformit´e . . . . . . . . . . . . . . . . . . . . . . . . . . .
7.2.1 Test de conformit´e de la proportion `a une r´ef´erence . . . . .
7.2.2 Test de conformit´e de la moyenne `a une r´ef´erence . . . . . .
7.2.3 Test de conformit´e de la variance `a une r´ef´erence . . . . . .
7.3 Test d’ind´ependance du khi-deux entre deux variables qualitatives
7.4 Tests d’homog´en´eit´e dans le cas des ´echantillons ind´ependants . .
7.4.1 Test de comparaison de deux proportions . . . . . . . . . .
7.4.2 Test de comparaison de deux variances . . . . . . . . . . . .
7.4.3 Test de comparaison de deux moyennes . . . . . . . . . . .
7.5 Test de normalit´e: test de Shapiro et Wilk . . . . . . . . . . . . . .
7.6 Analyse de la variance (ANOVA) . . . . . . . . . . . . . . . . . . .
7.6.1 ANOVA `
a un facteur . . . . . . . . . . . . . . . . . . . . . .
7.6.2 ANOVA `
a deux facteurs . . . . . . . . . . . . . . . . . . . .
7.7 TP 4 sous SPSS . . . . . . . . . . . . . . . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

68
68
68
68
69
70
71
72
72
73
76
77
80
80
82
84

8 Mod`
ele lin´
eaire multiple sous SPSS
8.1 Mod`ele lin´eaire simple . . . . . . . . . . . . . . . . . . . . .
8.1.1 Test de la significativit´e du coefficient de corr´elation
8.1.2 Droite de r´egression lin´eaire . . . . . . . . . . . . . .
8.2 Mod`ele lin´eaire multiple . . . . . . . . . . . . . . . . . . . .
8.3 TP 5 sous SPSS . . . . . . . . . . . . . . . . . . . . . . . .

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

87
87
87
87
90
91

Facult´e des Sciences de Mekn`es

3

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

Biostatistique sous SPSS

Chapitre 1

Statistique descriptive univari´
ee
1.1

Introduction

Dans chaque exp´erience, un manager est conduit `a prendre des d´ecisions pour g´erer
ses r´esultats. Leur pertinence d´epend de la qualit´e de l’information recueillie, de son
analyse et de sa capacit´e `
a transformer l’information en action. Dans cet exemple et
dans d’autres domaines, (biologie, g´eologie, physique, chimie, finance, ...), les managers
doivent pouvoir disposer d’outils performants d’aide `a la d´ecision: la statistique s’inscrit
dans cette perspective et dont la d´efinition est la suivante:
La statistique est un ensemble de m´
ethodes scientifiques dont l’objectif est
d’analyser, structurer et mod´
eliser des informations num´
eriques.
Les m´ethodes statistiques peuvent ˆetre class´es en deux groupes:
1) La Statistique descriptive regroupe les m´ethodes dont l’objectif principal est
la description des donn´ees ´etudi´ees. Cette description des donn´ees se fait `a travers leur
repr´esentation graphique, et le calcul de r´esum´es num´eriques. Dans cette optique, on ne
fait pas appel `
a des outils de type probabiliste.
• Statistique descriptive univari´
ee: ´etude de la population selon une seule variable.
• Statistique descriptive bivari´
ee: ´etude des corr´elations et relations ´eventuelles
entre deux variables de la mˆeme population.
• Statistique descriptive multivari´
ee: ´etude des relations ´eventuelles entre plusieurs variables de la mˆeme population.
2) La statistique inf´
erentielle. Ce terme regroupe les m´ethodes dont l’objectif principal est de pr´eciser un ph´enom`ene sur une population globale, `a partir de son observation
sur une partie restreinte (´echantillon) de cette population. Ce passage ne se fait que
moyennant des hypoth`eses de type probabiliste.
NB: La statistique descriptive pr´ec`ede en g´en´eral la statistique inf´erentielle dans une
d´emarche de traitement de donn´ees: les deux aspects de la statistique se compl`etent bien
plus qu’ils ne s’opposent.
4

Sghir Aissa

1.2

Chapitre 1. Statistique descriptive univari´ee

Statistique descriptive univari´
ee

1.2.1

Vocabulaires

• Population: ensemble des individus objets de l’´etude.
´
(Etudiants,
entreprises, plantes, animaux, produits,...)
´
• Echantillon:
sous-ensemble issu de la population.
(Une classe, une ville, hommes, femmes,...)
• Unit´
e statistique: chaque individu.
(Un ´etudiant, une plante, un homme, une femme,...)
• Variable: caract`ere ou propri´et´e mesur´e sur chaque individu not´ee X,Y ,...
(Note, taille, poids, sex, ˆ
age, couleur, mesure,...)
• Modalit´
es: les valeurs possibles de la variable.
• S´
erie statistique: suite des valeurs prises par une variable X not´ees x1 , x2 , x3 , ....
• Variable quantitative: les modalit´es sont mesurables ou rep´erables.
− Variable quantitative discr`
ete: l’ensemble des modalit´es est fini ou d´enombrable. (Note, taille, poids, ˆage, mesure,...)
− Variable quantitative continue: l’ensemble des modalit´es est un intervalle
fini ou infini. ([8; 20[, [0; +∞[, R,...)
• Variable qualitative: les modalit´es ne sont pas mesurables.
−Variable qualitative nominale: les modalit´es ne peuvent pas ˆetre ordonn´ees. (sex, couleur,...)
−Variable qualitative ordinale: les modalit´es peuvent ˆetre ordonn´ees. (taille
d’un vˆetement: XXL, XL, L, M, S).
• Effectif totale n: le nombre de toutes les valeurs prises par la variable.
• Effectif ni : nombre d’apparitions de la valeur xi dans la population ou dans
l’´echantillon.
J
X
ni = n1 + n2 + ... + nJ = n.
i=1

• Fr´
equence fi associ´
ee `
a la valeur xi

n
 fi = ni ,
J
P
fi = f1 + f2 + ... + fJ = 1.

i=1

• Pourcentage pi associ´
e`
a la valeur xi

 pi = 100 × fi %,
J
P
pi = p1 + p2 + ... + pJ = 100 %.

i=1

Facult´e des Sciences de Mekn`es

5

Biostatistique sous SPSS

Sghir Aissa

Chapitre 1. Statistique descriptive univari´ee

• Effectif cumul´
e Ni

N1 = n1 ,




 N2 = n1 + n2 ,
N3 = n1 + n2 + n3 ,


..............................................



NJ = n1 + n2 + ... + nJ = n.
• Fr´
equence cumul´
ee Fi

F1 = f1 ,




 F2 = f1 + f2 ,
F3 = f1 + f2 + f3 ,


..............................................



FJ = f1 + f2 + ... + fJ = 1.
Remarque
Avant de citer les exemples de cette section, nous pr´esentons un exemple d’un mod`ele de
questionnaire pour la collection des informations dans la population.

Exemples:
•Variable qualitative nominale
On note C : c´elibataire, M : mari´e, V : veuf, D : divorc´e. On s’int´eresse `a la variable
X=(´etat-civil) sur une population de n = 20 personnes. Consid´erons la s´erie statistique
suivante :
MDMCCMCCCMCMVMVDCCMC
Facult´e des Sciences de Mekn`es

6

Biostatistique sous SPSS

Sghir Aissa

Chapitre 1. Statistique descriptive univari´ee

Tableau statistique
xi
C
M
V
D

ni
9
7
2
2

fi
0.45
0.35
0.10
0.10

pi %
45
35
10
10

Ni
9
16
18
20

Fi
0.45
0.75
0.85
1

Par exemple: le nombre d’apparition de la valeur x2 = M dans la s´erie statistique est
7
n2 = 7, sa fr´equence est f2 = nn2 = 20
= 0.35, son pourcentage p2 = 100 × f2 =
100 × 0.35 = 35 %, l’effectif cumul´e N2 = n1 + n2 = 9 + 7 = 16 et la fr´equence cumul´ee
F2 = f1 + f2 = 0.45 + 0.35 = 0.75.
Diagramme en secteurs
Le tableau statistique d’une variable qualitative est repr´esent´e par le diagramme en
secteurs form´es par les degr´es obtenus comme suit:
xi
C
M
V
D

pi %
45
35
10
10

di = pi × 3.6 ◦
162
126
36
36

Figure 1.1 – Diagramme en secteurs
C

D

V

M

•Variable qualitative ordinale
On interroge une population de n = 50 personnes sur leur dernier diplˆome obtenu. On
note: Sd : Sans diplˆ
ome, P : Primaire, Se : Secondaire, Su : Sup´erieur non-universitaire
et U : Universitaire.
Sd Sd Sd Sd P P P P P P P P P P P Se Se Su
Se Se Se Se Se Se Se Se Se Se Se Se Su Su Su
Su Su Su Su U U U U U U U U U U U U Su
Facult´e des Sciences de Mekn`es

7

Biostatistique sous SPSS

Sghir Aissa

Chapitre 1. Statistique descriptive univari´ee

Figure 1.2 – Diagramme en secteurs
Sd

P

Se

U
Su

Tableau statistique
xi
Sd
P
Se
Su
U

ni
4
11
14
9
12

Ni
4
15
29
38
50

fi
0.08
0.22
0.28
0.18
0.24

pi
8
22
28
18
24

Fi
0.08
0.30
0.58
0.76
1

•Variable quantitative discr`
ete
Un quartier est compos´e d’une population de 50 m´enages, et la variable X repr´esente le
nombre de personnes par m´enage. Les valeurs de la variable sont:
1
2
3
4
5

1
2
3
4
5

1
2
3
4
5

1
2
3
4
5

1
3
3
4
5

2
3
3
4
6

2
3
3
4
6

2
3
3
4
6

2
3
3
4
8

2
3
4
5
8

Tableau statistique
xi
1
2
3
4
5
6
8

Facult´e des Sciences de Mekn`es

ni
5
9
15
10
6
3
2

Ni
5
14
29
39
45
48
50

8

fi
0.10
0.18
0.30
0.20
0.12
0.06
0.04

Fi
0.10
0.28
0.58
0.78
0.90
0.96
1

Biostatistique sous SPSS

Sghir Aissa

Chapitre 1. Statistique descriptive univari´ee

0

5

10

15

Figure 1.3 – Diagramme en bˆatonnets des effectifs

1

2

3

4

5

6

8

Fonction de r´
epartition
Les fr´equences cumul´ees sont repr´esent´ees au moyen de la fonction de r´epartition. Cette
fonction est d´efinie de R dans [0, 1] et vaut:

Facult´e des Sciences de Mekn`es

9

Biostatistique sous SPSS

Sghir Aissa

Chapitre 1. Statistique descriptive univari´ee

• Variable quantitative continue
Tr`es souvent, la prise en compte de toute les valeurs observ´ees ne permet pas de donner
une interpr´etation simple des r´esultats et conduit `a des calculs inutiles. On peut souvent
se contenter de regarder des regroupements en classes.
Exemple:
On mesure la variable X=taille en centim`etre d’une population de 50 ´el`eves d’une classe.
152
154
156
157
159
161
162
164
168
170

152
154
156
157
159
160
162
164
168
171

152
154
156
157
160
160
163
165
168
171

153
155
156
158
160
161
164
166
169
171

153
155
156
158
160
162
164
167
169
171

Tableau statistique
Pour construire le tableau statistique, il faut proc´eder `a des regroupements en classes
(intervalles) de mˆeme amplitude. En r`egle g´en´erale, on choisit au moins cinq classes, sinon
on utilise par exemple la r`egle de Sturge: le nombre de classes est J = 1+(3.3×log10 (n)).
La longeur de chaque classe est l = (xmax −xmin )/J. Par exemple pour J = 5, on prend
l ' 4.
classe
[151.5;
[155.5;
[159.5;
[163.5;
[167.5;

ni
10
12
11
7
10

155.5[
159.5[
163.5[
167.5[
171.5[

Ni
10
22
33
40
50

fi
0.20
0.24
0.22
0.14
0.20

Fi
0.20
0.44
0.66
0.80
1

Histogramme des effectifs

0

2

4

6

8

10

12

Figure 1.4 – Histogramme des effectifs

151.5

Facult´e des Sciences de Mekn`es

155.5

159.5

10

163.5

167.5

171.5

Biostatistique sous SPSS

Sghir Aissa

Chapitre 1. Statistique descriptive univari´ee

Fonction de r´
epartition
− +
Si [cj ; cj [ d´esigne la classe j, on note, de mani`ere g´en´erale:

1.2.2

Param`
etres de position

• Le mode
Le mode est la valeur xi correspondant `a l’effectif (ou fr´equence) le plus ´elev´e.
Exemple:
xi
C
M
V
D

ni
9
7
2
2

fi
0.45
0.35
0.10
0.10

le mode est x1 = C : c´elibataire correspondant `a l’effectif n1 = 9.

Facult´e des Sciences de Mekn`es

11

Biostatistique sous SPSS

Sghir Aissa

Chapitre 1. Statistique descriptive univari´ee

Remarques
– Le mode peut ˆetre calcul´e pour tous les types de variable, quantitative et qualitative.
– Le mode n’est pas n´ecessairement unique.
– Quand une variable continue est d´ecoup´ee en classes, on parle de classe modale.
• La moyenne
La moyenne x
¯ ne peut ˆetre d´efinie que sur une variable quantitative.
n

x
¯=

1X
x1 + ......... + xn
xi =
.
n
n
i=1

La moyenne peut ˆetre calcul´ee `
a partir des valeurs distinctes et des effectifs.
J

x
¯=

1X
n1 × x1 + ......... + nJ × xJ
ni × xi =
.
n
n
i=1

Exemple:
Les nombres d’enfants de 8 familles sont les suivants 0, 0, 1, 1, 1, 2, 3, 4. La moyenne est
x
¯=

0+0+1+1+1+2+3+4
= 1.5.
8

On peut aussi faire
x
¯=

2×0+3×1+1×2+1×3+1×4
= 1.5.
8

• La m´
ediane
Cas d’une variable quantitative discr`
ete
La m´ediane, not´ee x 1 , est une valeur centrale de la s´erie statistique qui la partage en
2
deux groupes de mˆeme effectifs. Elle est obtenue de la mani`ere suivante:
– On trie la s´erie statistique par ordre croissant des valeurs observ´ees:
Par exemple, avec la s´erie observ´ee:
3 2 1 0 0 1 2,
on obtient:
0 0 1 1 2 2 3.
– n = 7 est impair, alors la m´ediane est la valeur du rang (n + 1)/2 = 4. Donc x 1 = 1.
2
– Si n est pair, alors la m´ediane est la moyenne des deux valeurs de rang n/2 et (n/2)+1.
Par exemple pour n = 8, si on a:
0 0 1 1 2 2 3 4
alors
x1 =
2

Facult´e des Sciences de Mekn`es

12

1+2
= 1.5.
2
Biostatistique sous SPSS

Sghir Aissa

Chapitre 1. Statistique descriptive univari´ee

Cas d’une variable quantitative continue
De mani`ere g´en´erale, on d´efinira la m´ediane comme ´etant la valeur (abscisse) correspondant `a la fr´equence cumul´ee F = 0.5 ou effectif cumul´e N = n2 . On l’obtiendra en g´en´eral
par lecture graphique (valeur approch´ee x 1 = F −1 (0.5)) sur la courbe des fr´equences
2
cumul´ees, ou par une formule d’interpolation lin´eaire (valeur exacte) sur la courbe des
effectifs cumul´ees.
Exemple:

Facult´e des Sciences de Mekn`es

13

Biostatistique sous SPSS

Sghir Aissa

1.2.3

Chapitre 1. Statistique descriptive univari´ee

Param`
etres de dispersion

• L’´
etendue
L’´etendue est d´efini par:
E = xmax − xmin .
Exemple:
Pour la s´erie 1 1 2 1 1 3 5 5 5 5 5 3 2 5,
• La variance
2
σX
=

on a: E = 5 − 1 = 4.

n

n

i=1

i=1

1X
1X 2
(xi − x
¯)2 =
xi − x
¯2 .
n
n

La variance peut aussi s’´ecrire:
2
σX
=

J

J

i=1

i=1

1X
1X
ni × (xi − x
¯)2 =
ni × x2i − x
¯2 .
n
n

• L’´
ecart type
σX

q
2 .
= σX

Exemple:
Soit la s´erie statistique 2 3 4 4 5 6 7 9 de taille 8. On a:
x
¯=

2+3+4+4+5+6+7+9
= 5.
8

n

2
σX

1X
=
(xi −¯
x)2
n
i=1

(2 − 5)2 + (3 − 5)2 + (4 − 5)2 + (4 − 5)2 + (5 − 5)2 + (6 − 5)2 + (7 − 5)2 + (9 − 5)2
= 4.5.
8
On peut ´egalement ´ecrire:

=

n

2
σX
=

1X 2
22 + 3 2 + 4 2 + 4 2 + 5 2 + 6 2 + 7 2 + 9 2
− 52 = 4.5.
xi − x
¯2 =
n
8
i=1

L’´ecart type:
σX =



4.5 = 2.12.

Remarque
Pour calculer la moyenne et la variance dans le cas d’une variable continue, on calcule
les centres des classes qui vont jouer le rˆole des valeurs xi du cas discret.

Facult´e des Sciences de Mekn`es

14

Biostatistique sous SPSS

Sghir Aissa

Chapitre 1. Statistique descriptive univari´ee

Exemple:
classe
[0; 10[
[10; 20[
[20; 30[
[30; 40[
x
¯=

1.3

ni
10
4
20
6

centre xi
0+10
2 =5
15
25
35

10 × 5 + 4 × 15 + 20 × 25 + 6 × 35
= 20.5.
40

Utilisation d’une calculatrice Casio fx-82MS puis fx82ES

Facult´e des Sciences de Mekn`es

15

Biostatistique sous SPSS

Sghir Aissa

Facult´e des Sciences de Mekn`es

Chapitre 1. Statistique descriptive univari´ee

16

Biostatistique sous SPSS

Chapitre 2

Le logiciel SPSS
2.1


emarrage

Cette fenˆetre s’ouvre lorsque on clique deux fois sur l’icˆone IBM SPSS.

17

Sghir Aissa

2.2

Chapitre 2. Le logiciel SPSS

Affichage des variables et affichage des donn´
ees

Cet onglet permet de d´efinir pr´ecis´ement la nature des variables et la fa¸con dont elles
seront affich´ees: num´erique pour quantitative et chaˆıne pour qualitative.

Cette fenˆetre affiche le tableau des donn´ees dont les lignes correspondent aux observations (individus) et les colonnes aux variables (caract`eres).

Facult´e des Sciences de Mekn`es

18

Biostatistique sous SPSS

Sghir Aissa

2.3

Chapitre 2. Le logiciel SPSS

Valeurs et ´
etiquette

Ces deux cases permettent de donner des codes simples aux valeurs des observations.

2.4

La fenˆ
etre Viewer

Cette fenˆetre contient la suite chronologique des traitements statistiques effectu´es. Le navigateur de r´esultat, dans la partie gauche de la fenˆetre, permet de passer rapidement
d’un r´esultat `
a l’autre.

Facult´e des Sciences de Mekn`es

19

Biostatistique sous SPSS

Sghir Aissa

2.5

Chapitre 2. Le logiciel SPSS

Transformation des variables

Le chemin Transformer > Calculer la variable permet de d´efinir une nouvelle variable Z `
a partir des variables initiale X et Y . Par exemple: Z = 2X + Y .

Le chemin Transformer > Regroupement visuel permet de transformer une variable
quantitative en une variable qualitative en d´efinissant des classes de valeurs.

Facult´e des Sciences de Mekn`es

20

Biostatistique sous SPSS

Sghir Aissa

2.6

Chapitre 2. Le logiciel SPSS

Param`
etres des variables et diagrammes

Le chemin Analyse > Statistiques descriptives > Effectifs ou Descriptives
permet de faire une analyse statistique des donn´ees: on peut faire des calculs des moyennes,
des variances,... et on peut tracer des diagrammes en secteurs, des histogrammes,...

Facult´e des Sciences de Mekn`es

21

Biostatistique sous SPSS

Sghir Aissa

Chapitre 2. Le logiciel SPSS

Le chemin suivant: Analyse > Tableaux > Tabuler permet de construire par exemple
des tableaux de la forme:

Facult´e des Sciences de Mekn`es

22

Biostatistique sous SPSS

Sghir Aissa

2.7

Chapitre 2. Le logiciel SPSS

Courbe de la fonction de r´
epartition

Suivez le chemin suivant: Graphes > G´
en´
erateur de diagrammes > Courbes
> Diagramme en ligne simple > Pourcentage cumul´
e.
Dans le cas discret on ajoute l’option: Type > Sauts.
Dans le cas continue on ajoute l’option: Type > Droite.

Facult´e des Sciences de Mekn`es

23

Biostatistique sous SPSS

Sghir Aissa

2.8

Chapitre 2. Le logiciel SPSS

TP 1 sous SPSS

Le tableau statistique contient: modalit´
es, effectifs, fr´
equences, pourcentages,
effectifs cumul´
es, fr´
equences cumul´
ees et pourcentages cumul´
es.
Exercice 1
On donne les couleurs de n = 20 plantes.
Vert Vert Rouge Noir Rouge Rouge Vert Rouge Noir Rouge
Rouge Rouge Rouge Jaune Rouge Jaune Noir Noir Noir Noir
1. Saisir ces donn´ees sous SPSS en utilisant des etiquettes.
2. Construire le tableau statistique et en d´eduire le mode.
3. Construire le diagramme en secteurs.
Exercice 2
Trente ´eprouvettes d’acier sp´ecial sont soumises `a des essais de r´esistance. Pour chacune,
on note le nombre de chocs n´ecessaires pour obtenir la rupture. Les r´esultats obtenus
sont les suivants :
2231214232
3233411423
2322343232
1.
2.
3.
4.
5.

Construire le tableau statistique et en d´eduire le mode.
Construire le diagramme en bˆ
atonnets des effectifs.
D´eterminer: la m´ediane, la moyenne, la variance et l’´ecart type de cette variable.
Tracer la fonction de r´epartition de cette variable.
Calculer la variable qui repr´esente le nombre de chocs au carr´e.

Exercice 3
On p`ese les n = 50 ´el`eves d’une classe et nous obtenons les r´esultats r´esum´es dans
le tableau suivant:
43
49
54
63
72
1.
2.
3.
4.

43
50
56
63
72

43
50
56
65
73

47
51
56
65
77

48
51
57
67
77

48
52
59
67
81

48
53
59
68
83

48
53
59
70
86

49
53
62
70
92

49
54
62
70
93

Construire le tableau statistique en adoptant quatres classes seulement.
Tracer la fonction de r´epartition de cette variable.
Tracer l’histogramme de cette variable.
D´eterminer la m´ediane, la moyenne, la variance et l’´ecart type de cette variable.

Facult´e des Sciences de Mekn`es

24

Biostatistique sous SPSS

Sghir Aissa

Chapitre 2. Le logiciel SPSS

Exercice 4
1. Importer le fichier nomm´e: TP 1 depuis Excel vers SPSS.
Partie 1:
2. Construire le tableau statistique de la variable produit.
3. Construire le diagramme en secteurs de la variable produit.
Partie 2:
4. Construire le tableau statistique de la variable diam`etre.
5. Construire le diagramme en bˆ
atonnets des effectifs de la variable diam`etre.
6. D´eterminer la m´ediane, la moyenne, la variance et l’´ecart type de la variable diam`etre.
7. Tracer la fonction de r´epartition de la variable diam`etre.
8. Construire la nouvelle variable ´egale au carr´e du diam`etre moins sa racine carr´ee puis
calculer sa moyenne et ses trois quartiles en donnant des interpretations.
Partie 3:
8. Construire le tableau statistique de la variable temp´erature en adoptant trois classes.
9. D´eterminer la m´ediane, la moyenne, la variance et l’´ecart type de la variable temp´erature .
10. Tracer l’histogramme de la variable poids.
11. Tracer la fonction de r´epartition de la variable temp´erature .

Facult´e des Sciences de Mekn`es

25

Biostatistique sous SPSS

Chapitre 3

Statistique descriptive bivari´
ee
L’objectif de cette partie est d’´etudier sur une mˆeme population de n individus, deux
caract`eres diff´erents X et Y et de rechercher s’il existe un lien entre ces deux variables.
Chacune des deux variables peut ˆetre, soit quantitative, soit qualitative.
La s´erie statistique est alors une suite de n couples des valeurs prises par les deux
variables sur chaque individu: (x1 , y1 ), ............., (xn , yn ). L’effectif associe `a l’observation
(xi , yj ) est not´e nij et sa fr´equence not´ee:
fij =

3.1

nij
.
n

Deux variables qualitatives (tableau de contingence)

Tableau de contingence des effectifs nij :
On s’int´eresse `
a une ´eventuelle relation entre la variable X= (le sexe) de n = 200
personnes et la variable Y = (la couleur des yeux).
X/Y
Homme
Femme
Total

Bleu
n11 = 10
n21 = 20
n•1 = 30

Vert
n12 = 50
n22 = 60
n•2 = 110

Marron
n13 = 20
n23 = 40
n•3 = 60

Total
n1• = 80
n2• = 120
n = 200

Les nombres n1• , n2• et n•1 , n•2 , n•3 sont appel´es effectifs marginaux.
Par exemple la valeur n22 = 60 exprime que 60 femmes ont une couleur verte des yeux
et on a:

26

Sghir Aissa

Chapitre 3. Statistique descriptive bivari´ee


n11 + n12 + n13 = n1• ,




n21 + n22 + n23 = n2• ,



n11 + n21 = n•1 ,
n

12 + n22 = n•2 ,



 n13 + n23 = n•3 ,


n11 + n12 + n13 + n21 + n22 + n23 = n.
Tableau de contingence des fr´
equences fij = nij /n:


n
n
fij = nij , fi• = nni• , f•j = n•j




f11 + f12 + f13 = f1• ,




 f21 + f22 + f23 = f2• ,
f11 + f21 = f•1 ,


f12 + f22 = f•2 ,





f + f23 = f•3 ,

 13
f11 + f12 + f13 + f21 + f22 + f23 = 1.
Les nombres f1• , f2• et f•1 , f•2 , f•3 sont appel´ees fr´equences marginales.

X/Y
Homme
Femme
Total

Bleu
f11 = 0.05
f21 = 0.10
f•1 = 0.15

Vert
f12 = 0.25
f22 = 0.30
f•2 = 0.55

Marron
f13 = 0.10
f23 = 0.20
f•3 = 0.30

Total
f1• = 0.40
f2• = 0.60
1

Sous SPSS: Analyse > Statistiques descriptives > Tableaux crois´
es.

Facult´e des Sciences de Mekn`es

27

Biostatistique sous SPSS

Sghir Aissa

3.2

Chapitre 3. Statistique descriptive bivari´ee

Une variable quantitative et une variable qualitative
(boˆıte `
a moustache)

Diagramme `
a boˆıtes `
a moustaches:
La boˆıte, (verticale ou bien horizontale), est la partie du graphique comprise entre les
premier et troisi`eme quartiles. La m´ediane est situ´ee `a l’int´erieur de la boˆıte et elle est
repr´esent´ee par un trait horizontal. Dans les parties basse et haute du graphique figurent
les moustaches, joignant le min au premier quartile et le troisi`eme quartile au max.
Exemple:
On consid`ere X= notes des ´etudiants (quantitative) et Y= sexe (qualitative).
SPSS: Graphes > Boˆıtes de dialogue ancienne version > Boˆıte `
a moustache.
N.B: pour trouver les valeurs sur les Boˆıtes: Analyse > Tableaux > Tabuler.

Facult´e des Sciences de Mekn`es

28

Biostatistique sous SPSS

Sghir Aissa

Chapitre 3. Statistique descriptive bivari´ee

0

5

10

15

20

25

30

Comparaison des notes de biochimie 2012−2013

Etudiants

Facult´e des Sciences de Mekn`es

29

Etudiantes

Biostatistique sous SPSS

Sghir Aissa

3.3

Chapitre 3. Statistique descriptive bivari´ee

Deux variables quantitatives (r´
egression lin´
eaire et pr´
ediction)

On consid`ere une population sur laquelle on ´etudie deux variables quantitatives X et Y .
On veut savoir si les deux variables sont li´es par une liaison lin´eaire du type Y = a + bX,
i.e., que l’on peut pr´evoir les valeurs de Y `a partir des valeurs de X. Pr´ecisons d`es maintenant que l’existence d’une telle liaison entre les deux variables X et Y ne signifie pas
obligatoirement un lien de cause `
a effet entre elles.
Exemple:
Neuf ´etudiants ´emettent un avis p´edagogique vis-`a-vis d’un professeur selon une ´echelle
d’appr´eciation de 1 `
a 20. On rel`eve par ailleurs la note obtenue par ces ´etudiants l’ann´ee
pr´ec´edente aupr`es du professeur.
Y= avis
X= r´esultat

5
8

7
11

16
10

6
13

12
9

14
17

10
7

9
15

8
16

Covariance
La covariance est d´efinie par:
σXY

n

n

i=1

i=1

1X
1X
=
(xi − x
¯)(yi − y¯) =
xi yi − x
¯y¯.
n
n

Corr´
elation
Le coefficient de corr´elation est d´efinie par:
r := rXY =

σXY
.
σX σY

Le coefficient de corr´elation mesure la d´ependance lin´eaire entre les variables X et Y :
— Si le coefficient de corr´elation est positif, les points du nuage sont align´es le long
d’une droite croissante. Dans ce cas X et Y ´evoluent dans le mˆeme sens.
— Si le coefficient de corr´elation est n´egatif, les points sont align´es le long d’une
droite d´ecroissante. Dans ce cas X et Y ´evoluent dans des sens oppos´es.
— La corr´elation est parfaite si |r| = 1. X et Y sont dits: fortement corr´el´ees.
— La corr´elation est tr`es forte si |r| > 0.8.
— La corr´elation est forte si |r| se situe entre 0.5 et 0.8.
— La corr´elation est d’intensit´e moyenne : si |r| se situe entre 0.2 et 0.5.
— La corr´elation est faible si |r| se situe entre 0 et 0,2.
— La corr´elation est nulle si r = 0.
Droite de r´
egression lin´
eaire et Pr´
ediction:
La droite de r´egression lin´eaire est la droite qui ajuste au mieux un nuage de points
au sens des moindres carr´es. On consid`ere que la variable X est explicative et que la
variable Y est d´ependante. L’´equation de la droite de r´egression de Y en X est:
y=a
ˆ + ˆbx,
Facult´e des Sciences de Mekn`es

30

Biostatistique sous SPSS

Sghir Aissa

Chapitre 3. Statistique descriptive bivari´ee

avec
ˆb = σXY ,
2
σX

a
ˆ = y¯ − ˆb¯
x

(la droite de r´egression passe par le point (¯
x, y¯)).

Dans notre exemple, on a:

x
¯ = 106/9 = 11.78




y
¯ = 87/9 = 9.667


 σ 2 = 1354/9 − 11.782 = 11.73
X
 σY2 = 951/9 − 9.6672 = 12.22



σXY = 1034/9 − 9.667 × 11.78 = 1.037



1.037

= 0.087
rXY = √11.73×
12.22
Finalement l’´equation de la droite de r´egression de Y en X est:
y = 0.088x + 8.625.

10
6

8

avis

12

14

16

Figure 3.1 – Droite de r´egression de Y en X

8

10

12

14

16

résultat

Facult´e des Sciences de Mekn`es

31

Biostatistique sous SPSS

Sghir Aissa

Chapitre 3. Statistique descriptive bivari´ee

Pr´
ediction:
Dans notre exemple si on veut pr´edire, sur la base de notre mod`ele, l’avis pour un
´etudiant ayant obtenu x = 12/20, alors la valeur ajust´ee est:
y = 0.088 × 12 + 8.625 = 9.681.

esidus ou erreurs de pr´
ediction:
Les r´esidus de la r´egression sont d´efinis par:
ei = yi − (ˆ
a + ˆbxi ) = yi − yˆi .
Le r´esidu ei est l’erreur que l’on commet en utilisant la droite de r´egression pour pr´edire
yi `a partir de xi . Les r´esidus sont les diff´erences entre les valeurs observ´ees yi et les
valeurs ajust´ees yˆi de la variable d´ependante.
Par exemple pour la valeur x3 = 12, on donne y3 = 10 et on a yˆ3 = 0.088 × 12 + 8.625 =
9.681, donc e3 = y3 − yˆ3 = 0.319.
Moyenne r´
esiduelle:
n

e¯ =

1X
ei = 0.
n
i=1

Variance r´
esiduelle:
La variance r´esiduelle est la variance des r´esidus:
n

σe2 =

1X 2
ei .
n
i=1

La variance r´esiduelle peut ´egalement s’´ecrire:
2
σe2 = σy2 × (1 − rXY
).

Dans notre exemple on a:
σe2 = 12.22 × (1 − 0.0872 ) = 12.127.
Le coefficient de d´
etermination:
2
2 . Il repr´
On le not´e R . C’est le carr´e du coefficient de corr´elation: R2 = rXY
esente la
proportion de variance expliqu´ee par le mod`ele.
Dans notre mod`ele, on a R2 = 0.0872 = 0.008. (0.8% est tr`es faible donc on a un mauvais
ajustement).

Facult´e des Sciences de Mekn`es

32

Biostatistique sous SPSS

Sghir Aissa

3.4

Chapitre 3. Statistique descriptive bivari´ee

Utilisation des calculatrices Casio fx-82ES et fx-82MS
Y= pression
X= temp´erature

1003
10

1005
15

1010
20

1011
25

1014
30

Avec la calculatrice Casio fx-82ES

Facult´e des Sciences de Mekn`es

33

Biostatistique sous SPSS

Sghir Aissa

Chapitre 3. Statistique descriptive bivari´ee

Avec la calculatrice Casio fx-82MS:

Facult´e des Sciences de Mekn`es

34

Biostatistique sous SPSS

Sghir Aissa

3.5

Chapitre 3. Statistique descriptive bivari´ee

SPSS: R´
egression lin´
eaire et coefficients

Suivez le chemin: Analyse > R´
egression > Lin´
eaire.

Pour obtenir le nuage de points suivez le chemin suivant:
Graphes > G´
en´
erateur de diagrammes > Dispersion points.
Pour Pour tracer la droite de r´egression, clique deux fois sur la figure du nuage de points
puis suivez le chemin suivant:
´ ements > R´
El´
egression > Ajouter une courbe d’ajustement > Lin´
eaire.

Facult´e des Sciences de Mekn`es

35

Biostatistique sous SPSS

Sghir Aissa

Facult´e des Sciences de Mekn`es

Chapitre 3. Statistique descriptive bivari´ee

36

Biostatistique sous SPSS

Sghir Aissa

3.6

Chapitre 3. Statistique descriptive bivari´ee

TP 2 sous SPSS

Exercice 1
Consid´erons un ´echantillon de n = 10 fonctionnaires (ayant entre 40 et 50 ans) d’un
minist`ere. Soit X le nombre d’ann´ees de service et Y le nombre de jours d’absence pour
raison de maladie (au cours de l’ann´ee pr´ec´edente) d´etermin´e pour chaque personne
appartenant `
a cet ´echantillon.

Facult´e des Sciences de Mekn`es

37

Biostatistique sous SPSS

Sghir Aissa

Chapitre 3. Statistique descriptive bivari´ee

xi
yi

2
3

14
13

16
17

8
12

13
10

20
8

24
20

7
7

5
2

11
8

Partie 1:
1.
2.
3.
4.
5.
6.

D´eterminer les moyennes de X et Y et la covariance entre X et Y.
D´eterminer le coefficient de corr´elation entre les variables X et Y .
D´eterminer la droite de r´egression lin´eaire de Y en X.
Tracer le nuage de points (X, Y ).
Tracer la droite de r´egression lin´eaire de Y en X.
Trouver les coefficients de la droite de r´egression .

Exercice 2
Partie 1:
1. Importer le fichier nomm´e TP2 depuis Excel vers SPSS.
2. D´eterminer et Tracer la droite de r´egression lin´eaire de la Taille en Poids.
3. Tracer les Boˆıtes `
a moustaches entre le Sexe et le Poids.
4. Tracer les tableaux de contingences des effectifs et des fr´equences entre le Sexe et
l’Avis.

Facult´e des Sciences de Mekn`es

38

Biostatistique sous SPSS

Chapitre 4

Analyse en composantes
Principales (ACP)
4.1

Introduction

On consid`ere 4 variables (notes) provenant de 12 individus diff´erents (´el`eves).

Nous savons comment analyser s´epar´ement chacune de ces 4 variables, soit en faisant des
graphiques: (diagrammes,...), soit en calculant des r´esum´es statistiques: (moyennes,...).
Nous savons ´egalement qu’on peut regarder les liaisons entre 2 variables (ne serait-ce que
4!), soit en faisant un graphique du type nuage de points, soit en calculant leur coefficient
de corr´elation lin´eaire, voire en r´ealisant la r´egression de l’une sur l’autre.

39

Sghir Aissa

Chapitre 4. Analyse en composantes Principales (ACP)

Probl`
eme:
Comment faire une ´
etude simultan´
ee des 4 variables. La difficult´
e vient de
ce que dans le nuage de points, les individus ne sont plus repr´
esent´
es dans
un plan qui est de dimension 2, mais dans un espace de dimension 4 o`
u l’observation est impossible `
a l’oeil.
Solution:
L’analyse en composantes Principales, (ACP), permet de projeter le nuage
de points des individus sur des sous espaces de dimension petit (2 ou 3),
tel que on retient le plus d’information possible, (`
a l’aide de la matrice de
corr´
elation et ses valeurs et vecteurs propres), en respectant au mieux:
— Les distances entre individus, (on regroupe ceux qui sont proches les
uns des autres).
— La structure des corr´
elations entre variables.
Les distances dans l’espace projet´e entre les points doivent ˆetre les plus proches des
distances r´eelles dans l’espace d’origine. Les nouveaux axes sont appel´ees facteurs
ou bien composantes principales et doivent ˆetres orthogonales et non corr´el´ees.

Dans la suite, on va voir l’inertie total d’un nuage des points, qui sera un indicateur fort
pour mesurer la dispersion des points du nuage autour de son centre de gravit´e.

4.2

Pratique de l’ACP sous SPSS

Rappel sur les valeurs et vecteurs propres:
— Soit I la matrice unit´e. Une valeur propre λ d’une matrice carr´ee A est une
solution de l’´equation: det(A − λI) = 0.
— Un vecteur propre u associ´e `a la valeur propre λ est une solution de l’´equation:
Au = λu.
Exemple:


5 −3
A=
det(A − λI) = λ2 − λ − 2 = 0
6 −4
λ1 = −1 ⇒ u1 = (1, 2)
Facult´e des Sciences de Mekn`es

40

λ2 = 2 ⇒ u2 = (1, 1)
Biostatistique sous SPSS

Sghir Aissa

Chapitre 4. Analyse en composantes Principales (ACP)

Inertie totale du nuage de points N
Not´e I(N, g) et d´epend des variances des variables. Il mesure la dispersion du nuage N
par rapport `
a son centre de gravit´e g de coordonn´ees les moyennes des variables.
C’est la moyenne des distances entre les points et le centre de gravit´e g. Lorsque cet inertie
est faible, les points sont proches du centre de gravit´e.

Remarque:
Pour neutraliser le probl`eme des unit´es on remplace les donn´ees d’origine du tableau
par les valeurs centr´ees-r´eduites de moyenne 0 et d’´ecart-type 1. Dans ce cas, l’inertie
totale du nouveau nuage de points N ∗ par rapport `a l’origine O est: I(N ∗ , O) = p. C’est le
nombre des variables du tableau des donn´ees.

Facult´e des Sciences de Mekn`es

41

Biostatistique sous SPSS

Sghir Aissa

Chapitre 4. Analyse en composantes Principales (ACP)

Principe de l’ACP:
La matrice de corr´elation va nous permettre de r´ealiser le r´esum´e d’information. De cette
matrice, on va extraire, `
a l’aide de ces vecteurs propres, les facteurs que l’on recherche,
en petit nombre (2 ou 3). Ces facteurs vont permettre de r´ealiser les projections d´esir´ees
du nuage dans cet espace de petite dimension, en d´eformant le moins possible la configuration globale des individus selon l’ensemble des variables initiales qui sont remplac´ees
par les facteurs. C’est l’interpr´etation des graphiques dans le nouveau espace de petit
dimension qui permettra de comprendre la structure des donn´ees analys´ees.
Important:
— La somme des valeurs propres associ´
es aux vecteurs propres est ´
egale
`
a la variance totale contenue dans l’ensemble des donn´
ees.
— Chaque facteur est une combinaison lin´
eaire des variables initiales.
— Chaque valeur propre λi repr´
esente la variance prise en compte par le
facteur CPi.
Constructions des composantes principales:
— La premi`ere composante principale CP1 passe par le centre de gravit´e O du nuage
de points N ∗ . le facteur CP1 est engendr´e par le vecteur propre de la matrice des
corr´elations associ´e `
a la plus grande valeur propre λ1 .
— La deuxi`eme composante principale CP2 associ´e `a λ2 < λ1 doit ˆetre non corr´
el´
ee
et perpendiculaire `
a CP1.

— Le pourcentage d’information, (variance totale), expliqu´ee sur un facteur CPi:
λi
× 100%.
m
P
λj
j=1

— Pour avoir une meilleure qualit´e de l’ACP, on d´etermine le nombre des facteurs
qui conservent un pourcentage cumul´e plus de 70% de la variance totale.
Facult´e des Sciences de Mekn`es

42

Biostatistique sous SPSS

Sghir Aissa

Chapitre 4. Analyse en composantes Principales (ACP)

— La qualit´e de la repr´esentation sur le plan principal (CP1,CP2):
λ1 + λ2
× 100%.
m
P
λj
j=1

Application sur l’exemple cit´
e dans l’introduction
Sous SPSS: Analyse > R´
eduction de dimensions > Analyse factorielle.

Facult´e des Sciences de Mekn`es

43

Biostatistique sous SPSS

Sghir Aissa

Chapitre 4. Analyse en composantes Principales (ACP)

Matrice de corr´
elation:

Remarquons que toutes les corr´elations lin´eaires sont positives, ce qui signifie que toutes
les variables varient, en moyenne, dans le mˆeme sens. La corr´elation est forte entre
(X1=MATH) et (X4=ANGL); c-`
a-d que les ´el`eves qui ont obtenu de bonnes notes en
MATH peuvent ´egalement avoir de bonnes notes en ANGL. La faible corr´elation entre
(X1=MATH) et (X3=FRAN) montre la grande rupture qui existe dans l’enseignement
de ces deux mati`eres.
Vecteurs propres:

Valeurs propres et pourcentage variance:

Les facteurs `
a retenir sont le premier et le deuxi`eme puisque le pourcentage de la variance totale qui est conserv´ee sur le plan principale engendr´e par ces 2 facteurs est:

Facult´e des Sciences de Mekn`es

44

Biostatistique sous SPSS

Sghir Aissa

Chapitre 4. Analyse en composantes Principales (ACP)

Coordonn´
ees des variables (ou matrice des composantes sous SPSS):
Cette matrice donne les corr´elations variables-facteurs.

On voit que le premier facteur CP1 est positivement corr´el´e et assez fortement avec chacune des 4 varibales: plus un ´el`eve obtient de bonnes notes dans chacune des 4 disciplines,
plus il a un score ´elev´e sur l’axe CP1, r´eciproquent: plus ces notes sont mauvaises plus
son score est n´egatif. En ce sens, CP1 repr´
esente le niveau g´
en´
eral des ´
etudiants.
En ce qui concerne l’axe CP2, il oppose, d’une part, X2 et X3 (corr´elations positives),
d’autre part, X1 et X4 (corr´elations positives).

Les 4 variables sont bien repr´esent´ees car elles sont proche du cercle.
Toutes les variables sont assez ´eloign´ees de O, les variables, et donc les angles qu’elles
forment, n’ont pas ´et´e trop d´eform´ees dans la projection.
Toutes les variables occupent une zone assez restreinte `a l’int´erieur du cercle des corr´elations. L’angle maximum entre deux variables est inf´erieur `a 90◦ . Ceci sugg`ere que toutes
les variables sont corr´el´ees positivement entre elles (cosinus positive).
Les notes des 2 mati`eres (MATH et ANGL) sont plus li´ees entre elles qu’avec les autres
mati`eres. Ceci sugg`ere l’existence de qualit´es communes (ou goˆ
uts communs) pour r´eussir dans ces mati`eres.
Facult´e des Sciences de Mekn`es

45

Biostatistique sous SPSS

Sghir Aissa

Chapitre 4. Analyse en composantes Principales (ACP)

On peut faire des remarques identiques pour PHYS et FRAN. L’´ecart entre ces deux
mati`eres et les pr´ec´edentes sugg`ere l’existence de qualit´es diff´erentes (ou goˆ
uts diff´erents)
pour r´eussir ces deux groupes de mati`eres.
En conclusion: Le cercle des corr´elations permet de voir, parmi les anciennes variables,
les groupes de variables tr`es corr´el´ees entre elles. Donc son ´etude est plus simple et plus
informative que l’analyse directe de la matrice de corr´elation.
Qualit´
e de repr´
esentation d’une variable dans le plan principal (CP1,CP2):
Par exemple la qualit´e de repr´esentation de X1 est:

Plus la QLT≥60%, plus la variable est bien repr´esent´ee.

Contribution d’une variable `
a la formation d’un facteur:
Par exemple, la contribution de X1 a` la formation de CP1 est:

Tableau de la contribution des variables (en %):

Remarquons la contribution de X1 et X4 `a la construction de CP1, ce qui clair d’apr´es
le tableau des corr´elations variables-facteurs: (X1 et X4 sont positivement et fortement
corr´el´es `
a CP1 par 0,917 et 0,912). Par contre, on voit la contribution de X2 et X3 `a la
construction de CP2.
Facult´e des Sciences de Mekn`es

46

Biostatistique sous SPSS

Sghir Aissa

Chapitre 4. Analyse en composantes Principales (ACP)

Coordonn´
ees des individus:
Le but ici est de fournir des images planes de dimension 2 approch´ees du nuage d’individus situ´es dans l’espace de dimension 4.

Sous SPSS, ces coordonn´ees sont stock´ees dans deux variables colonnes Facteur-1 et
Facteur-2 cr´ees `
a cot´e des quatres variables X1,X2,X3 et X4.

Sous SPSS, pour repr´esenter les individus avec leurs noms, on trace le nuage de points
´
entre Facteur-1 et Facteur-2. L’onglet Etiqueter
les observations par la variable qualitative INDIVIDUS qui contient les noms permet de mettre les noms des individus sur
la figure. Apr`es, on clique deux fois sur le nuage, puis on clique `a droite de souris sur
chaque points qui a une couleur jaune, enfin, on clique sur Afficher les ´etiquettes des
donn´ees.
Facult´e des Sciences de Mekn`es

47

Biostatistique sous SPSS

Sghir Aissa

Chapitre 4. Analyse en composantes Principales (ACP)

Pour ajouter le rep`ere orthonorm´e sur le nuage, il suffit de choisir la position ´egale `a 0 en
cliquant sur les deux icˆ
ones `
a gauche de la figure suivante:

Facult´e des Sciences de Mekn`es

48

Biostatistique sous SPSS

Sghir Aissa

Chapitre 4. Analyse en composantes Principales (ACP)

Important:
L’ensemble des projections de tous les points du nuage d’individus sur son
premier axe factoriel U1 appel´
e premier facteur, sur les individus, constitue
une nouvelle variable. On montre que cette variable se confond, `
a la norme
pr`
es, `
a la premi`
ere composante principale CP1 obtenue dans la projection
du nuage de variables. Donc, l’interpr´
etation des axes du graphique ci-dessus
est par d´
efinition celle des composantes principales.
Ainsi, l’axe des abscisses repr´esente le niveau g´en´eral des ´etudiants alors que celui des
ordonn´ees repr´esente leur profil. En effet, un ´etudiant appartenant au groupe 1 poss´ede
en g´en´eral des notes meilleures dans les mati`eres X1 et X4 avec des capacit´es d´etermin´ees
en X2 et X3; c’est le cas par exemples d’andr et anni.
Par opposition, un ´etudiant appartenant au groupe 4, c’est un ´etudiant qui a en g´en´eral de notes faibles dans toutes les mati`eres; c’est le cas de fati, sara et jean.
Donc, le premier axe (axe horizontale) oppose les ´el`eves qui ont globalement de bonnes
notes `a ceux qui ont g´en´eralement de mauvaises notes. Quant au deuxi`eme, il oppose
les ´el`eves ayant globalement des tr`es bonnes notes en X2 et X4 `a ceux qui ont qui ont
obtenu de faibles notes dans ces disciplines.
Qualit´
e de repr´
esentation d’un individus dans le plan principal (CP1,CP2):
Par exemple, la qualit´e de la repr´esentation du premier individu est:

Plus la QLT≥60%, plus l’individus est bien repr´esent´e.

Facult´e des Sciences de Mekn`es

49

Biostatistique sous SPSS

Sghir Aissa

Chapitre 4. Analyse en composantes Principales (ACP)

Contribution d’un individu `
a la formation d’un facteur:
Par exemple, la contribution du troisi`eme individu `a la formation de CP1:

Tableau de la contribution des individus (en %):

Conclusion: nous remarquons que l’ACP a l’avantage d’une part de r´
esumer
l’ensemble des variables initiales corr´
el´
ees en un nombre r´
eduit de facteurs
non corr´
el´
es. D’autre part, elle nous a permis de mettre en ´
evidence des
similarit´
es ou oppositions entre variables et individus.

4.3

TP 3 sous SPSS

Appliquer l’ACP au tableau suivant sous SPSS et conclure.

Facult´e des Sciences de Mekn`es

50

Biostatistique sous SPSS




Télécharger le fichier (PDF)

Master_BioStat sous SPSS1.pdf (PDF, 3.8 Mo)

Télécharger
Formats alternatifs: ZIP







Documents similaires


cours 2 de statistique
cours2 statistique stu s3
exercices facultatifs
cours1 statistique stu s3
master biostat sous r et rcmdr2
examen 2 statistique

Sur le même sujet..