afcmexemple copy .pdf
Nom original: afcmexemple_copy.pdfTitre: Jet d’un déAuteur: Jacques Lemaire
Ce document au format PDF 1.3 a été généré par Acrobat PDFMaker 5.0 for Word / Acrobat Distiller 5.0 (Windows), et a été envoyé sur fichier-pdf.fr le 29/12/2011 à 11:27, depuis l'adresse IP 41.104.x.x.
La présente page de téléchargement du fichier a été vue 1738 fois.
Taille du document: 1.6 Mo (24 pages).
Confidentialité: fichier public
Aperçu du document
5 Analyse des correspondances multiples
1
5. Analyse des correspondances multiples
5.1. Problématique
On considère un tableau de données X de p variables
qualitatives et n individus. On supposera que tous les
poids individus sont égaux à 1.
Exemple (DataSet Neighbor)
On cherche à remplacer ce tableau par un tableau Y de q
variables quantitatives et n individus. On cherche
également à préciser les relations existant entre les
variables qualitatives du tableau X.
NB : ce type de données se rencontre très fréquemment
dans les enquêtes, quite à découper en classes les variables
quantitatives.
2A - LP
Analyse de données
J. Lemaire 2002
5 Analyse des correspondances multiples
2
5.2. Codage binaire du tableau X
Pour chaque variable qualitative, on recense les différentes
valeurs possibles (modalités) et on associe à chacune d’elle
une variable binaire, prenant la valeur 1 si cette modalité a
été choisie et 0 sinon :
Ce type de codage binaire (également appelé codage
disjonctif complet) conduit à un tableau Z de variables
binaires ; leurs valeurs sont assimilables à des effectifs.
On notera que la somme de chaque ligne est toujours égale
au nombre p de variables du tableau initial et que la
somme de chaque colonne est égale à l’effectif de la
modalité qu’elle représente.
2A - LP
Analyse de données
J. Lemaire 2002
3
5 Analyse des correspondances multiples
5.3. Analyse Factorielle des Correspondances
Multiples (AFCM) du tableau X
5.3.1. Définition
Déf AFCM de X = AFC de Z.
Y = tableau des composantes principales des lignes
5.3.2. Mise en œuvre sous SAS
- PROC CORRESP avec option binary et instruction tables
PROC CORRESP data=Neighbor observed short binary;
tables Age--Hair;
Binary Table
Old Young Female Male Short Tall Blond Brown White
1
1
0
0
1
1
0
0
0
1
2
0
1
1
0
0
1
0
1
0
3
1
0
0
1
1
0
0
1
0
4
1
0
1
0
0
1
0
0
1
5
1
0
1
0
1
0
0
1
0
6
0
1
0
1
0
1
1
0
0
7
0
1
0
1
0
1
0
1
0
8
1
0
0
1
1
0
1
0
0
9
0
1
1
0
1
0
1
0
0
10
1
0
0
1
0
1
0
1
0
11
0
1
0
1
0
1
0
1
0
2A - LP
Analyse de données
J. Lemaire 2002
4
5 Analyse des correspondances multiples
Inertia and Chi-Square Decomposition
Singular Principal
ChiCumulative
Value
Inertia Square Percent
Percent
7
14
21
28
35
----+----+----+----+----+---
0.64535
0.41648 18.3252
33.32
33.32 ************************
0.55086
0.30345 13.3518
24.28
57.59 *****************
0.51229
0.26244 11.5474
21.00
78.59 ***************
0.44834
0.20101
8.8443
16.08
94.67 ***********
0.25811
0.06662
2.9313
5.33
1.25000 55.0000
100.00
Total
100.00 ****
Degrees of Freedom = 80
Row Coordinates
Column Coordinates
Dim1
Dim2
0.7888
-0.2271
Young
-0.9465
0.2726
Female
0.1448
-0.0041
Male
-0.0828
0.0024
Short
0.7756
0.5637
Tall
-0.6463
-0.4697
Blond
-0.1102
1.5220
Brown
-0.3876
-0.4787
White
1.3282
-0.8468
Old
Dim1
Dim2
1
1.0885 -0.2305
2
-0.7111 -0.3086
3
0.4238 -0.0635
4
0.6258 -0.7024
5
0.5120 -0.0664
6
-0.6918
0.6023
7
-0.7993 -0.3057
8
0.5313
0.8445
9
-0.0528
1.0684
10
-0.1270 -0.5324
11
-0.7993 -0.3057
- Création de Z puis PROC CORRESP avec instruction var
PROC CORRESP data=Neighbor observed short binary;
ods html close;
ods output Binary=Z;
tables Age--Hair;
ods html;
PROC CORRESP data=Z observed short;
var Old--White;
id Label;
2A - LP
Analyse de données
J. Lemaire 2002
5
5 Analyse des correspondances multiples
Contingency Table
Old Young Female Male Short Tall Blond Brown White Sum
1
1
0
0
1
1
0
0
0
1
4
2
0
1
1
0
0
1
0
1
0
4
3
1
0
0
1
1
0
0
1
0
4
4
1
0
1
0
0
1
0
0
1
4
5
1
0
1
0
1
0
0
1
0
4
6
0
1
0
1
0
1
1
0
0
4
7
0
1
0
1
0
1
0
1
0
4
8
1
0
0
1
1
0
1
0
0
4
9
0
1
1
0
1
0
1
0
0
4
10
1
0
0
1
0
1
0
1
0
4
11
0
1
0
1
0
1
0
1
0
4
Sum
6
5
4
7
5
6
3
6
2
44
Inertia and Chi-Square Decomposition
Singular Principal
ChiCumulative
Value
Inertia Square Percent
Percent
7
14
21
28
35
----+----+----+----+----+---
0.64535
0.41648 18.3252
33.32
33.32 ************************
0.55086
0.30345 13.3518
24.28
57.59 *****************
0.51229
0.26244 11.5474
21.00
78.59 ***************
0.44834
0.20101
8.8443
16.08
94.67 ***********
0.25811
0.06662
2.9313
5.33
1.25000 55.0000
100.00
Total
100.00 ****
Degrees of Freedom = 80
Et idem pour les composantes principales des lignes et des
colonnes.
DUT 2ème année
Analyse de données
J. Lemaire 1999
6
5 Analyse des correspondances multiples
5.3.3. Mise en œuvre sous XLStat
NB : ne désigner que les variables
XLSTAT version 5.2 - Analyse des Correspondances Multiples (ACM) - le 18/01/2003 à 09:22:25
Tableau disjonctif complet :
Jones
Smith
Kasavitz
Ernst
Zannoria
Spangel
Myers
Kasinski
Colman
Delafave
Singer
Old
1
0
1
1
1
0
0
1
0
1
0
Young
Female
0
1
0
0
0
1
1
0
1
0
1
Male
0
1
0
1
1
0
0
0
1
0
0
Short
1
0
1
0
0
1
1
1
0
1
1
1
0
1
0
1
0
0
1
1
0
0
Tall
0
1
0
1
0
1
1
0
0
1
1
Blond
Brown
0
0
0
0
0
1
0
1
1
0
0
White
0
1
1
0
1
0
1
0
0
1
1
1
0
0
1
0
0
0
0
0
0
0
Valeurs propres et pourcentage de variance :
Remarque : dans le cadre de l'ACM, la variance totale n'a pas d'interprétation statistique
Valeur propre
% variance
% cumulé
F1
0,416
33,319
33,319
F2
F3
F4
F5
0,303 0,262 0,201
0,067
24,276 20,995 16,080
5,330
57,595 78,590 94,670 100,000
Coordonnées des modalités :
Old
Young
Female
Male
Short
Tall
Blond
Brown
White
F1
-0,789
0,947
-0,145
0,083
-0,776
0,646
0,110
0,388
-1,328
F2
-0,227
0,273
-0,004
0,002
0,564
-0,470
1,522
-0,479
-0,847
DUT 2ème année
Analyse de données
J. Lemaire 1999
7
5 Analyse des correspondances multiples
Contributions des modalités (%) :
Old
Young
Poids abs. Poids rel. F1
6
13,636 20,372
5
11,364 24,446
F2
2,318
2,782
Total Age
Female
Male
11
4
7
25,000 44,817
9,091 0,458
15,909 0,262
5,100
0,001
0,000
Total Sex
Short
Tall
11
5
6
25,000 0,719 0,001
11,364 16,414 11,898
13,636 13,678 9,915
Total Height
Blond
Brown
White
11
3
6
2
25,000 30,093 21,813
6,818 0,199 52,046
13,636 4,920 10,299
4,545 19,252 10,741
Total Hair
11
25,000 24,371 73,086
Contributions des individus (%) :
Cosinus carrés des modalités :
Old
Young
Female
Male
Short
Tall
Blond
Brown
White
F1
0,747
0,747
0,012
0,012
0,501
0,501
0,005
0,180
0,392
F2
0,062
0,062
0,000
0,000
0,265
0,265
0,869
0,275
0,159
Jones
Smith
Kasavitz
Ernst
Zannoria
Spangel
Myers
Kasinski
Colman
Delafave
Singer
Poids
rel.
9,091
9,091
9,091
9,091
9,091
9,091
9,091
9,091
9,091
9,091
9,091
F1
25,861
11,038
3,921
8,548
5,721
10,447
13,945
6,161
0,061
0,352
13,945
F2
1,592
2,853
0,121
14,781
0,132
10,868
2,799
21,367
34,194
8,493
2,799
Coordonnées des individus :
Jones
Smith
Kasavitz
Ernst
Zannoria
Spangel
Myers
Kasinski
Colman
Delafave
Singer
F1
-1,088
0,711
-0,424
-0,626
-0,512
0,692
0,799
-0,531
0,053
0,127
0,799
F2
-0,230
-0,309
-0,063
-0,702
-0,066
0,602
-0,306
0,845
1,068
-0,532
-0,306
Cosinus carrés des individus :
Jones
Smith
Kasavitz
Ernst
Zannoria
Spangel
Myers
Kasinski
Colman
Delafave
Singer
DUT 2ème année
F1
0,667
0,438
0,209
0,198
0,227
0,363
0,743
0,214
0,002
0,021
0,743
F2
0,030
0,083
0,005
0,249
0,004
0,275
0,109
0,541
0,670
0,369
0,109
Analyse de données
J. Lemaire 1999
8
5 Analyse des correspondances multiples
Individus et modalités (axes F1 et F2 : 58 %)
2
Blond
-- axe F2 (24 %) -->
1,5
Colman
1
Kasinski
Spangel
Short
0,5
Young
Female
0
Kasavitz
Jones
Old Zannoria
Male
Singer
Smith Myers
Brown
-0,5
Delafave
White
Tall
Ernst
-1
-1,5
-1
-0,5
0
0,5
1
1,5
-- axe F1 (33 %) -->
5.3.4. Interprétation
- analogue à l’AFC (oppositions, éloignements dans la
même direction)
- souvent on ne sintéresse qu’aux points modalités
- modalités supplémentaires (instruction Supplementary)
ou individus supplémentaires (poids négatifs)
- les oppositions ou les associations suggèrent les
croisements pertinents, par exemple on obtient ceci
avec les PROC FREQ et GCHART, sur le croisement
suggéré Age x Hair (code généré par Entreprise Guide)
DUT 2ème année
Analyse de données
J. Lemaire 1999
9
5 Analyse des correspondances multiples
Table of Age by Hair
Age
Hair
Frequency Blond Brown White Total
Old
1
3
2
6
Young
2
3
0
5
3
6
2
1
Total
5.3.5. Regroupement de mod alités
Pour une meilleure lisibilité des graphiques, il est conseillé
d’éliminer les modalités à très faibles effectifs en les
regroupant avec d’autres modalités : faire un tri à plat
(PROC FREQ) pour les détecter. Ceci ne modifie pas
sensiblement les résultats de l’analyse du fait de leurs
pondérations (=effectifs).
On peut aussi éliminer les variables n’ayant qu’une seule
modalité presque toujours choisie.
DUT 2ème année
Analyse de données
J. Lemaire 1999
10
5 Analyse des correspondances multiples
5.4. Lien avec les tableaux de contingence
5.4.1. Tableau de Burt
Une généralisation naturelle de l’AFC peut consister à
calculer un tableau d’effectifs croisés en croisant toutes les
variables entre elles, deux par deux. On obtient ainsi le
tableau de Burt B.
On peut l’obtenir avec SAS en considérant l’option mca
de la PROC CORRESP et l’instruction tables :
PROC CORRESP data=Neighbor observed short mca;
ods html close;
ods output Burt=B;
tables Age--Hair;
ods html;
DUT 2ème année
Analyse de données
J. Lemaire 1999
11
5 Analyse des correspondances multiples
On notera que dans ce cas (option mca + instruction tables)
la PROC CORRESP fournit les résultats de l’AFCM, mais
sans produire les composantes principales pour les lignes
du tableau Z :
Burt Table
Old Young Female Male Short Tall Blond Brown White
Old
6
0
2
4
4
2
1
3
2
Young
0
5
2
3
1
4
2
3
0
Female
2
2
4
0
2
2
1
2
1
Male
4
3
0
7
3
4
2
4
1
Short
4
1
2
3
5
0
2
2
1
Tall
2
4
2
4
0
6
1
4
1
Blond
1
2
1
2
2
1
3
0
0
Brown
3
3
2
4
2
4
0
6
0
White
2
0
1
1
1
1
0
0
2
Inertia and Chi-Square Decomposition
Singular Principal
ChiCumulative
Value
Inertia Square Percent
Percent
7
14
21
28
35
----+----+----+----+----+---
0.64535
0.41648 22.2398
33.32
33.32 ************************
0.55086
0.30345 16.2040
24.28
57.59 *****************
0.51229
0.26244 14.0142
21.00
78.59 ***************
0.44834
0.20101 10.7336
16.08
94.67 ***********
0.25811
0.06662
Total
3.5575
5.33
1.25000 66.7490
100.00
100.00 ****
Degrees of Freedom = 64
Column Coordinates
Dim1
Old
Young
Female
Dim2
0.7888 -0.2271
-0.9465
0.2726
0.1448 -0.0041
DUT 2ème année
Analyse de données
J. Lemaire 1999
12
5 Analyse des correspondances multiples
Column Coordinates
Dim1
Dim2
Male
-0.0828
0.0024
Short
0.7756
0.5637
Tall
-0.6463 -0.4697
Blond
-0.1102
Brown
-0.3876 -0.4787
White
1.3282 -0.8468
1.5220
5.4.2. Lien avec l’AFC du tableau de Burt B
Le qualitificatif « multiples » de l’AFCM apparaît
lorsqu’on compare ses résultats avec ceux de l’AFC du
tableau de Burt B :
PROC CORRESP data=B observed short;
var Old--White;
id Label;
Contingency Table
Old Young Female Male Short Tall Blond Brown White Sum
Old
6
0
2
4
4
2
1
3
2
24
Young
0
5
2
3
1
4
2
3
0
20
Female
2
2
4
0
2
2
1
2
1
16
Male
4
3
0
7
3
4
2
4
1
28
Short
4
1
2
3
5
0
2
2
1
20
Tall
2
4
2
4
0
6
1
4
1
24
Blond
1
2
1
2
2
1
3
0
0
12
Brown
3
3
2
4
2
4
0
6
0
24
White
2
0
1
1
1
1
0
0
2
8
24
20
16
28
20
24
12
24
8
176
Sum
DUT 2ème année
Analyse de données
J. Lemaire 1999
13
5 Analyse des correspondances multiples
Inertia and Chi-Square Decomposition
Singular Principal
ChiCumulative
Value
Inertia Square Percent
Percent
9
18
27
36
45
----+----+----+----+----+---
0.41648
0.17346 30.5284
45.74
45.74 *************************
0.30345
0.09208 16.2064
24.28
70.02 *************
0.26244
0.06888 12.1221
18.16
88.18 **********
0.20101
0.04040
7.1110
10.65
98.83 ******
0.06662
0.00444
0.7812
1.17
0.37926 66.7490
100.00
Total
100.00 *
Degrees of Freedom = 64
Valeurs propres
Row Coordinates
Dim1
Old
Young
Female
Column Coordinates
Dim2
Dim1
0.5090 -0.1251
-0.6109
Old
0.1501
Young
0.0935 -0.0023
Female
Dim2
0.5090 -0.1251
-0.6109
0.1501
0.0935 -0.0023
Male
-0.0534
0.0013
Male
-0.0534
0.0013
Short
0.5005
0.3105
Short
0.5005
0.3105
Tall
-0.4171 -0.2588
Tall
-0.4171 -0.2588
Blond
-0.0711
Blond
-0.0711
Brown
-0.2502 -0.2637
Brown
-0.2502 -0.2637
White
0.8571 -0.4665
White
0.8571 -0.4665
0.8384
0.8384
Prop Dans l’AFC de B :
• Les valeurs propres sont les carrés des valeurs
propres de l’AFCM
• Les composantes principales des colonnes (=
celles des lignes puisque le tableau est
symétrique) sont égales à celles des colonnes de
l’AFCM, multipliées par les racines des valeurs
propres correspondantes de l’AFCM.
DUT 2ème année
Analyse de données
J. Lemaire 1999
14
5 Analyse des correspondances multiples
Exemple : pour Old
Dim1 AFC = 0.5090
Dim1 AFCM *
λ1 = 0.7888 * 0.41648 = 0.5090
Comme les éloignements relatifs des points seront
identiques, l’interprétation des 2 analyses sera donc la
même.
5.4.3. Représentation des lignes de Z dans l’AFC
du tableau de Burt B
On peut représenter également les lignes de Z sur les
graphiques de cette AFC, en les projetant comme individus
supplémentaires (utiliser des poids négatifs dans SAS pour
les signaler) :
DATA BZ;
set B Z;
if (_N_<=9) then w=1;
else w=-1;
PROC CORRESP data=BZ observed short;
var Old--White;
id Label;
weight w;
DUT 2ème année
Analyse de données
J. Lemaire 1999
15
5 Analyse des correspondances multiples
Contingency Table
Old Young Female Male Short Tall Blond Brown White Sum
Old
6
0
2
4
4
2
1
3
2
24
Young
0
5
2
3
1
4
2
3
0
20
Female
2
2
4
0
2
2
1
2
1
16
Male
4
3
0
7
3
4
2
4
1
28
Short
4
1
2
3
5
0
2
2
1
20
Tall
2
4
2
4
0
6
1
4
1
24
Blond
1
2
1
2
2
1
3
0
0
12
Brown
3
3
2
4
2
4
0
6
0
24
White
2
0
1
1
1
1
0
0
2
8
24
20
16
28
20
24
12
24
8
176
Sum
Supplementary Rows
Old Young Female Male Short Tall Blond Brown White
1
1
0
0
1
1
0
0
0
1
2
0
1
1
0
0
1
0
1
0
3
1
0
0
1
1
0
0
1
0
4
1
0
1
0
0
1
0
0
1
5
1
0
1
0
1
0
0
1
0
6
0
1
0
1
0
1
1
0
0
7
0
1
0
1
0
1
0
1
0
8
1
0
0
1
1
0
1
0
0
9
0
1
1
0
1
0
1
0
0
10
1
0
0
1
0
1
0
1
0
11
0
1
0
1
0
1
0
1
0
DUT 2ème année
Analyse de données
J. Lemaire 1999
16
5 Analyse des correspondances multiples
Inertia and Chi-Square Decomposition
Singular Principal
ChiCumulative
Value
Inertia Square Percent
Percent
9
18
27
36
45
----+----+----+----+----+---
0.41648
0.17346 30.5284
45.74
45.74 *************************
0.30345
0.09208 16.2064
24.28
70.02 *************
0.26244
0.06888 12.1221
18.16
88.18 **********
0.20101
0.04040
7.1110
10.65
98.83 ******
0.06662
0.00444
0.7812
1.17
0.37926 66.7490
100.00
Total
100.00 *
Degrees of Freedom = 64
Row Coordinates
Dim1
Old
Young
Female
Column Coordinates
Dim2
Dim1
0.5090 -0.1251
-0.6109
Old
0.1501
Young
0.0935 -0.0023
Female
Dim2
0.5090 -0.1251
-0.6109
0.1501
0.0935 -0.0023
Male
-0.0534
0.0013
Male
-0.0534
0.0013
Short
0.5005
0.3105
Short
0.5005
0.3105
Tall
-0.4171 -0.2588
Tall
-0.4171 -0.2588
Blond
-0.0711
Blond
-0.0711
Brown
-0.2502 -0.2637
Brown
-0.2502 -0.2637
White
0.8571 -0.4665
White
0.8571 -0.4665
0.8384
0.8384
Supplementary Row
Coordinates
Dim1
Dim2
1
1.0885 -0.2305
2
-0.7111 -0.3086
3
0.4238 -0.0635
4
0.6258 -0.7024
5
0.5120 -0.0664
6
-0.6918
0.6023
7
-0.7993 -0.3057
8
0.5313
0.8445
9
-0.0528
1.0684
DUT 2ème année
Analyse de données
J. Lemaire 1999
17
5 Analyse des correspondances multiples
Supplementary Row
Coordinates
Dim1
Dim2
10
-0.1270 -0.5324
11
-0.7993 -0.3057
On obtient ici une propriété barycentrique très simple :
Prop Dans l’AFC de B avec Z en lignes supplémentaires:
• Les composantes principales des lignes
supplémentaires sont les mêmes que les
composantes principales des lignes de l’AFCM
• Les points colonnes (modalités) sont les
barycentres (poids=1) de ces points lignes où la
modalité correspondante a été choisie.
Points-lignes et points-colonnes (axes F1 et F2 : 70 %)
1,2
Colman
1
Kasinski
-- axe F2 (24 %) -->
0,8
Blond
Spangel
0,6
0,4
Short
0,2
0
-0,2
Jones
-0,4
White
-0,6
-0,8
-1,5
Female
Kasavitz
Zannoria
Male
Old
Young
Brown
Tall
Singer
Myers
Smith
Delafave
Ernst
-1
-0,5
0
0,5
1
-- axe F1 (46 %) -->
Exemple : Blond = barycentre de Kasinski, Spangel, Colman
DUT 2ème année
Analyse de données
J. Lemaire 1999
18
5 Analyse des correspondances multiples
Cette propriété de représentation barycentrique exacte (et
non a une affinité près) permet donc ici d’interpréter des
proximités (et non des éloignements) entre des modalités
(colonnes) et des individus (lignes supplémentaires).
Comme ces derniers sont souvent trop nombreux pour être
représentés sur les graphiques, on se contentera souvent de
représenter des points groupes d’individus, déterminés par
les modalités de variables initiales ne participant pas à
l’analyse, ou calculés a posteriori (résultant par exemple
d’une classification des individus, basée sur leurs
composantes principales). Là encore on pourra interpréter
des proximités.
5.5. Variables supplémentaires dans l’AFCM
5.5.1. Directectement dans l’AFCM
PROC CORRESP data=Neighbor observed short mca;
tables Age--Hair;
supplementary Height Hair;
Burt Table
Supplementary Columns
Old Young Female Male
Short Tall Blond Brown White
Old
6
0
2
4
Old
4
2
1
3
2
Young
0
5
2
3
Young
1
4
2
3
0
Female
2
2
4
0
Female
2
2
1
2
1
Male
4
3
0
7
Male
3
4
2
4
1
DUT 2ème année
Analyse de données
J. Lemaire 1999
19
5 Analyse des correspondances multiples
Inertia and Chi-Square Decomposition
Singular Principal
ChiCumulative
Value
Inertia Square Percent
Percent
0.73110
0.53450 11.8151
53.45
0.68227
0.46550 10.2897
46.55
Total
1.00000 22.1048
100.00
11
22
33
44
55
----+----+----+----+----+---
53.45 ************************
100.00 *********************
Degrees of Freedom = 9
Column Coordinates
Old
Dim1
Dim2
-0.6674
0.6228
Supplementary
Column Coordinates
Dim1
Dim2
-0.2979
0.4300
Young
0.8009 -0.7474
Short
Female
0.9672
Tall
0.2483 -0.3584
Blond
0.2483 -0.3584
Brown
0.0193 -0.1131
0.9026
-0.5527 -0.5158
Male
White
-0.4304
0.8767
Modalités (axes F1 et F2 : 100 %)
1
-- axe F2 (47 %) -->
0,6
Female
White
0,8
Old
Short
0,4
0,2
0
Brown
-0,2
-0,4
Tall
Blond
Male
-0,6
Young
-0,8
-1
-0,8
-0,6
-0,4
-0,2
0
0,2
0,4
0,6
0,8
1
1,2
-- axe F1 (53 %) -->
DUT 2ème année
Analyse de données
J. Lemaire 1999
20
5 Analyse des correspondances multiples
5.5.2. En calculant des centres de gravité a
posteriori dans l’AFC de B+Z
On peut le faire dans SAS en utilisant la PROC
TABULATE :
DATA B1Z1;
set B1 Z1;
if (_N_<=4) then w=1;
else w=-1;
PROC CORRESP data=B1Z1 outc=Y observed short;
var Old--Male;
id Label;
weight w;
DATA Y1;
set Y(where= (_TYPE_='SUPOBS'));
set Neighbor;
keep Label Dim1 Dim2 Height Hair;
PROC TABULATE data=Y1 out=Y2;
var Dim1 Dim2;
class Height Hair;
table Height Hair, (Dim1 Dim2)*Mean;
DATA Y3;
set Y2;
if (_TYPE_='10') then Label = Height;
else Label = Hair;
Dim1 = Dim1_Mean;
Dim2 = Dim2_Mean;
keep Label Dim1 Dim2;
PROC PRINT data=Y3 noobs;
DUT 2ème année
Analyse de données
J. Lemaire 1999
21
5 Analyse des correspondances multiples
Contingency Table
Supplementary Rows
Old Young Female Male Sum
Old Young Female Male
Old
6
0
2
4
12
1
1
0
0
1
Young
0
5
2
3
10
2
0
1
1
0
Female
2
2
4
0
8
3
1
0
0
1
Male
4
3
0
7
14
4
1
0
1
0
Sum
12
10
8
14
44
5
1
0
1
0
6
0
1
0
1
7
0
1
0
1
8
1
0
0
1
9
0
1
1
0
10
1
0
0
1
11
0
1
0
1
Inertia and Chi-Square Decomposition
Singular Principal
ChiCumulative
Value
Inertia Square Percent
Percent
0.53450
0.28569 12.5705
56.87
0.46550
0.21669
9.5342
43.13
0.50238 22.1048
100.00
Total
11
22
33
44
55
----+----+----+----+----+---
56.87 **************************
100.00 ********************
Degrees of Freedom = 9
Row Coordinates
Old
Dim1
Dim2
-0.4879
0.4249
Column Coordinates
Old
Dim1
Dim2
-0.4879
0.4249
Young
0.5855 -0.5099
Young
0.5855 -0.5099
Female
0.7071
Female
0.7071
Male
0.6158
-0.4040 -0.3519
Male
DUT 2ème année
0.6158
-0.4040 -0.3519
Analyse de données
J. Lemaire 1999
22
5 Analyse des correspondances multiples
Supplementary Row
Coordinates
Dim1
Dim2
1
-0.8344
0.0785
2
1.2092
0.1137
3
-0.8344
0.0785
4
0.2050
1.1179
5
0.2050
1.1179
6
0.1698 -0.9257
7
0.1698 -0.9257
8
-0.8344
0.0785
9
1.2092
0.1137
10
-0.8344
0.0785
11
0.1698 -0.9257
Dim1 Dim2
Tableau Y3 :
Mean Mean
Height
Short
Tall
-0.22
0.29
0.18
-0.24
Hair
Blond
0.18
-0.24
Brown
0.01
-0.08
White
-0.31
0.60
Label
Dim1
Dim2
Short
-0.21781
0.29340
Tall
0.18151
-0.24450
Blond
0.18151
-0.24450
Brown
0.01415
-0.07714
White
-0.31470
0.59817
Mais, on peut retrouver ces résultats beaucoup plus
simplement en réalisant une AFC du tableau contingence
obtenu en croisant les variables actives avec toutes les
variables, les variables non actives étant supplémentaires :
PROC CORRESP data= Neighbor observed short;
tables Age Sex, Age--Hair;
supplementary Height Hair;
DUT 2ème année
Analyse de données
J. Lemaire 1999
23
5 Analyse des correspondances multiples
Contingency Table
Old Young Female Male Sum
Old
6
0
2
4
12
Young
0
5
2
3
10
Female
2
2
4
0
8
Male
4
3
0
7
14
Sum
12
10
8
14
44
Supplementary Columns
Short Tall Blond Brown White
Old
4
2
1
3
2
Young
1
4
2
3
0
Female
2
2
1
2
1
Male
3
4
2
4
1
Inertia and Chi-Square Decomposition
Singular Principal
ChiCumulative
Value
Inertia Square Percent
Percent
0.53450
0.28569 12.5705
56.87
0.46550
0.21669
9.5342
43.13
0.50238 22.1048
100.00
Total
11
22
33
44
55
----+----+----+----+----+---
56.87 **************************
100.00 ********************
Degrees of Freedom = 9
Row Coordinates
Old
Dim1
Dim2
-0.4879
0.4249
Column Coordinates
Old
Dim1
Dim2
-0.4879
0.4249
Young
0.5855 -0.5099
Young
0.5855 -0.5099
Female
0.7071
Female
0.7071
Male
0.6158
-0.4040 -0.3519
Male
DUT 2ème année
0.6158
-0.4040 -0.3519
Analyse de données
J. Lemaire 1999
24
5 Analyse des correspondances multiples
Supplementary
Column Coordinates
Short
Dim1
Dim2
-0.2178
0.2934
Tall
0.1815 -0.2445
Blond
0.1815 -0.2445
Brown
0.0141 -0.0771
White
-0.3147
0.5982
Points-lignes et points-colonnes (axes F1 et F2 : 100 %)
0,8
Female
White
0,6
Old
0,4
Short
0,2
0
Brown
-0,2
Blond
Tall
Male
-0,4
Young
-0,6
-0,6
-0,4
-0,2
0
0,2
0,4
0,6
0,8
-- axe F1 (57 %) -->
C’est souvent cette dernière technique qui est utilisée dans
les dépouillements d’enquêtes. On choisit généralement
comme variables actives les caractéristiques générales de
la population et comme variables supplémentaires, celles
associées aux thèmes observés.
DUT 2ème année
Analyse de données
J. Lemaire 1999
Télécharger le fichier (PDF)
afcmexemple_copy.pdf (PDF, 1.6 Mo)