afcmexemple copy .pdf



Nom original: afcmexemple_copy.pdfTitre: Jet d’un déAuteur: Jacques Lemaire

Ce document au format PDF 1.3 a été généré par Acrobat PDFMaker 5.0 for Word / Acrobat Distiller 5.0 (Windows), et a été envoyé sur fichier-pdf.fr le 29/12/2011 à 11:27, depuis l'adresse IP 41.104.x.x. La présente page de téléchargement du fichier a été vue 1738 fois.
Taille du document: 1.6 Mo (24 pages).
Confidentialité: fichier public


Aperçu du document


5 Analyse des correspondances multiples

1

5. Analyse des correspondances multiples
5.1. Problématique
On considère un tableau de données X de p variables
qualitatives et n individus. On supposera que tous les
poids individus sont égaux à 1.
Exemple (DataSet Neighbor)

On cherche à remplacer ce tableau par un tableau Y de q
variables quantitatives et n individus. On cherche
également à préciser les relations existant entre les
variables qualitatives du tableau X.
NB : ce type de données se rencontre très fréquemment
dans les enquêtes, quite à découper en classes les variables
quantitatives.
2A - LP

Analyse de données
J. Lemaire 2002

5 Analyse des correspondances multiples

2

5.2. Codage binaire du tableau X
Pour chaque variable qualitative, on recense les différentes
valeurs possibles (modalités) et on associe à chacune d’elle
une variable binaire, prenant la valeur 1 si cette modalité a
été choisie et 0 sinon :

Ce type de codage binaire (également appelé codage
disjonctif complet) conduit à un tableau Z de variables
binaires ; leurs valeurs sont assimilables à des effectifs.
On notera que la somme de chaque ligne est toujours égale
au nombre p de variables du tableau initial et que la
somme de chaque colonne est égale à l’effectif de la
modalité qu’elle représente.
2A - LP

Analyse de données
J. Lemaire 2002

3

5 Analyse des correspondances multiples

5.3. Analyse Factorielle des Correspondances
Multiples (AFCM) du tableau X
5.3.1. Définition
Déf AFCM de X = AFC de Z.
Y = tableau des composantes principales des lignes
5.3.2. Mise en œuvre sous SAS
- PROC CORRESP avec option binary et instruction tables
PROC CORRESP data=Neighbor observed short binary;
tables Age--Hair;

Binary Table
Old Young Female Male Short Tall Blond Brown White
1

1

0

0

1

1

0

0

0

1

2

0

1

1

0

0

1

0

1

0

3

1

0

0

1

1

0

0

1

0

4

1

0

1

0

0

1

0

0

1

5

1

0

1

0

1

0

0

1

0

6

0

1

0

1

0

1

1

0

0

7

0

1

0

1

0

1

0

1

0

8

1

0

0

1

1

0

1

0

0

9

0

1

1

0

1

0

1

0

0

10

1

0

0

1

0

1

0

1

0

11

0

1

0

1

0

1

0

1

0

2A - LP

Analyse de données
J. Lemaire 2002

4

5 Analyse des correspondances multiples
Inertia and Chi-Square Decomposition
Singular Principal
ChiCumulative
Value
Inertia Square Percent
Percent

7
14
21
28
35
----+----+----+----+----+---

0.64535

0.41648 18.3252

33.32

33.32 ************************

0.55086

0.30345 13.3518

24.28

57.59 *****************

0.51229

0.26244 11.5474

21.00

78.59 ***************

0.44834

0.20101

8.8443

16.08

94.67 ***********

0.25811

0.06662

2.9313

5.33

1.25000 55.0000

100.00

Total

100.00 ****

Degrees of Freedom = 80
Row Coordinates

Column Coordinates
Dim1

Dim2

0.7888

-0.2271

Young

-0.9465

0.2726

Female

0.1448

-0.0041

Male

-0.0828

0.0024

Short

0.7756

0.5637

Tall

-0.6463

-0.4697

Blond

-0.1102

1.5220

Brown

-0.3876

-0.4787

White

1.3282

-0.8468

Old

Dim1

Dim2

1

1.0885 -0.2305

2

-0.7111 -0.3086

3

0.4238 -0.0635

4

0.6258 -0.7024

5

0.5120 -0.0664

6

-0.6918

0.6023

7

-0.7993 -0.3057

8

0.5313

0.8445

9

-0.0528

1.0684

10

-0.1270 -0.5324

11

-0.7993 -0.3057

- Création de Z puis PROC CORRESP avec instruction var
PROC CORRESP data=Neighbor observed short binary;
ods html close;
ods output Binary=Z;
tables Age--Hair;
ods html;
PROC CORRESP data=Z observed short;
var Old--White;
id Label;
2A - LP

Analyse de données
J. Lemaire 2002

5

5 Analyse des correspondances multiples
Contingency Table
Old Young Female Male Short Tall Blond Brown White Sum
1

1

0

0

1

1

0

0

0

1

4

2

0

1

1

0

0

1

0

1

0

4

3

1

0

0

1

1

0

0

1

0

4

4

1

0

1

0

0

1

0

0

1

4

5

1

0

1

0

1

0

0

1

0

4

6

0

1

0

1

0

1

1

0

0

4

7

0

1

0

1

0

1

0

1

0

4

8

1

0

0

1

1

0

1

0

0

4

9

0

1

1

0

1

0

1

0

0

4

10

1

0

0

1

0

1

0

1

0

4

11

0

1

0

1

0

1

0

1

0

4

Sum

6

5

4

7

5

6

3

6

2

44

Inertia and Chi-Square Decomposition
Singular Principal
ChiCumulative
Value
Inertia Square Percent
Percent

7
14
21
28
35
----+----+----+----+----+---

0.64535

0.41648 18.3252

33.32

33.32 ************************

0.55086

0.30345 13.3518

24.28

57.59 *****************

0.51229

0.26244 11.5474

21.00

78.59 ***************

0.44834

0.20101

8.8443

16.08

94.67 ***********

0.25811

0.06662

2.9313

5.33

1.25000 55.0000

100.00

Total

100.00 ****

Degrees of Freedom = 80

Et idem pour les composantes principales des lignes et des
colonnes.

DUT 2ème année

Analyse de données
J. Lemaire 1999

6

5 Analyse des correspondances multiples

5.3.3. Mise en œuvre sous XLStat
NB : ne désigner que les variables
XLSTAT version 5.2 - Analyse des Correspondances Multiples (ACM) - le 18/01/2003 à 09:22:25
Tableau disjonctif complet :

Jones
Smith
Kasavitz
Ernst
Zannoria
Spangel
Myers
Kasinski
Colman
Delafave
Singer

Old
1
0
1
1
1
0
0
1
0
1
0

Young

Female
0
1
0
0
0
1
1
0
1
0
1

Male
0
1
0
1
1
0
0
0
1
0
0

Short
1
0
1
0
0
1
1
1
0
1
1

1
0
1
0
1
0
0
1
1
0
0

Tall
0
1
0
1
0
1
1
0
0
1
1

Blond

Brown
0
0
0
0
0
1
0
1
1
0
0

White
0
1
1
0
1
0
1
0
0
1
1

1
0
0
1
0
0
0
0
0
0
0

Valeurs propres et pourcentage de variance :
Remarque : dans le cadre de l'ACM, la variance totale n'a pas d'interprétation statistique

Valeur propre
% variance
% cumulé

F1
0,416
33,319
33,319

F2
F3
F4
F5
0,303 0,262 0,201
0,067
24,276 20,995 16,080
5,330
57,595 78,590 94,670 100,000

Coordonnées des modalités :

Old
Young
Female
Male
Short
Tall
Blond
Brown
White

F1
-0,789
0,947
-0,145
0,083
-0,776
0,646
0,110
0,388
-1,328

F2
-0,227
0,273
-0,004
0,002
0,564
-0,470
1,522
-0,479
-0,847

DUT 2ème année

Analyse de données
J. Lemaire 1999

7

5 Analyse des correspondances multiples
Contributions des modalités (%) :

Old
Young

Poids abs. Poids rel. F1
6
13,636 20,372
5
11,364 24,446

F2
2,318
2,782

Total Age
Female
Male

11
4
7

25,000 44,817
9,091 0,458
15,909 0,262

5,100
0,001
0,000

Total Sex
Short
Tall

11
5
6

25,000 0,719 0,001
11,364 16,414 11,898
13,636 13,678 9,915

Total Height
Blond
Brown
White

11
3
6
2

25,000 30,093 21,813
6,818 0,199 52,046
13,636 4,920 10,299
4,545 19,252 10,741

Total Hair

11

25,000 24,371 73,086

Contributions des individus (%) :
Cosinus carrés des modalités :

Old
Young
Female
Male
Short
Tall
Blond
Brown
White

F1
0,747
0,747
0,012
0,012
0,501
0,501
0,005
0,180
0,392

F2
0,062
0,062
0,000
0,000
0,265
0,265
0,869
0,275
0,159

Jones
Smith
Kasavitz
Ernst
Zannoria
Spangel
Myers
Kasinski
Colman
Delafave
Singer

Poids
rel.
9,091
9,091
9,091
9,091
9,091
9,091
9,091
9,091
9,091
9,091
9,091

F1
25,861
11,038
3,921
8,548
5,721
10,447
13,945
6,161
0,061
0,352
13,945

F2
1,592
2,853
0,121
14,781
0,132
10,868
2,799
21,367
34,194
8,493
2,799

Coordonnées des individus :

Jones
Smith
Kasavitz
Ernst
Zannoria
Spangel
Myers
Kasinski
Colman
Delafave
Singer

F1
-1,088
0,711
-0,424
-0,626
-0,512
0,692
0,799
-0,531
0,053
0,127
0,799

F2
-0,230
-0,309
-0,063
-0,702
-0,066
0,602
-0,306
0,845
1,068
-0,532
-0,306

Cosinus carrés des individus :

Jones
Smith
Kasavitz
Ernst
Zannoria
Spangel
Myers
Kasinski
Colman
Delafave
Singer

DUT 2ème année

F1
0,667
0,438
0,209
0,198
0,227
0,363
0,743
0,214
0,002
0,021
0,743

F2
0,030
0,083
0,005
0,249
0,004
0,275
0,109
0,541
0,670
0,369
0,109

Analyse de données
J. Lemaire 1999

8

5 Analyse des correspondances multiples
Individus et modalités (axes F1 et F2 : 58 %)
2

Blond

-- axe F2 (24 %) -->

1,5

Colman

1

Kasinski
Spangel

Short

0,5

Young

Female

0

Kasavitz

Jones

Old Zannoria

Male

Singer
Smith Myers

Brown

-0,5

Delafave

White

Tall

Ernst

-1
-1,5

-1

-0,5

0

0,5

1

1,5

-- axe F1 (33 %) -->

5.3.4. Interprétation
- analogue à l’AFC (oppositions, éloignements dans la
même direction)
- souvent on ne sintéresse qu’aux points modalités
- modalités supplémentaires (instruction Supplementary)
ou individus supplémentaires (poids négatifs)
- les oppositions ou les associations suggèrent les
croisements pertinents, par exemple on obtient ceci
avec les PROC FREQ et GCHART, sur le croisement
suggéré Age x Hair (code généré par Entreprise Guide)

DUT 2ème année

Analyse de données
J. Lemaire 1999

9

5 Analyse des correspondances multiples
Table of Age by Hair
Age

Hair

Frequency Blond Brown White Total
Old

1

3

2

6

Young

2

3

0

5

3

6

2

1

Total

5.3.5. Regroupement de mod alités
Pour une meilleure lisibilité des graphiques, il est conseillé
d’éliminer les modalités à très faibles effectifs en les
regroupant avec d’autres modalités : faire un tri à plat
(PROC FREQ) pour les détecter. Ceci ne modifie pas
sensiblement les résultats de l’analyse du fait de leurs
pondérations (=effectifs).
On peut aussi éliminer les variables n’ayant qu’une seule
modalité presque toujours choisie.
DUT 2ème année

Analyse de données
J. Lemaire 1999

10

5 Analyse des correspondances multiples

5.4. Lien avec les tableaux de contingence
5.4.1. Tableau de Burt
Une généralisation naturelle de l’AFC peut consister à
calculer un tableau d’effectifs croisés en croisant toutes les
variables entre elles, deux par deux. On obtient ainsi le
tableau de Burt B.

On peut l’obtenir avec SAS en considérant l’option mca
de la PROC CORRESP et l’instruction tables :
PROC CORRESP data=Neighbor observed short mca;
ods html close;
ods output Burt=B;
tables Age--Hair;
ods html;

DUT 2ème année

Analyse de données
J. Lemaire 1999

11

5 Analyse des correspondances multiples

On notera que dans ce cas (option mca + instruction tables)
la PROC CORRESP fournit les résultats de l’AFCM, mais
sans produire les composantes principales pour les lignes
du tableau Z :
Burt Table
Old Young Female Male Short Tall Blond Brown White
Old

6

0

2

4

4

2

1

3

2

Young

0

5

2

3

1

4

2

3

0

Female

2

2

4

0

2

2

1

2

1

Male

4

3

0

7

3

4

2

4

1

Short

4

1

2

3

5

0

2

2

1

Tall

2

4

2

4

0

6

1

4

1

Blond

1

2

1

2

2

1

3

0

0

Brown

3

3

2

4

2

4

0

6

0

White

2

0

1

1

1

1

0

0

2

Inertia and Chi-Square Decomposition
Singular Principal
ChiCumulative
Value
Inertia Square Percent
Percent

7
14
21
28
35
----+----+----+----+----+---

0.64535

0.41648 22.2398

33.32

33.32 ************************

0.55086

0.30345 16.2040

24.28

57.59 *****************

0.51229

0.26244 14.0142

21.00

78.59 ***************

0.44834

0.20101 10.7336

16.08

94.67 ***********

0.25811

0.06662

Total

3.5575

5.33

1.25000 66.7490

100.00

100.00 ****

Degrees of Freedom = 64

Column Coordinates
Dim1
Old
Young
Female

Dim2

0.7888 -0.2271
-0.9465

0.2726

0.1448 -0.0041

DUT 2ème année

Analyse de données
J. Lemaire 1999

12

5 Analyse des correspondances multiples
Column Coordinates
Dim1

Dim2

Male

-0.0828

0.0024

Short

0.7756

0.5637

Tall

-0.6463 -0.4697

Blond

-0.1102

Brown

-0.3876 -0.4787

White

1.3282 -0.8468

1.5220

5.4.2. Lien avec l’AFC du tableau de Burt B
Le qualitificatif « multiples » de l’AFCM apparaît
lorsqu’on compare ses résultats avec ceux de l’AFC du
tableau de Burt B :
PROC CORRESP data=B observed short;
var Old--White;
id Label;
Contingency Table
Old Young Female Male Short Tall Blond Brown White Sum
Old

6

0

2

4

4

2

1

3

2

24

Young

0

5

2

3

1

4

2

3

0

20

Female

2

2

4

0

2

2

1

2

1

16

Male

4

3

0

7

3

4

2

4

1

28

Short

4

1

2

3

5

0

2

2

1

20

Tall

2

4

2

4

0

6

1

4

1

24

Blond

1

2

1

2

2

1

3

0

0

12

Brown

3

3

2

4

2

4

0

6

0

24

White

2

0

1

1

1

1

0

0

2

8

24

20

16

28

20

24

12

24

8

176

Sum

DUT 2ème année

Analyse de données
J. Lemaire 1999

13

5 Analyse des correspondances multiples
Inertia and Chi-Square Decomposition
Singular Principal
ChiCumulative
Value
Inertia Square Percent
Percent

9
18
27
36
45
----+----+----+----+----+---

0.41648

0.17346 30.5284

45.74

45.74 *************************

0.30345

0.09208 16.2064

24.28

70.02 *************

0.26244

0.06888 12.1221

18.16

88.18 **********

0.20101

0.04040

7.1110

10.65

98.83 ******

0.06662

0.00444

0.7812

1.17

0.37926 66.7490

100.00

Total

100.00 *

Degrees of Freedom = 64

Valeurs propres
Row Coordinates
Dim1
Old
Young
Female

Column Coordinates

Dim2

Dim1

0.5090 -0.1251
-0.6109

Old

0.1501

Young

0.0935 -0.0023

Female

Dim2

0.5090 -0.1251
-0.6109

0.1501

0.0935 -0.0023

Male

-0.0534

0.0013

Male

-0.0534

0.0013

Short

0.5005

0.3105

Short

0.5005

0.3105

Tall

-0.4171 -0.2588

Tall

-0.4171 -0.2588

Blond

-0.0711

Blond

-0.0711

Brown

-0.2502 -0.2637

Brown

-0.2502 -0.2637

White

0.8571 -0.4665

White

0.8571 -0.4665

0.8384

0.8384

Prop Dans l’AFC de B :
• Les valeurs propres sont les carrés des valeurs
propres de l’AFCM
• Les composantes principales des colonnes (=
celles des lignes puisque le tableau est
symétrique) sont égales à celles des colonnes de
l’AFCM, multipliées par les racines des valeurs
propres correspondantes de l’AFCM.
DUT 2ème année

Analyse de données
J. Lemaire 1999

14

5 Analyse des correspondances multiples

Exemple : pour Old
Dim1 AFC = 0.5090
Dim1 AFCM *

λ1 = 0.7888 * 0.41648 = 0.5090

Comme les éloignements relatifs des points seront
identiques, l’interprétation des 2 analyses sera donc la
même.
5.4.3. Représentation des lignes de Z dans l’AFC
du tableau de Burt B
On peut représenter également les lignes de Z sur les
graphiques de cette AFC, en les projetant comme individus
supplémentaires (utiliser des poids négatifs dans SAS pour
les signaler) :
DATA BZ;
set B Z;
if (_N_<=9) then w=1;
else w=-1;
PROC CORRESP data=BZ observed short;
var Old--White;
id Label;
weight w;

DUT 2ème année

Analyse de données
J. Lemaire 1999

15

5 Analyse des correspondances multiples
Contingency Table
Old Young Female Male Short Tall Blond Brown White Sum
Old

6

0

2

4

4

2

1

3

2

24

Young

0

5

2

3

1

4

2

3

0

20

Female

2

2

4

0

2

2

1

2

1

16

Male

4

3

0

7

3

4

2

4

1

28

Short

4

1

2

3

5

0

2

2

1

20

Tall

2

4

2

4

0

6

1

4

1

24

Blond

1

2

1

2

2

1

3

0

0

12

Brown

3

3

2

4

2

4

0

6

0

24

White

2

0

1

1

1

1

0

0

2

8

24

20

16

28

20

24

12

24

8

176

Sum

Supplementary Rows
Old Young Female Male Short Tall Blond Brown White
1

1

0

0

1

1

0

0

0

1

2

0

1

1

0

0

1

0

1

0

3

1

0

0

1

1

0

0

1

0

4

1

0

1

0

0

1

0

0

1

5

1

0

1

0

1

0

0

1

0

6

0

1

0

1

0

1

1

0

0

7

0

1

0

1

0

1

0

1

0

8

1

0

0

1

1

0

1

0

0

9

0

1

1

0

1

0

1

0

0

10

1

0

0

1

0

1

0

1

0

11

0

1

0

1

0

1

0

1

0

DUT 2ème année

Analyse de données
J. Lemaire 1999

16

5 Analyse des correspondances multiples
Inertia and Chi-Square Decomposition
Singular Principal
ChiCumulative
Value
Inertia Square Percent
Percent

9
18
27
36
45
----+----+----+----+----+---

0.41648

0.17346 30.5284

45.74

45.74 *************************

0.30345

0.09208 16.2064

24.28

70.02 *************

0.26244

0.06888 12.1221

18.16

88.18 **********

0.20101

0.04040

7.1110

10.65

98.83 ******

0.06662

0.00444

0.7812

1.17

0.37926 66.7490

100.00

Total

100.00 *

Degrees of Freedom = 64

Row Coordinates
Dim1
Old
Young
Female

Column Coordinates

Dim2

Dim1

0.5090 -0.1251
-0.6109

Old

0.1501

Young

0.0935 -0.0023

Female

Dim2

0.5090 -0.1251
-0.6109

0.1501

0.0935 -0.0023

Male

-0.0534

0.0013

Male

-0.0534

0.0013

Short

0.5005

0.3105

Short

0.5005

0.3105

Tall

-0.4171 -0.2588

Tall

-0.4171 -0.2588

Blond

-0.0711

Blond

-0.0711

Brown

-0.2502 -0.2637

Brown

-0.2502 -0.2637

White

0.8571 -0.4665

White

0.8571 -0.4665

0.8384

0.8384

Supplementary Row
Coordinates
Dim1

Dim2

1

1.0885 -0.2305

2

-0.7111 -0.3086

3

0.4238 -0.0635

4

0.6258 -0.7024

5

0.5120 -0.0664

6

-0.6918

0.6023

7

-0.7993 -0.3057

8

0.5313

0.8445

9

-0.0528

1.0684

DUT 2ème année

Analyse de données
J. Lemaire 1999

17

5 Analyse des correspondances multiples
Supplementary Row
Coordinates
Dim1

Dim2

10

-0.1270 -0.5324

11

-0.7993 -0.3057

On obtient ici une propriété barycentrique très simple :
Prop Dans l’AFC de B avec Z en lignes supplémentaires:
• Les composantes principales des lignes
supplémentaires sont les mêmes que les
composantes principales des lignes de l’AFCM
• Les points colonnes (modalités) sont les
barycentres (poids=1) de ces points lignes où la
modalité correspondante a été choisie.
Points-lignes et points-colonnes (axes F1 et F2 : 70 %)
1,2

Colman

1

Kasinski

-- axe F2 (24 %) -->

0,8

Blond
Spangel

0,6
0,4

Short

0,2
0
-0,2

Jones

-0,4

White

-0,6
-0,8
-1,5

Female
Kasavitz
Zannoria
Male
Old

Young
Brown
Tall

Singer
Myers
Smith

Delafave
Ernst

-1

-0,5

0

0,5

1

-- axe F1 (46 %) -->

Exemple : Blond = barycentre de Kasinski, Spangel, Colman
DUT 2ème année

Analyse de données
J. Lemaire 1999

18

5 Analyse des correspondances multiples

Cette propriété de représentation barycentrique exacte (et
non a une affinité près) permet donc ici d’interpréter des
proximités (et non des éloignements) entre des modalités
(colonnes) et des individus (lignes supplémentaires).
Comme ces derniers sont souvent trop nombreux pour être
représentés sur les graphiques, on se contentera souvent de
représenter des points groupes d’individus, déterminés par
les modalités de variables initiales ne participant pas à
l’analyse, ou calculés a posteriori (résultant par exemple
d’une classification des individus, basée sur leurs
composantes principales). Là encore on pourra interpréter
des proximités.
5.5. Variables supplémentaires dans l’AFCM
5.5.1. Directectement dans l’AFCM
PROC CORRESP data=Neighbor observed short mca;
tables Age--Hair;
supplementary Height Hair;

Burt Table

Supplementary Columns

Old Young Female Male

Short Tall Blond Brown White

Old

6

0

2

4

Old

4

2

1

3

2

Young

0

5

2

3

Young

1

4

2

3

0

Female

2

2

4

0

Female

2

2

1

2

1

Male

4

3

0

7

Male

3

4

2

4

1

DUT 2ème année

Analyse de données
J. Lemaire 1999

19

5 Analyse des correspondances multiples
Inertia and Chi-Square Decomposition
Singular Principal
ChiCumulative
Value
Inertia Square Percent
Percent
0.73110

0.53450 11.8151

53.45

0.68227

0.46550 10.2897

46.55

Total

1.00000 22.1048

100.00

11
22
33
44
55
----+----+----+----+----+---

53.45 ************************
100.00 *********************

Degrees of Freedom = 9

Column Coordinates
Old

Dim1

Dim2

-0.6674

0.6228

Supplementary
Column Coordinates
Dim1

Dim2

-0.2979

0.4300

Young

0.8009 -0.7474

Short

Female

0.9672

Tall

0.2483 -0.3584

Blond

0.2483 -0.3584

Brown

0.0193 -0.1131

0.9026

-0.5527 -0.5158

Male

White

-0.4304

0.8767

Modalités (axes F1 et F2 : 100 %)
1

-- axe F2 (47 %) -->

0,6

Female

White

0,8

Old
Short

0,4
0,2
0

Brown

-0,2
-0,4

Tall
Blond

Male

-0,6

Young

-0,8
-1
-0,8

-0,6

-0,4

-0,2

0

0,2

0,4

0,6

0,8

1

1,2

-- axe F1 (53 %) -->

DUT 2ème année

Analyse de données
J. Lemaire 1999

20

5 Analyse des correspondances multiples

5.5.2. En calculant des centres de gravité a
posteriori dans l’AFC de B+Z
On peut le faire dans SAS en utilisant la PROC
TABULATE :
DATA B1Z1;
set B1 Z1;
if (_N_<=4) then w=1;
else w=-1;
PROC CORRESP data=B1Z1 outc=Y observed short;
var Old--Male;
id Label;
weight w;
DATA Y1;
set Y(where= (_TYPE_='SUPOBS'));
set Neighbor;
keep Label Dim1 Dim2 Height Hair;
PROC TABULATE data=Y1 out=Y2;
var Dim1 Dim2;
class Height Hair;
table Height Hair, (Dim1 Dim2)*Mean;
DATA Y3;
set Y2;
if (_TYPE_='10') then Label = Height;
else Label = Hair;
Dim1 = Dim1_Mean;
Dim2 = Dim2_Mean;
keep Label Dim1 Dim2;
PROC PRINT data=Y3 noobs;

DUT 2ème année

Analyse de données
J. Lemaire 1999

21

5 Analyse des correspondances multiples

Contingency Table

Supplementary Rows

Old Young Female Male Sum

Old Young Female Male

Old

6

0

2

4

12

1

1

0

0

1

Young

0

5

2

3

10

2

0

1

1

0

Female

2

2

4

0

8

3

1

0

0

1

Male

4

3

0

7

14

4

1

0

1

0

Sum

12

10

8

14

44

5

1

0

1

0

6

0

1

0

1

7

0

1

0

1

8

1

0

0

1

9

0

1

1

0

10

1

0

0

1

11

0

1

0

1

Inertia and Chi-Square Decomposition
Singular Principal
ChiCumulative
Value
Inertia Square Percent
Percent
0.53450

0.28569 12.5705

56.87

0.46550

0.21669

9.5342

43.13

0.50238 22.1048

100.00

Total

11
22
33
44
55
----+----+----+----+----+---

56.87 **************************
100.00 ********************

Degrees of Freedom = 9

Row Coordinates
Old

Dim1

Dim2

-0.4879

0.4249

Column Coordinates
Old

Dim1

Dim2

-0.4879

0.4249

Young

0.5855 -0.5099

Young

0.5855 -0.5099

Female

0.7071

Female

0.7071

Male

0.6158

-0.4040 -0.3519

Male

DUT 2ème année

0.6158

-0.4040 -0.3519

Analyse de données
J. Lemaire 1999

22

5 Analyse des correspondances multiples
Supplementary Row
Coordinates
Dim1

Dim2

1

-0.8344

0.0785

2

1.2092

0.1137

3

-0.8344

0.0785

4

0.2050

1.1179

5

0.2050

1.1179

6

0.1698 -0.9257

7

0.1698 -0.9257

8

-0.8344

0.0785

9

1.2092

0.1137

10

-0.8344

0.0785

11

0.1698 -0.9257

Dim1 Dim2

Tableau Y3 :

Mean Mean
Height
Short
Tall

-0.22

0.29

0.18

-0.24

Hair
Blond

0.18

-0.24

Brown

0.01

-0.08

White

-0.31

0.60

Label

Dim1

Dim2

Short

-0.21781

0.29340

Tall

0.18151

-0.24450

Blond

0.18151

-0.24450

Brown

0.01415

-0.07714

White

-0.31470

0.59817

Mais, on peut retrouver ces résultats beaucoup plus
simplement en réalisant une AFC du tableau contingence
obtenu en croisant les variables actives avec toutes les
variables, les variables non actives étant supplémentaires :
PROC CORRESP data= Neighbor observed short;
tables Age Sex, Age--Hair;
supplementary Height Hair;
DUT 2ème année

Analyse de données
J. Lemaire 1999

23

5 Analyse des correspondances multiples
Contingency Table
Old Young Female Male Sum
Old

6

0

2

4

12

Young

0

5

2

3

10

Female

2

2

4

0

8

Male

4

3

0

7

14

Sum

12

10

8

14

44

Supplementary Columns
Short Tall Blond Brown White
Old

4

2

1

3

2

Young

1

4

2

3

0

Female

2

2

1

2

1

Male

3

4

2

4

1

Inertia and Chi-Square Decomposition
Singular Principal
ChiCumulative
Value
Inertia Square Percent
Percent
0.53450

0.28569 12.5705

56.87

0.46550

0.21669

9.5342

43.13

0.50238 22.1048

100.00

Total

11
22
33
44
55
----+----+----+----+----+---

56.87 **************************
100.00 ********************

Degrees of Freedom = 9

Row Coordinates
Old

Dim1

Dim2

-0.4879

0.4249

Column Coordinates
Old

Dim1

Dim2

-0.4879

0.4249

Young

0.5855 -0.5099

Young

0.5855 -0.5099

Female

0.7071

Female

0.7071

Male

0.6158

-0.4040 -0.3519

Male

DUT 2ème année

0.6158

-0.4040 -0.3519

Analyse de données
J. Lemaire 1999

24

5 Analyse des correspondances multiples
Supplementary
Column Coordinates
Short

Dim1

Dim2

-0.2178

0.2934

Tall

0.1815 -0.2445

Blond

0.1815 -0.2445

Brown

0.0141 -0.0771

White

-0.3147

0.5982

Points-lignes et points-colonnes (axes F1 et F2 : 100 %)
0,8

Female

White

0,6

Old

0,4

Short
0,2
0

Brown

-0,2

Blond
Tall

Male

-0,4

Young
-0,6
-0,6

-0,4

-0,2

0

0,2

0,4

0,6

0,8

-- axe F1 (57 %) -->

C’est souvent cette dernière technique qui est utilisée dans
les dépouillements d’enquêtes. On choisit généralement
comme variables actives les caractéristiques générales de
la population et comme variables supplémentaires, celles
associées aux thèmes observés.

DUT 2ème année

Analyse de données
J. Lemaire 1999


Aperçu du document afcmexemple_copy.pdf - page 1/24
 
afcmexemple_copy.pdf - page 3/24
afcmexemple_copy.pdf - page 4/24
afcmexemple_copy.pdf - page 5/24
afcmexemple_copy.pdf - page 6/24
 




Télécharger le fichier (PDF)


afcmexemple_copy.pdf (PDF, 1.6 Mo)

Télécharger
Formats alternatifs: ZIP



Documents similaires


afcmexemple copy
identification of factors associated with good
social media use and eating concerns among us young adults 1
0391 letirantandsantos silva 2014
humour 2
1505 full

Sur le même sujet..