27.09 11h45 Analyse de la variance SUITE Lemdani n83 .pdf


Nom original: 27.09-11h45-Analyse-de-la-variance-SUITE-Lemdani-n83.pdfAuteur: Essia Joyez

Ce document au format PDF 1.4 a été généré par Writer / OpenOffice 4.1.1, et a été envoyé sur fichier-pdf.fr le 03/10/2016 à 21:53, depuis l'adresse IP 90.110.x.x. La présente page de téléchargement du fichier a été vue 407 fois.
Taille du document: 159 Ko (4 pages).
Confidentialité: fichier public


Aperçu du document


2016-2017

Analyse de la variance ANOVA - Suite
Analyse de la variance ANOVA – PARTIE 2

– UE3 : Contrôle qualité approche statistique et validation des
méthodes–
Semaine : n°4 (du 26/09/16 au
30/09/16)
Date : 27/09/2016

Heure : de 11h15 à
12h15

Binôme : n°83

Professeur : Pr. Lemdani
Correcteur : n°82

Remarques du professeur : aucune

PLAN DU COURS
PLAN DE COURS :

II) Tableau d'ANOVA
A- Équation d'ANOVA
B- Exemple des plantes d'iris de Fisher :

III) Conditions
A- Modèle
B- Comparaison des variances
1) Les conditions d'utilisation du test F
2) Estimation

C- Normalité de l'erreur ε

1/4

2016-2017

Analyse de la variance ANOVA - Suite

Rappel de la séance précédente :
• La méthode d'analyse de la variance peut se concevoir comme une généralisation de la méthode
de comparaison entre différentes populations.
• Répondre à la question revient à analyser la variance : case de la dispersion ; aléatoire ou due à
un changement de X ?
• La somme des carrés SCT est composée d'une partie expliquée et d'une autre inexplicable.

II) Tableau d'ANOVA :
A. Équation d'ANOVA :
B. Exemple des plantes d'iris de Fisher :
Observations : X11, X12, …, X1n1 ; X21, X22, …, X2n2 ; Xk1, Xk2, …, Xknk
Si = somme des observations du groupes i, S = S1 + … Sk
SC = somme des carrés de toutes les observations



SCT = SC – S²/n



SCM = ∑ (Si²/ni – S²/n) ;allant de i=1 à i=k



SCR = SC - ∑ Si²/ni ;allant de i=1 à i=k

Les formules sont illustratives pour montrer qu'on peut faire l'ANOVA à la main mais les calculs vont être faits à la machine.
Exemple :
Plante d'iris. Comparer les largeurs moyennes des sépales (simple test de comparaison de moyennes à 3 populations)
Ho:{μ1= μ2 = μ3}

H1 : « il y a au moins 2 moyennes différentes »

Vérifier les conditions du test d'ANOVA et compléter le tableau.
Si on rend les 150 observations on a : S1 = 171,4cm ; S2 = 138,5cm et S3 = 148,7cm
En additionnant les 3 sommes on a : S = 458,6cm
La somme des observations élevées au carré : SC = 1430,4cm²
La somme des carrés totale : SCT = 1430, - 458,6²/150 = 28,307cm²
SCM = (171,4² + 138,5² + 148,7²)/50 – 458,6²/150 = 11,345cm²
Compléter le tableau d'ANOVA :

Effet

SC

ddl

CM

F

Modèle

11,34

2

5,67

Fc = 49,160

Résiduel

16,96

147

0,11

Sous Ho

Total

28,3

149

CM= Carrés moyens = Variance = SC/ddl
CM résiduel : variance dans une même espèce de plantes ;

2/4

F~F

²147

2016-2017

Analyse de la variance ANOVA - Suite

CM modèle : variance entre les espèces ;
Fc : rapport entre CM modèle et CM résiduel ; Fc = CM m / CM r

Sous Ho, F suit une loi de Fisher F

²147 (tel que 2 et 147 des degrés de liberté)

On lit sur la table de Fisher à 5%:
➔ Colonne n°2 (numérateur)
➔ Ligne n°120 (dénominateur) : dans ce cas le dénominateur est égal à 147 que l'on considère plus proche de 120 que
de +infini
➔ On trouve la valeur 3,07
On a Fc = 49,160 < 3,07 donc rejet de Ho.

III) Conditions :
A. Modèle :
Écriture du modèle :
Jon écrit : Y = f(X) + ε ; tel que :


Y : réponse ; (dans le cas de l'exemple de Fisher Y= largeur du sépale)



X : facteur ; (dans le cas de l'exemple de Fisher X = espèce)



ε : erreur ; fluctuation = partie inexpliquée



f(X) : partie expliquée du modèle

On peut ainsi dire que la largeur (variable quantitative) du sépale est fonction de l'espèce (variable quantitative).
En pratique : Yij => groupe i donc X prend la valeur i donc on écrit : Yij = μi + εij (avec fi(X)=μi )

1) Les conditions d'utilisation du test F :
Les conditions sont :



ε doit être de moyenne nulle (pas de biais)



Sa variance doit être constante (homoscédasticité) => σ1² = σ2² = ... = σk² = σ² (σ : valeur de la variance commune)



Les εij doivent être indépendantes



ε ~ N (0,σ) ; normalité sur l'erreur

En pratique :


ε doit être de moyenne nulle = CONDITION NON TESTEE



Variance constante = A VERIFIER avant de faire le test F d'ANOVA



L’indépendance des erreurs = CONDITIONS NON TESTEE



La normalité de l'erreur = TEST DE NORMALITE sur les résidus (notion expliquée plus tard dans le cours)

Ordre d'étude : on commence par faire le test de la constance des variances, on passe ensuite à la réalisation du test et pour finir on teste la normalité.

3/4

2016-2017

Analyse de la variance ANOVA - Suite

2) Estimation :


μi = moyenne de Y dans la population i, estimée par yi ( :moyenne des observations dans l'échantillon Y)



εij = erreur associée à l'observation ij (εij = Yij – μij), estimée par Yij – yi qui est le résidu associé à l'observation ij

Résidu : dans un même groupe les observations s'écartent de la moyenne du groupe, le résidu est donc une estimation de l'erreur.
Le résidu associé à l'observation ij est donc ɛ^ij = Yij - yi

B. Comparaison des variances :
Test d'égalité des variances à réaliser avant l'ANOVA :
Ko : {σ1² = σ2² = … = σk²}

K1 : « il y a au moins 2 variances différentes »

Différents tests possibles (retrouvée sur logiciel) :






Test de Levene (réalisé par SPSS) : Principe : une autre ANOVA sur les résidus absolus (valeurs absolues) Zij = │Yij – yi│


Zij : observations



Problème : conditions à vérifier sur les Zij onc on suppose l'égalité des variances chez Zij

Test de Bartlett :


Sur le plan mathématique, c'est le meilleur mais le problème est qu'il suppose la normalité



Adapté du test de rapport de vraisemblance => sensible à un écart à la normalité

Test de Cochran : adapté si une variance est très supérieure aux autres

Si rejet de l'égalité des variances Ko => pas de conséquences si :


Plan équilibré (ou presque) : échantillons de même taille (dans le cas de l'exemple de Fisher 50, 50 et 50)



Rapport « raisonnable » entre plus grande et plus petite variances (Max / Min < 3 ou 4)

Si non rejet de l'égalité des variances Ko : variance commune σ² estimée par s² tel que S² = CMR

Exemple : Plantes d'iris (test de Levene) : Fc = 0,601 et p = 0,550

C. Normalité de l'erreur e :
ε~ N (0,σ) => erreur dont la loi de probabilité est une gaussienne
ε~ N(0,σ) => F ~ F




(k-1) (n-k)

Problème 1 : Yij = μi + εij => εij = Yij – μi


εij inconnue donc test de normalité non réalisable



εij estimée par le résidu ε^ij = Yij - yi

Problème 2 : les ε^ij ne sont ni indépendantes, ni homoscéolastiques (lorsque les εij le sont) => calcul des résidus standarisés/studentisés
par la machine (qui sont homoscéolastiques et -presque- indépendants).

Exemple des Plantes d'iris (test de Shapiro-Wilk) : Wc = 0,989 et p = 0,323. Wc est proche de 1 et p est relativement élevée => Validation de la
normalité.

4/4


Aperçu du document 27.09-11h45-Analyse-de-la-variance-SUITE-Lemdani-n83.pdf - page 1/4

Aperçu du document 27.09-11h45-Analyse-de-la-variance-SUITE-Lemdani-n83.pdf - page 2/4

Aperçu du document 27.09-11h45-Analyse-de-la-variance-SUITE-Lemdani-n83.pdf - page 3/4

Aperçu du document 27.09-11h45-Analyse-de-la-variance-SUITE-Lemdani-n83.pdf - page 4/4




Télécharger le fichier (PDF)






Documents similaires


27 09 11h45 analyse de la variance suite lemdani n83
28 09 16 10h15 11h15 stats variance lemdani 85 86
21 09lemdani 3a b75 76
290916 10h15 11h15 lemdani 79 88 partie 1
28 09 16 10h15 11h15 anova fac al lemdani 85 86
sans nom 1

🚀  Page générée en 0.014s