Stats RappelsCours .pdf



Nom original: Stats-RappelsCours.pdf

Ce document au format PDF 1.5 a été généré par LaTeX with hyperref package / pdfTeX-1.40.17, et a été envoyé sur fichier-pdf.fr le 04/02/2018 à 14:00, depuis l'adresse IP 176.187.x.x. La présente page de téléchargement du fichier a été vue 389 fois.
Taille du document: 253 Ko (5 pages).
Confidentialité: fichier public


Aperçu du document


Claire Dandine-Roulland, Sarah Flora Jonas, Émeline Courtois

Rappels de cours de Statistiques
Chapitre 9 : Comparaison de deux moyennes (et de deux pourcentages)
Rappels :
P
• Espérance estimée sans biais : X = n1 ni=1 Xi
• Variance estimée sans biais (aussi notée s2 ) :
n
n
n
n
X
X
1 X
1
1 X
n
2
2
b =
X
(Xi ) + nX =
σ
(Xi − X)2 =
(Xi )2 − 2X
(Xi )2 −
n − 1 i=1
n − 1 i=1
n

1
n

1
i=1
i=1

#

"

2

• Test exact de Student : permet la comparaison de deux moyennes µA et µB issues de deux échantillons
indépendants (XiA )1≤i≤nA et (XiB )1≤i≤nB .
H0 : µA = µB

XA − XB

T =s

2
bR
σ



1
1
+
nA nB

VS

H1 :

µA =
6 µB
µA > µB ou µA < µB

test bilatéral
test unilatéral

X A et X B moyennes estimées des échantillons A et B
nA et P
nB effectifs des P
échantillons A et B



2 =
bR
σ

nA
nB
(XiA −X A )2 + i=1
(XiB −X B )2
i=1
nA +nB −2

=

2 +(n −1)b
2
(nA −1)b
σA
σB
B
nA +nB −2

→ Sous H0 , la statistique de test T suit une loi de Student à nA + nB − 2 degrés de liberté.
Conditions :
1. Normalité du critère étudié
2. Égalité des variances σA = σB
En pratique :
→ vérifier si nA ' nB (du simple au double) ⇒ Student
2 'σ
2 (du simple au double) ⇒ Student
bA
bB
→ si nA 6= nB mais σ
→ sinon : la comparaison est elle judicieuse ? utilisation d’un test non paramétrique ?
• Test asymptotique de comparaison de deux pourcentages π1 et π2 issus de deux échantillons indépendants.
H0 : π1 = π2 VS H1 : π1 6= π2
test bilatéral
π1 > π2 ou π1 < π2 test unilatéral
Z=s

c1 − π
c2
π

b (1 − π
b)
π

1
1
+
n1 n2



c1 et π
c2 proportions estimées du caractère étudié dans les
π
échantillons 1 et 2
n1 et n2 effectifs des échantillons 1 et 2
b2

b = n1nπb1 +n
π
1 +n2

→ Sous H0 , la statistique de test Z suit une loi Normale centrée réduite.
Conditions : effectifs suffisamment grands pour une approximation par la loi Normale.
En pratique : n1 π1 , n1 (1 − π1 ), n2 π2 , n2 (1 − π2 ) ≥ 5

Chapitres 10, 11 et 12 : Comparaison d’une distribution théorique à une distribution observée, Comparaison de plusieurs distributions observées, Liaison
entre deux variables qualitatives
Test du χ2 :
• adéquation à une loi théorique, comparaison de deux distributions observées → test d’adéquation, test du
χ2 de Pearson
• liaison entre deux variables catégorielles → test d’indépendance
Rappel : α quantile q α d’une loi L ⇔ P (X ∼ L ≥ q α ) = α ⇔ P (X ∼ L ≤ q α ) = FX (q α ) = 1 − α

Claire Dandine-Roulland, Sarah Flora Jonas, Émeline Courtois

Distribution observée et distribution théorique
Catégories
Effectifs observés
Effectifs attendus sous H0

1
O1
E1

Statistique de test :
S=

k
Ok
Ek

H0 : « Distribution observée = Distribution
théorique »
Conditions d’applications : Pour i = 1, .., k,
Ei ≥ 5
Loi sous H0 : S suit une loi du χ2 à k − p − 1
degrés de liberté, où k : nombre de catégories et p : nombre de paramètres à estimer au
préalable si besoin sous H0

k
X
(Oi − Ei )2

Ei

i=1

...
...
...

Région de rejet : seuil α

On rejette H0 si la valeur de la statistique
α
de test est supérieure à qk−p−1
qui est le α
2
quantile d’une loi du χ à k − p − 1 ddl

α
R = [qk−p−1
; +∞[

Plusieurs distributions observées
Distribution observée (attendue) de l’échantillon 1
...
Distribution observée (attendue) de l’échantillon l

1
O11 (E11 )
...
Ol1 (El1 )
TC1

...
...
...
...
..

c
O1c (E1c )
...
Olc (Elc )
TCc

TL1
...
TLl
N

H0 : « Les l distributions observées sont les mêmes »
Statistique de test :
S=

l X
c
X
(Oi,j − Ei,j )2

Loi sous H0 : S suit une loi du χ2 à (l −1)×(c−1) degrés
de liberté, où l est le nombre de distributions considérées
(nb de lignes) et c le nombre de modalités de ces distributions (nb de colonnes).

Ei,j

i=1 j=1

avec Ei,j =

Conditions d’applications : Pour i = 1, .., l et j = 1, .., c ,
Ei,j ≥ 5

TLi ×TCj
N

Région de rejet : seuil α
R=

On rejette H0 si la valeur de la statistique de test est
α
supérieure à q(l−1)(c−1)
qui est le α quantile d’une loi du
2
χ à (l − 1) × (c − 1) ddl

α
[q(l−1)×(c−1)
; +∞[

Indépendance de deux variables qualitatives
X/Y
X=1
...
X=l

Y =1
O11 (E11 )
...
Ol1 (El1 )
TC1

...
...
...
...
..

Y =c
O1c (E1c )
...
Olc (Elc )
TCc

Statistique de test :
S=

l X
c
X
(Oi,j − Ei,j )2
i=1 j=1

avec Ei,j =

Ei,j

TLi ×TCj
N

Région de rejet : seuil α
α
R = [q(l−1)×(c−1)
; +∞[

TL1
...
TLl
N

X et Y deux variables catégorielles à c et l modalités
respectivement, tableau des effectifs observés et attendus
sous H0
H0 : « X et Y sont indépendantes »
Conditions d’applications : Pour i = 1, .., l et j = 1, .., c ,
Ei,j ≥ 5
Loi sous H0 : S suit une loi du χ2 à (l −1)×(c−1) degrés
de liberté, où l est le nombre de modalité de X (nb de
lignes) et c le nombre de modalités de Y (nb de colonnes).
On rejette H0 si la valeur de la statistique de test est
α
supérieure à q(l−1)(c−1)
qui est le α quantile d’une loi du
2
χ à (l − 1) × (c − 1) ddl

Claire Dandine-Roulland, Sarah Flora Jonas, Émeline Courtois

Chapitre 13 et 14 : Comparaison de deux variances, Analyse de la variance
• Comparaison de deux variances : porte sur la variabilité de deux distributions indépendantes de X1 et X2 .
Hypothèses
H0 : σ12 = σ22
contre
H1 : σ12 6= σ22

Statistique de test
b2
σ
S = 12
b2
σ
b12 > σ
b22
avec σ

Loi sous H0

Région de rejet (bilatérale)

−1
S ∼ Fnn21−1

Rα = [qnα1 −1;n2 −1 ; +∞[
rq : on regarde une seule direction du rejet grâce
à la construction de la statistique de test

Conditions : Normalité des distributions. Le test de Fisher n’est pas robuste à la non normalité.
• Analyse de la variance : le but est de comparer plusieurs moyennes. On note K le nombre de moyennes à
comparer et N le nombre total de mesures.
H0 : µ1 = ... = µK = µ contre H1 : ∃i = 1, .., K tel que µi 6= µ
2 =
bR
1. Estimation d’une variance valable sous H0 et sous H1 : la variance résiduelle σ

SCR =

nk
K X
X

K
X

k=1 i=1

k=1

(Xi;k − X k )2 =

bk2 =
(nk − 1) × σ

nk
K X
X

2
Xi;k


k=1 i=1

SCT =

2
Xi;k

2

− N (X) =

k=1 i=1

nk
K X
X

2
K
k=1 nk X k

P
2
Xi;k



N

k=1 i=1

=

nk

k=1

nk
K X
X

avec

K Pnk
X
( i=1 Xi;k )2

bT2 =
2. Estimation d’une variance valable uniquement sous H0 : variance totale σ
nk
K X
X

SCR
N −K

SCT
avec
N −1

2
Xi;k

PK



(

k=1

k=1 i=1

Pnk

i=1 Xi;k )

2

N

Ici on considère que l’échantillon est composé d’un groupe unique → il n’y a pas de différence entre les
moyennes (H0 ). On calcule donc une variance unique.
2 et totale σ
bR
bT2
3. Comparaison de la variance résiduelle σ
2 et σ
bR
bT2 sont liées, impossible dans ce cas de faire un test de Fisher classique. On déduit un
Problème : σ
2 sous H .
bR
estimateur indépendant de σ
0

SCG = SCT − SCR =

K
X

(

Pnk

i=1 Xi;k )

nk

k=1
2
bG
σ

2



(

Pnk

2
i=1 Xi;k )

N

!

=

K
X

nk (X k )2 − N (X)2

k=1

SCG
=
K −1
Statistique de test
b2
σ
S= G
2
bR
σ

Loi sous H0

Région de rejet (unilatérale)

K−1
S ∼ FN
−K

α
Rα = [qK−1;N
−K ; +∞[

2 >σ
2 , c’est pour ça que le test est unilatéral → on ne rejette H que pour des « trop »
bG
bR
Remarque : En moyenne σ
0
grandes valeurs de la statistique de test.
Conditions : Normalité et variances identiques, le test est robuste à la non normalité.
En pratique :
— vérifier l’égalité des variances (leur rapport ne dépasse pas 3) sans faire le test de Fisher non robuste à la
non normalité.
— si le test (ANOVA) est significatif , faire des comparaisons 2 à 2.

Dispersion

Somme des carrés

ddl

Entre groupe

SSG

K −1

Résiduelle
Totale

SCR
SCT

N −K
N −1

Variances

Statistique de test

SCG
K−1
SCR
N −K
SCT
N −1

K−1
S = bσG2 ∼H0 FN
−K
R

2 =
bG
σ
2 =
bR
σ
bT2 =
σ

b
σ2

Claire Dandine-Roulland, Sarah Flora Jonas, Émeline Courtois

Chapitre 15 : Corrélation
• Corrélation : liaison entre deux variables aléatoires quantitatives X et Y avec observations des couples (xi , yi ).
Ces couples (xi , yi ) peuvent concerner le même individus ou deux individus distincts.
∗ covariance : cov(X, Y ) = E [(X − µX )(Y − µY )] = E(XY )−E(X)E(Y ) = 21 [V ar(X + Y ) − V ar(X) − V ar(Y )]
∗ estimation de la covariance (sans biais)
cd
ov(X, Y ) =

n
n
1 X
1 X
n
(Xi − X)(Yi − Y ) =
Xi Yi −
X Y
n − 1 i=1
n − 1 i=1
n−1

∗ coefficient de corrélation : ρ = √

cov(X,Y )
,
V ar(X)V ar(Y )

ρ ∈ [−1, 1]

∗ estimation du coefficient de corrélation :
cd
ov(X, Y )

ρb = q

Pn

i=1 (Xi

= qP

n
i=1 (Xi

2 σ
bX
bY2
σ

Pn

− X)(Yi − Y )

− X)

qP
n
2

i=1 (Yi

− Y )2

i=1 Xi Yi − nX Y
q
n
2 − nX 2 Pn Y 2
X
i=1 i
i=1 i

= qP

− nY

2

• Test d’indépendance : on teste H0 : ρ(X, Y ) = 0 contre H1 : ρ(X, Y ) 6= 0 . On suppose la binormalité.
Statistique de
test
!

b
ρ
S= p
n−2
1 − ρb2

Loi sous H0

Région de rejet (bilatérale)

S ∼ Tn−2

Rα = [−∞; −qn−2 ] ∪ [qn−2 ; +∞[

α/2

α/2

• Transformée de Fisher et intervalle de confiance de ρ
1
1 + ρb
1
1+ρ
1
ln
≈ N z = ln
,
2
1 − ρb
2
1−ρ
n−3


zb =
h

d’où ICα (z) = zb ± q α/2

q

1
n−3

i











avec q α/2 quantile d’une loi normale centrée réduite. Et on obtient :
"

exp(2zinf ) − 1 exp(2zsup ) − 1
ICα (ρ) =
;
exp(2zinf ) + 1 exp(2zsup ) + 1

#

Chapitre 16 : Introduction à la régression linéaire
• Estimation des paramètres : on dispose de n couples d’observations (xi , yi ) à partir desquels on estime les
paramètres du modèle
Y = β0 + β1 X + ε
Pn

• βb1 =

i=1 xi yi



Pn

Pn

2
i=1 xi −

Pn

• βb0 =

i=1 yi

n

Pn

xi
y
i=1 i
n
P
2
( ni=1 xi )
n

Pn

i=1

=

i=1 (yi − y)(xi −
Pn
2
i=1 (xi − x)

E(βb1 ) = β1 (sans biais)
σ2
Var(βb1 ) = Pn
2
i=1 (xi − x)

x)

Pn

− βb1

E(βb0) = β0 (sans biais)

i=1 xi

n

1

Var(βb0 ) = σ 2 
Pn
b2 =
•σ

i=1



yi − βb0 − βb1 xi
n−2

2

n



x2

+
Pn

2
i=1 xi



(

Pn

2

x
i=1 i )
n




Pn

=

2
b2 Pn (xi − x)2
i=1 (yi − y) − β1
i=1

n−2

• Test de pente nulle : on teste H0 : β1 = 0 contre H1 : β1 6= 0. On suppose la normalité du critère étudié et
l’homoscédasticité.
Statistique de test
pPn
βb1
2
S = r Pn
×
i=1 (xi − x)
(yi −b
yi
n−2

i=1

)2

Loi sous H0

Région de rejet (bilatérale)

S ∼ Tn−2

Rα = [−∞; −qn−2 ] ∪ [qn−2 ; +∞[

α/2

α/2

Claire Dandine-Roulland, Sarah Flora Jonas, Émeline Courtois

Chapitre 17 : Séries appariées
Séries appariées : plusieurs mesures sur un même individu. Les séries de mesures ne sont plus indépendantes.
A
1. Comparaison de deux critères quantitatifs : Soit 2 groupes de mesures appariées (xA
1 , ..., xn ) et
B
B
A
B
(x1 , ..., xn ) qui sont les réalisations de deux échantillons aléatoires (Xi )1≤i≤n et (Xi )1≤i≤n .
On teste H0 : µA = µB ⇔ ∆ = 0 avec ∆ = µA − µB , contre H1 : ∆ 6= 0. On suppose la normalité des
distributions et l’égalité des variances. Ce test est robuste aux écarts de conditions.
B
A
B
On définit di = xA
i − xi les réalisation de l’échantillon aléatoire (Di = Xi − Xi )1≤i≤n , on a sous les
2)
hypothèses du test D ∼ N (∆, σD

P

En pratique, on va estimer ∆ par d =
Statistique de test
d
S=r
σd2

i

n

di

2 par ce que l’on note σ
bd2 .
et σD

Loi sous H0

Région de rejet (bilatérale)

S ∼ Tn−1

Rα = [−∞; −qn−1 ] ∪ [qn−1 ; +∞[

α/2

α/2

b

n

bd2 =
avec σ

1
n−1

Pn

i=1 (di

2 +σ
2 − 2c
bB
d
bA
− d)2 = σ
ov(XA , XB ) .

Dans la suite on note A et B deux types de traitements et +, − le succès et l’échec du traitement.
2. Comparaison de deux critères qualitatifs : On cherche à tester si les probabilités de succès sont les
mêmes pour A et B. On résume l’information sous la forme d’un tableau d’effectifs.

B+
B−

A+
a
c
a+c

A−
b
d
b+d

On teste sur les paires discordantes n∗ = b + c (cf. p183),
H0 : πA+ = πB + contre H1 : πA+ 6= πB +
a+b
c+d
n

Conditions d’applications : n∗ ≥ 10
Statistique de test
(b − c)2
S=
b+c

Loi sous H0

Région de rejet (unilatérale)

S ∼ χ21

Rα = [q1α ; +∞[

3. Test d’un lien entre deux critères qualitatifs : on teste H0 : « le facteur B n’a pas d’effet sur A » ⇔
πA+ |B − = πA+ |B + contre H1 : πA+ |B − 6= πA+ |B + . On a le tableau des effectifs observés et attendus sous H0
suivant :
Conditions d’applications : Pour i, j = 1, 2 , Ei,j ≥ 5
A+
A−
Statistique de test
Loi sous H0
B + O1,1 (E1,1 ) O1,2 (E1,2 ) TL1
2
P
P
(O

E
)
i,j
i,j
B − O2,1 (E2,1 ) O2,2 (E2,2 ) TL2
S = 2i=1 2j=1
S ∼ χ21
E
i,j
TC1
TC2
n
Avec Ei,j =

TLi ×TCj
n

Région de rejet (unilatérale)
Rα = [q1α ; +∞[


Aperçu du document Stats-RappelsCours.pdf - page 1/5

Aperçu du document Stats-RappelsCours.pdf - page 2/5

Aperçu du document Stats-RappelsCours.pdf - page 3/5

Aperçu du document Stats-RappelsCours.pdf - page 4/5

Aperçu du document Stats-RappelsCours.pdf - page 5/5




Télécharger le fichier (PDF)


Stats-RappelsCours.pdf (PDF, 253 Ko)

Télécharger
Formats alternatifs: ZIP Texte



Documents similaires


stats rappelscours
sans nom 1
cours1 statistique stu s3
master biostat sous spss1
14 09 16 14h 15h pr lemdani 57 68 2
seance 5

Sur le même sujet..




🚀  Page générée en 0.009s