Statistiques 11.09.2017 .pdf



Nom original: Statistiques 11.09.2017.pdfAuteur: Essia Joyez

Ce document au format PDF 1.5 a été généré par Conv2pdf.com, et a été envoyé sur fichier-pdf.fr le 13/09/2017 à 15:36, depuis l'adresse IP 194.254.x.x. La présente page de téléchargement du fichier a été vue 466 fois.
Taille du document: 1.8 Mo (11 pages).
Confidentialité: fichier public


Aperçu du document


ue inf́rentielle
Contr̂le de qualit́ approche statistique et validation des ḿthodes

– UE 3 : Statistiques –
Indiquer ici, dans cette police s'il y a une annexe en fin d'heure
Semaine : n°2 (du 11/09/17 au
15/09/17)
Date : 09/09/2013

Heure : de 8h00 à
10h00

Binôme : n°33

Professeur : Pr. Lemdani
Correcteur : 34

Remarques du professeur (Diapos disponibles, Exercices sur le campus, Conseils, parties importantes
à retenir, etc.)


Les exemples sont sur moodle

PLAN DU COURS

III)

Tests

A)

Ǵńralit́

B)

Un ́chantillon
1) Test de type observ́/th́orique
2) Test de type observ́/observ́

C)

Śries apparíes
1) Plans en śries apparíes
2) Test de Mac Nemar

D)

Tests du Khi-2
1) Test d'ajustement
2) Test d'ind́pendance
3) Test d'homoǵńit́

1/11

ue inf́rentielle
1) Test de types « observ́/th́orique »
2) Test de type « observ́/observ́ » (suite)
Comparaison de moyennes (et de variances) observées :
Variable quantitative X observée sur deux échantillons.
Comparer les moyennes → comparer d'abord les variances.
Ho : {μ1 = μ2} versus H1 : {μ1 différent de μ2}.
Ko : {σ1 = σ2} versus K1 : {σ1 différent de σ2}
Conditions d'utilisation du test t (de student) :
• Normalité de X sur les deux populations,
• ou grands échantillons (n1≥30 et n2≥30)
Comparer d'abord les variances et calculer t en fonction du résultat :
• non rejet de K0 → 1
• rejet de Ko → 2
Comparaison des variances (formule (10)) :

Variable de décision : avec S2a >S2b
Ce sera une loi de Fischer.
Conditions d'utilisation du test F : identiques à celles du test t.
• Sous Ko,



suivra une loi de Fischer avec 2 nombre de degrés de liberté.
Sous Ho, t suit la loi de Student avec :
- v = n1 + n2 – 2 si non-rejet de Ko,
- si rejet de Ko.

Exemple 4 :
Comparaison de l'activité moyenne (en U/L) de l'enzyme sérique entre les femmes enceintes et les autres.
Non enceintes : 1,5 ; 1,6 ; 1,4 ; 2,9 ; 2,2 ; 1,8 ; 2,7 ; 2,2 ; 2,8 ; 2,1 ; 1,8 ; 3 ,7

2/11

ue inf́rentielle
Enceintes : 4,2 ; 5,5 ; 5,6 ; 5,4 ; 3,9 ; 5,4 ; 2,7;3,9 ; 4,1 ; 4,6 ; 3,9
X= « Activité » (quantitative continue).
Est-ce que en moyenne l'activité est la même (=hypothèse nulle) ?
Alternative bilatérale.

μ1 = moyenne de X (non enceintes) et μ2 = moyenne de X (enceintes)
n1 = 12 et n2 = 11
Ho : (μ1=μ2) contre H1 : (μ1 différent de μ1)
Petits échantillons → (deux) test(s) de normalité pour utiliser un test t.
Il faut poser les hypothèses pour les tests de normalité :
H'0 : {X suit N(μ,σ)} contre H'1 : {X ne suit pas N(μ,σ)}
Variable de décision : W1 = 0,928 (pour le 1er échantillon) et W2 = 0,914 (pour le 2ème)

Le test de Shapiro et Wilk (loi de W) est une forme de pourcentage de normalité. (Annexe 6)
La surface totale sous la courbe fait 1 : Si on est du coté de 1, on accepte la normalité. Si on est du coté
de 0, on rejette la normalité.
On définit une zone de rejet et d'acceptation.
Si on est dans α, on rejette. Si on est dans 1-α, on accepte.
On regarde dans la table (annexe 6) à n = 11 et n = 12.
La zone de rejet est de 0,850 à 2ème valeur.
Zones de non rejet respectives (α= 0,05) : [0,859 ; 1] pour l'échantillon 1 et [0,850 ; 1] pour l'échantillon
2.
3/11

ue inf́rentielle
On ne rejette pas la normalité dans les deux populations, on a donc le droit d'utiliser le test de student.
→ non rejet de H'0 à 5% (pour les deux populations) → Utilisation du test t.

On poursuit la réalisation du test :
Comparaison des variances :
K0 : {σ1 = σ2} versus K1 : {σ1 différent de σ2}
Calculs : on rentre les données dans la calculatrice :
x̅ = 2,225, s ≈ 0,685,
1
x̅ = 4,382 et s ≈ 0,840
2
2
1

F= (s2/s1)2 car s2> s1 8
→ Demi-zone de rejet (α = 0,05) : ]3,53 ; + infini[

On compare les variances, on calcule leur quotient.
Les deux quantités sont égales si le quotient est égal à 1.
On prend une alternative bilatérale, ce qui signifie que la zone de rejet sera bilatérale.
On compare toujours à 5% pour les variances.
On a besoin de 2 valeurs pour déterminer la zone d'acceptation car la loi est positive et non symétrique.
On prend la table de Fischer (en annexe 5).
On regarde les nombres de degrés de liberté : 10 au numérateur et 11 au dénominateur → on trouve 3,53
pour l'extrémité du coté de plus l'infini.
Pour la partie gauche de la courbe : on ne s'en occupe pas car le quotient de Fischer que l'on calcule sera
toujours supérieur à 1.
On est soit dans la demi-zone d'acceptation, ou dans la demi-zone de rejet.
Calcul : Fc = 1,50 (environ). → Non rejet de K0, au seuil de 5%.

4/11

ue inf́rentielle
Sous H0, t suit Stv avec v = 12 + 11 – 2 = 21
→ Zone d'acceptation (α = 0,05) : [-2,080 ; 2,080]

Calcul :

On est très loin dans la zone de rejet.
Conclusion : rejet de Ho, au seuil de 5%.

Quel est le prix à payer pour rejeter Ho ?
Calcul de la p-value.
Sur la table de Student, on regarde sur la ligne 21, même à 1 pour 1000, on n'accepte pas.
La p-value < 0,001.

C) Śries apparíes
1) Plans en śries apparíes
Observation d'une variable X, sur le même échantillon, à deux reprises :
• essais croisés : la même personne essaye les deux traitements,
• stabilité d'un dosage au cours du temps
• détection d'une substance par deux méthodes différentes (concordance/discordance), …
Comparaison de moyennes en séries appariées :
But : comparer les moyennes de X (quantitative) entre les deux « situations ».
Exemple : essai croisé Traitement 1 x Traitement 2
Variable quantitative X observée après le Traitement 1 (X1 de moyenne μ1) et Traitement 2 (X2 de
moyenne μ2)
Ho : (μ1 = μ2) versus H1 : (μ1 différent de μ2)
D = X2 – X1 → Ho : (μD = 0) versus H1 : (μD différent de 0) (test de type « Obs/Th »).
5/11

ue inf́rentielle
Variable de décision (Formule 14) :

si :



D suit N(μD, σ)
ou n « grand » (n>= 30)

2) Comparaison de proportions en śries apparíes : Test de Mac Nemar
Variable : X binaire (2 valeurs) observée à 2 reprises, sur un même échantillon.
Exemple : taux de satisfaction de salariés avant et après la mise en place d'une nouvelle organisation du
travail.
Notations :

1ère valeur : a : effectif des + + (proportion = p++)
d : p-→ Pour ces deux effectifs là, rien n'a changé. La méthode n'a pas d'impact sur ces gens la
b : p+c : p-+
p+ (Avant) = p++ + p+ 6/11

ue inf́rentielle
p+ (Après) = p++ + p- +
Hypothèse nulle : Π+ (Avant) = Π+ (Après) → Π++ + Π+ - = Π++ + Π- +
Ho : (Π+ - = Π- +) versus H1 : (Π+ - différent de Π- +)
Ho = égalité des taux de discordance.

Variable de décision (formule 15) :

suit

si b+c > ou = 25
Exemple 5 :
tableau d'effectifs

Est-ce que l'écart entre 45 et 25 est suffisamment grand, et donc on rejette Ho
b+c = 25 + 45 = 70 ≥ 25 → zone de rejet (α= 0,05) = ]3,841 ; + infini[
C'est la table du Khi-2

Rejet de Ho, au seuil de 5%
Si on regarde la table du Khi-2 : P-value ≈ 0,02 (environ).

D) Tests du khi-deux (X2)
→ 3 tests
Observation d'une (ou deux) variable(s) catégorielle(s) : X = 1, 2, …, c.
Variables catégorielles : variables qui fonctionnent par catégories (la plupart du temps, c'est une variable
quantitative mais pas que).
7/11

ue inf́rentielle
Exemples : groupe sanguin, génotype, IMC (regroupée en classes),...
Loi (distribution) de X :
C'est la donnée de 2 types d'informations :
• valeurs que prend la variable
• les probabilités en population

On observe la variable X sur un échantillon : si O1= 10, on a 10 personnes qui prennent la valeur 1.

1) Test d'ajustement (comparaison de la loi de X à une loi connue Lo)
Ho : {Π1= Π1° ; … ; ΠC = ΠC°}
Lo : loi théorique.

{loi de X = Lo} versus H1 : {loi de X différent de Lo}

Ti = nPi0i : effectif théorique (attendu) de X = i, sous Ho.
Variable de décision (formule 16)

k= 20

suit X2c-1 sous H0, si Ti ≥ 5 ∀i

2) Test d'ind́pendance : 2 variables cat́gorielles X et Y
X= 1, 2, …, L et Y = 1, 2, …, c → échantillon de n observations.
Tableau de contingence des effectifs observés :

8/11

ue inf́rentielle

Dans chacune des cases, on a un croisement possible, un effectif.
On rajoute les effectifs marginaux : les totaux (n1, n2, …)
Si on additionne les totaux, on obtient n = nombre total d'observation.
Tij : effectif théorique pour X = i et Y = j →

H0 : (X et Y indépendantes) versus H1 : (X et Y liées}
Variable de décision (formule 17) :

k

suit X2(l-1)(c-1) sous H0, Tij ≥ 5 ∀i
Exemple 6 :
Etude de l'association « poids à la naissance » - « sexe du nouveau-né ».
200 naissances, au hasard, dans 5 maternités distinctes :

9/11

ue inf́rentielle
Que peut-on en conclure ?
Calcul des effectifs théoriques : multiplication de l'effectif marginal en ligne par l'effectif marginal en colonne
divisé par n.
Pour le sexe féminin (<3kg) : (90x20) / 200 = 9
En colonne : pour masculin (<3kg) : 20-9 = 11

Degrés de liberté : (l-1)(c-1)
H0 : (X et Y indépendantes)

H1 : (X et Y liées)

4,5 < 5 → on ne peut pas utiliser le test du Khi-2.
Conditions non rempliées → regroupement de 2 colonnes (poids ≥ 3).
k suit X21 sous H0 (après regroupement) → zone de rejet (5%) = ]3,841 ; + infini[
kc= 2,02

→ Non rejet de H0, au seuil de 5% (P-value = 0,16 environ)

3) Test d'homoǵńit́ : comparer une distribution entre plusieurs populations
X = 1, 2, …, c catégorielle observée sur l échantillons indépendants (l ≥ 2)
Li : loi de X sur la population i.
Ho : {L1=...=Ll} versus H1 : {deux des lois au moins différent}
Tableau de contingence puis même démarche que le test d'indépendance.

10/11

ue inf́rentielle

11/11


Statistiques 11.09.2017.pdf - page 1/11
 
Statistiques 11.09.2017.pdf - page 2/11
Statistiques 11.09.2017.pdf - page 3/11
Statistiques 11.09.2017.pdf - page 4/11
Statistiques 11.09.2017.pdf - page 5/11
Statistiques 11.09.2017.pdf - page 6/11
 




Télécharger le fichier (PDF)


Statistiques 11.09.2017.pdf (PDF, 1.8 Mo)

Télécharger
Formats alternatifs: ZIP



Documents similaires


sans nom 1
14 09 16 14h 15h pr lemdani 57 68 2
statistiques 11 09 2017
07 09 16 14h 16h statistique inferentielle lemdani 21 22
27 09 11h45 analyse de la variance suite lemdani n83
21 09lemdani 3a b75 76

Sur le même sujet..