analyse uni et multi variée master 1 ecologie des milieux naturelle .pdf



Nom original: analyse uni et multi variée master 1 ecologie des milieux naturelle.pdf

Ce document au format PDF 1.7 a été généré par / Foxit Reader Printer Version 7.3.0.1225, et a été envoyé sur fichier-pdf.fr le 03/06/2020 à 23:19, depuis l'adresse IP 105.107.x.x. La présente page de téléchargement du fichier a été vue 107 fois.
Taille du document: 2.6 Mo (37 pages).
Confidentialité: fichier public


Aperçu du document


Chapitre 3
Données univariées
Loi normale
une loi normale est une loi de probabilité absolument continue qui dépend de
deux paramètres : son espérance, un nombre réel noté μ, et son écart type,
un nombre réel positif noté σ. La densité de probabilité de la loi normale
d'espérance μ, et d'écart type σ est donnée par :
.
Voici le graphe de f

La courbe de cette densité est appelée courbe de Gauss ou courbe en
cloche, entre autres. C'est la représentation la plus connue de ces lois.
La loi normale de moyenne nulle et d'écart type unitaire est appelée loi
normale centrée réduite ou loi normale standard.
Loi normale centreé reduite
Exemples et tableau

1

2

3

Estimation ponctuelle et par intervalle de confiance de la variance
Toutes les méthodes proposées sont applicables dans le cas des conditions
suivantes :
- les échantillons sont aléatoires, simples et indépendants.
- la normalité des populations parents

Estimation ponctuelle
On peut estimer la variance de la population inconnue  par
 
2

SCE
, où
n 1
n



SCE   xi  x



2

et n la taille d’échantillon

i 1

Estimation par intervalle de confiance
En mathématiques, un intervalle de confiance encadre une
valeur réelle que l’on cherche à estimer à l’aide de mesures prises par
un procédé aléatoire.
L’intervalle de confiance de la variance au seuil de confiance (1-  ) où 
désigne le risque est donnée par l’intervalle Sinf , Ssup  , où

Où  2 relatif à la variable dit de Khi deux et  relatif à la variable normale
centrée et réduite
4

Principes des testes
Un test statistique est une procédure de décision entre
deux hypothèses. Il s'agit d'une démarche consistant à rejeter ou à ne
pas rejeter une hypothèse statistique, appelée hypothèse nulle, en
fonction d'un jeu de données (échantillon).
Il s'agit de statistique inférentielle : à partir de calculs réalisés sur des
données observées, nous émettons des conclusions sur la population,
en leur rattachant des risques de se tromper.
L'hypothèse nulle notée H0 est celle que l'on considère vraie a priori. Le
but du test est de décider si cette hypothèse est a priori crédible.
L'hypothèse alternative notée H1 est l'hypothèse complémentaire à
l'hypothèse nulle.
Ces deux hypothèses ne sont toutefois pas symétriques. H1 est choisie
uniquement par défaut si H0 n'est pas considérée comme crédible. Le
choix de H0 et de H1 est en général imposé par le test que l'on utilise et
ne relève donc pas de l'utilisateur.

Test d’égalité de deux variances : test de FISHER
Soit l’hypothèse nulle d’égalité des deux variances de deux populations
inconnues H 0 :  12   22
On prélève deux échantillons aléatoires et simples, indépendantes de deux
populations normalement distribuées et de tailles respectivement n1et n2
On calcule le rapport des 2 variances en mettant la variance maximale en
numérateur et la variance minimale en dénominateur et on calcule le rapport
suivant :
Fobs



min 

max  1 ,  2
2

2
1

,

2

2
2




Décision au seuil de signification  , le rejet de l’hypothèse nulle intervient
quand Fobs  F  où F  relatif à la variable de Fisher à n1  1 et n2  1 et n2
1

2

1

2

provient d’échantillon de la variance estimée minimale

5

Tests d’égalité de plusieurs variances
Deux tests d’égalité de plusieurs variances: deux méthodes sont utilisées pour
tester l’égalité de variance de plusieurs populations : - le test de BARTLETT :
pour les échantillons d’effectifs différents et aussi pour des effectifs constants.
Ce test est long à réaliser. - le test de HARTLEY : il est d’un usage beaucoup plus
rapide mais il ne s’applique qu’à des échantillons de même effectifs. Dans les
deux cas les conditions d’application doivent être très strictes

Décision

6

Le test d’égalité des deux moyennes des deux populations : Test de
STUDENT

Où n1et n2 sont respectivement la taille des deux échantillons considérés

Test de conformité

7

8

Comparaison de plusieurs moyennes ANOVA
Introduction
L’analyse de la variance (ANOVA) a pour objectif d’étudier l’influence d’un ou
plusieurs facteurs sur une variable quantitative. Nous nous intéresserons ici au
cas où les niveaux, ou modalités, des facteurs sont fixés par l’expérimentateur.
On parle alors de modèle fixe. C’est la comparaison de moyennes pour
plusieurs groupes (> 2). Il s'agit de comparer la variance intergroupe (entre les
différents groupes : écart des moyennes des groupes à la moyenne totale) à la
variance intragroupe (somme des fluctuations dans chaque groupe). S'il n'y a
pas de différence entre les groupes, ces deux variances sont (à peu près)
égales. Sinon, la variance intergroupe est nécessairement la plus grande
L’ANOVA se résume à une comparaison multiple de moyennes de différents
échantillons constitués par les différentes modalités des facteurs.
On souhaite tester les effets de k traitements qui ont été administrés
respectivement à n1,………nk individus.
En analyse de variance, le paramètre susceptible d'influer sur les données
étudiées s'appelle un facteur, et ses valeurs sont les modalités (ici les différents
traitements)
On cherche à savoir si la variabilité observée dans
les données est uniquement due au hasard, ou s'il existe effectivement des
différences significatives entre les classes, imputables au facteur. Pour cela, on
va comparer les variances empiriques de chaque échantillon, à la variance de
l'échantillon global, de taille n1+…+nk=n

Principe de l’analyse de la variance à un facteur

9

10

Conventions de notation

Estimation de la variance intra groupe SCEA

11

Estimation de la variance inter groupe SCER

Décision

12

ANOVA à deux facteurs
Réalisation et interprétation de l’analyse de variance à deux critères de
classification échantillons de plusieurs observations Présentation des données
et des calculs La présentation des tableaux des données et des calculs se fera
en deux parties.
A. Première partie
Tableau d’analyse de la variance à deux critères de classification

13

14

Deuxième partie Tableau d’analyse de la variance à deux critères de classification: Suite de la
réalisation des calculs

Sous ces conditions ,

15

16

Comparaison des moyennes de deux échantillons indépendants :
Test de Wilcoxon - Mann-Whitney (parfois appelé test U de MannWhitney).
Soit à comparer les moyennes de deux échantillons. Le premier a un effectif de
n1, le second un effectif de n2. La démarche est la suivante : 1. On classe tout
d’abord les n1+ n2 valeurs par ordre croissant, et on les remplace par leur rang
(ou rang-moyen en cas d’ex-aequos). 2. On calcule ensuite la somme «S» des
rangs des valeurs issues du premier échantillon. Si la moyenne de ce premier
échantillon est inférieure à celle du second, cette somme sera particulièrement
faible. Dans le cas contraire, elle sera particulièrement élevée. C’est ce que
nous allons tester.

17

Comparaison des moyennes de deux échantillons appariés : Test
des rangs signés de Wilcoxon (
Nous voulons à présent comparer la moyenne de deux échantillons de valeurs
appariées. La démarche la suivante est adoptée :
1. On calcule toutes les différences di entre le premier et le deuxième
échantillon, et on classe leurs valeurs absolues.
2. Supposons qu’il y ait n différences non nulles.
3. On calcule alors la somme S des rangs des valeurs positives.
4. On calcule ensuite :

18

Comparaison de plusieurs moyennes (ANOVA non-paramétrique) :
Test de Kruskal et Wallis

Test de corrélation entre deux variables : Test de Spearman

19

20

Chapitre 4
Données multivariées
Introduction
On a observé p variables sur n individus. On dit qu'il s'agit d'un protocole multivarié. Du point de vue
des variables : on cherche à remplacer ces p variables par q nouvelles variables résumant au mieux le
protocole, avec q ≤ p et si possible q=2. L'ACP a l'avantage de résumer un ensemble de variables
corrélées en un nombre réduit de facteurs non corrélés. Du point de vue des individus : chaque
individu est représenté par un point dans un espace de dimension p. On peut calculer les distances
(euclidiennes) entre deux individus, entre un individu et le point moyen du nuage, etc. On cherche
alors à trouver une projection des individus dans un espace de dimension q≤p, respectant au mieux
les distances entre les individus (une "carte", la moins déformée possible).

Exemple

21

22

Valeurs propres et vecteurs propres. Composantes principales

23

Resultats relatifs aux individus

Les scores des individus sont les valeurs des composantes principales sur les
individus. Coordonnées factorielles des ind., basées sur les corrélations
(crucianu-1-1.sta) Var. illustrative : Suje

24

25

Resultats relatifs

26

aux variables

27

28

Représentation des var

iables

29

Regression lineaire multiple

i

nous amène à résoude un système à trois équations et trois inconnues

 Y  na  b1  X 1  b2  X 2


2
 X 1Y  a  X 1  b1  X 1  b2  X 1 X 2

2

 X 2Y  a  X 2  b1  X 1 X 2  b2  X 2

30

Les calculs présentés dans le tableau suivant conduissent à l’expression

31

32

Tables statistiques
Table de Student

Table de KHI DEUX
33

34

Table de Fisher Snédecor

35

36

37


analyse uni et multi variée master 1 ecologie des milieux naturelle.pdf - page 1/37
 
analyse uni et multi variée master 1 ecologie des milieux naturelle.pdf - page 2/37
analyse uni et multi variée master 1 ecologie des milieux naturelle.pdf - page 3/37
analyse uni et multi variée master 1 ecologie des milieux naturelle.pdf - page 4/37
analyse uni et multi variée master 1 ecologie des milieux naturelle.pdf - page 5/37
analyse uni et multi variée master 1 ecologie des milieux naturelle.pdf - page 6/37
 




Télécharger le fichier (PDF)


analyse uni et multi variée master 1 ecologie des milieux naturelle.pdf (PDF, 2.6 Mo)

Télécharger
Formats alternatifs: ZIP



Documents similaires


21 09lemdani 3a b75 76
sans nom 1
cours1 statistique stu s3
master biostat sous spss1
lq12akf
seance 5