régressionLogistiqueQuertant .pdf



Nom original: régressionLogistiqueQuertant.pdf
Auteur: Mezergues Justine

Ce document au format PDF 1.5 a été généré par Microsoft® Word 2010, et a été envoyé sur fichier-pdf.fr le 12/05/2014 à 15:44, depuis l'adresse IP 193.50.x.x. La présente page de téléchargement du fichier a été vue 620 fois.
Taille du document: 666 Ko (7 pages).
Confidentialité: fichier public


Aperçu du document


Modèle de régression logistique
I.

Présentation de notre modèle

Dans un modèle de régression linéaire multiple on a :

Avec :




Zt : variable quantitative
Xt : variables quantitatives pour tout t
2
t : iid et qui suit N(0, )

{1,…,100}

Dans un modèle de régression logistique on cherche à évaluer la probabilité que (Yt) prenne
comme valeur chacune de ses modalités.
Nos variables quantitatives Xt seront représentées par quatre différentes caractéristiques
psychologiques :





Xt(1) représentera le fait qu’un individu ait un bon sommeil
Xt(2) représentera le fait qu’un individu présente une bonne attention, une bonne
concentration
Xt(3) représentera le fait qu’un individu ait une bonne motivation pour son travail
Xt (4) représentera le fait qu’un individu ne présentera pas de troubles affectifs.

Nous allons donc faire une régression logistique afin de connaître la probabilité qu’un individu
présentant une ou plusieurs de ces quatre caractéristiques psychologiques ait :



Une bonne vision binoculaire
Une déviation de ses axes visuels

Pour cela nous allons utiliser la variable qualitative Yt
{

̃
̃

En second lieu, nous referons une régression logistique pour connaître la probabilité qu’un individu
présentant une déviation de ses axes visuels ait :



Ses axes visuels en sur-convergence
Ses axes visuels en sur-divergence

Pour réaliser ces deux régressions logistiques, nous avons cherché différentes données en rapport
aux nombres d’individus présentant les caractéristiques présentées ci-dessus. N’ayant pas eu de
réponse satisfaisante, nous avons recueilli des renseignements auprès de notre tutrice du TER, Mme
Hélène Van Setters-Husson. Ce sont des indications qu’elle a observées parmi ses patients, la
méthodologie aura donc une portée scientifique, en revanche les données d’apprentissage seront
simulées, et donc nécessairement arbitraire.

Voici les données que nous avons recueillies :








II.

Environ 75% de la population présente une déviation des axes visuels ;
Parmi ces 75 % :
o Globalement 70% présente une sur-convergence ;
o A peu près 30% présente une sur-divergence ;
Quasiment 75 % de la population a un sommeil correct ;
Environ 60% de la population dispose d’une bonne attention et d’une bonne concentration ;
Approximativement 31 % de la population montre une réelle motivation au travail ;
Globalement 80 % de la population ne présente aucun trouble affectif.

Spécification du modèle

Revenons à notre régression logistique. La variable Y est une variable aléatoire parente qui suit une
loi de Bernoulli de paramètre p, et donc Yt est aussi une variable aléatoire qui suit une loi de Bernoulli
de paramètre p, avec
utiliser la fonction logistique logit.



=

. Afin que Y ne prenne que 2 valeurs, nous allons



⇔ (

)



Voyons maintenant les probabilités théoriques associées à Y pour le modèle de régression logistique
de fonction de lien logit :
=
=

III.

Estimation du modèle

Nous allons maintenant chercher à estimer nos
. Nous remarquons qu’il y a une non
linéarité en
donc faire une estimation par la méthode des moments ne
provoquerait pas d’expression explicite. Il faut donc que nous utilisions l’estimateur du maximum de
vraisemblance.
Voici la méthode théorique qui nous permettra de trouver les estimations des
Soit :






|

|




=∏

(



)
(

)

Posons le vecteur des dérivées partielles premières de la vraisemblance afin de trouver l’estimation
de ̂ :
(

)



̂

Nous ferons ces estimations de nos

IV.

à l’aide du logiciel R-Project.

Construction du modèle

Afin de construire notre modèle de régression logistique, nous avons dû créer un échantillon d’une
population de 1000 individus. Notre population suit les critères que nous avons recueillis, c'est-à-dire
qu’environ 75% des individus de notre échantillon ont un sommeil correct, 60% des individus ont une
bonne attention, 31% d’entre eux ont une bonne motivation pour leur travail et 80% ne rencontrent
pas de troubles affectifs. Chacune de nos quatre covariables suivent donc une loi que nous avons
créée à la main, mais qui respecte le critère de la densité de probabilité (c'est-à-dire que l’air sous la
courbe est égale à un 1).

Voici les différentes représentations de nos covariables :

Avec ces quatre lois, nous avons ensuite créé un modèle afin qu’environ 75% de nos individus
présentent une déviation de leurs axes visuels. Pour cela nous avons créé la variable Y.
{
Pour connaître la probabilité qu’un individu i ait une déviation de ses axes visuels, nous avons cette
condition :


̅̅̅̅̅
̅̅̅̅̅






ou
ou

̅̅̅̅̅
̅̅̅̅̅




ou

Afin d’arriver à avoir un jeu de données avec environ 75% de notre population qui ait une déviation
des axes visuels, nous avons ajuster notre
.
Grâce à ceci, nous avons pu faire une estimation des

Voici les estimations :






C’est estimations des

nous servirons plus tard pour faire des prédictions.

Nous avons fait ensuite un second échantillon, nous avons récupéré l’ensemble des individus ayant
une déviation des axes visuels de notre premier échantillon. Nous nous retrouvons maintenant avec
un échantillon de 750 individus.
Nous avons donc pris ici, les variables répondant au critère Y = « O » de notre premier modèle pour
ce second modèle. Le critère qu’une personne possède une sur-convergence au niveau de ses axes
visuel est qu’elle ait des troubles du sommeil et des troubles affectifs, inversement le critère qu’une
personne ait une sur-divergence de ses axes visuel, est qu’elle ait des troubles au niveau de son
attention et de sa motivation au travail. Pour connaître la probabilité qu’un individu j de notre
second échantillon ait un problème de sur-divergence nous avons donc émis cette condition :




̅̅̅̅̅̅̅



̅̅̅̅̅̅̅

̅̅̅̅̅̅̅

et



et



̅̅̅̅̅̅̅



Comme nous savons que 75% des personnes ayant une déviation des axes visuels possède une surconvergence, nous avons adapté notre
0,5 et notre
Nous avons donc maintenant un
échantillon de 750 personnes ayant un trouble visuel avec 562 personnes qui ont une surconvergence et 188 ayant une sur-divergence.

Grâce à ceci, nous avons pu faire une estimation des

Voici les estimations :






C’est estimations des

nous servirons plus tard pour faire des prédictions.

V.

Reconstruction et prédiction

Pour construire une reconstruction de notre modèle de régression logistique, nous utiliserons cette
probabilité :
̂




̂

̂
̂

̂
̂

̂ )
̂

̂

)

Pour établir une prédiction, nous prenons un nouvel individu qui présente tel
nous faisons la probabilité suivante :
̂




̂

̂
̂

̂
̂

puis

̂ )
̂

̂

)

 Imaginons que nous avons un nouveau patient qui a passé nos différents tests et voici ses résultats :





Sa qualité de sommeil est de 88%
La qualité de son attention est de 22%
Sa qualité de motivation au travail est de 32%
Il a un trouble affectif d’environ 69%

En faisant le calcul de ̂
, il a une probabilité de 0.9403412 d’avoir une déviation
de ses axes visuels. Nous allons maintenant calculer la probabilité qu’il soit en sur-convergence ou en
sur-divergence. En calculant ̂
, il a une probabilité de 0.739006 d’avoir une surdivergence au niveau de ses axes visuels.
 Prenons un nouvel individu qui a passé nos tests et voici ses résultats :





Sa qualité de sommeil est de 88%
La qualité de son attention est de 70%
Sa qualité de motivation au travail est de 60%
Il a un trouble affectif d’environ 71%

Nous réalisons le calcul de ̂
, et nous constatons qu’il a une probabilité de
0.1624182 d’avoir une déviation de ses axes visuels. Nous ne lui faisons donc pas le test de la surconvergence ou de la sur-divergence.
 Nous avons une autre personne qui vient nous rencontrer, nous lui faisons passer nos tests et voici
les résultats :





Sa qualité de sommeil est de 35%
La qualité de son attention est de 50%
Sa qualité de motivation au travail est de 40%
Il a un trouble affectif d’environ 60%

Nous calculons ̂
et cette personne a une probabilité de 0.9978072 d’avoir une
déviation de ses axes visuels, nous lui faisons passer notre deuxième test en calculant
̂
, et il se trouve qu’elle a une probabilité de 0.01255277 d’avoir une surdivergence. Cette personne présente donc une sur-convergence de ses axes visuels.




Télécharger le fichier (PDF)

régressionLogistiqueQuertant.pdf (PDF, 666 Ko)

Télécharger
Formats alternatifs: ZIP







Documents similaires


regressionlogistiquequertant
stats 1
nb statistique
hiv
econometrie
techniques statistiques chapitre 1 seance 1

Sur le même sujet..