Fichier PDF

Partage, hébergement, conversion et archivage facile de documents au format PDF

Partager un fichier Mes fichiers Convertir un fichier Boite à outils PDF Recherche PDF Aide Contact



CC1 2017 2018 ( corrigé) .pdf



Nom original: CC1 2017-2018 ( corrigé).pdf
Auteur: Ndéné Ka

Ce document au format PDF 1.5 a été généré par Microsoft® Word 2010, et a été envoyé sur fichier-pdf.fr le 08/11/2017 à 13:31, depuis l'adresse IP 193.51.x.x. La présente page de téléchargement du fichier a été vue 1437 fois.
Taille du document: 616 Ko (9 pages).
Confidentialité: fichier public




Télécharger le fichier (PDF)









Aperçu du document


UNIVERSITÉ DE MONTPELLIER
FACULTÉ D’ÉCONOMIE
Année universitaire 2017-2018

ECONOMETRIE – Contrôle Continu 1
Vendredi 27 Octobre 2017 de 8h à 9h 45

1ère QUESTION (8 points)
Soit un modèle de régression linéaire multiple : y  X   . Que l’on estime par la
méthode des moindres carrés ordinaires.
1) Démontrez que s’il y a une constante dans le modèle, la somme des résidus est
toujours nulle.
[2 points]
Le principe d’estimation des MCO est de minimiser la somme des carrés des erreurs, c’est-à-dire
2
de trouver les paramètres b qui minimise la forme quadratique :   i 1  i . [0.5 point]
N

Pour cela les conditions du premier ordre sont :

 


  y  X  y  X   y y  2 y X  X X
 

 2 X y  2 X X
[0.5 point]
 2 X  y  X





On a donc les équations normales : X  y  Xˆ  0 qu’il faut résoudre pour obtenir l’estimateur
des MCO : ˆ . Le résidu de l’estimation par MCO est alors e  y  Xˆ . Ce qui permet de
réécrire les équations normales comme : X e  0 [0.5 point]
En supposant que la première colonne de X correspond à la constante (une colonne de 1), on aura
comme première équation normale :

X e  0



 e1 
 
 e2  N
1 1  1    ei  0 [0.5 point]

  i 1
e 
 N

Ce qui démontre que la somme des résidus est toujours nulle s’il y a une constante dans la
régression.

1. Maximiser le R² est-il une bonne méthode pour trouver le meilleur
modèle économétrique ? Pourquoi ? Développez votre réponse. [3
points]
Ce n’est pas le seul critère pour juger une régression. On peut le considérer par rapport à d’autres
critères tout aussi importants. Par exemple :
-

-

La parcimonie
La qualité statistique de la régression :
o Vérification des hypothèses du modèle
o Absence d’autocorrélation ou sa correction
o Homoscédasticité ou sa correction
o Endogénéité des régresseurs
La validité des variables explicatives :
o Significativité
o Significativité conjointe
o Signe et magnitude  interprétation économique

Il est de toute manière préférable pour comparer des modèles de prendre le R² ajusté pour les
degrés de liberté, en vérifiant que l’on compare des estimations sur les mêmes échantillons. Mais
globalement, une procédure de test de présence ou non de variable(s) dans la régression est
statistiquement plus pertinent.

2. Donnez l’estimateur du maximum de vraisemblance de la variance de
l’erreur dans le cas d’un modèle de régression linéaire avec des
erreurs normalement distribuées ? Quelles sont ces propriétés ? [3
points]
L’estimateur du maximum de vraisemblance de la variance de l’erreur est :
~ 2  SCR  ee [0.5 point]

N
N

Comme l’estimateur du maximum de vraisemblance des paramètres du modèle est identique
~
1
à celui des moindres carrés   ˆ   X X  X y , les résidus seront identiques pour les deux
estimateurs. En conséquence, la somme des carrés de ces résidus sera la même pour les deux
méthodes d’estimation. [0.5 point]
Sachant que E SCR    2 N  K  , on voit immédiatement que l’estimateur du MV est
biaisé :
2
~ 2   E SCR    N  K   N  K  2   2 [1 point]
E 
N
N
N
Cet estimateur biaisé de la variance de l’erreur est néanmoins convergent parce que son
espérance tend vers la vraie valeur de la variance lorsque la taille de l’échantillon tend vers
N K
2
~ 2   2 lim
l’infini : lim N  E 
   et la variance de cet estimateur tend vers
N  
 N 
N K 
4
~ 2  2 4 lim
zéro : lim N  V 
  2  0  0 .
N  
2
 N 

 

 

~ 2 tend en moyenne quadratique vers sa vraie valeur :
En conséquence, cet estimateur 
.q
p
~ 2 m
~2 

 2 , ce qui implique la convergence en probabilité : 

 2 . Donc cet estimateur,
même biaisé, est cependant convergent. (1 point)

2ème QUESTION : Application (12 points)
On analyse les dépenses de santé des personnes de plus de 65 ans qui participent au
programme Medicare américain afin de quantifier les déterminants de ces dépenses.
Les données proviennent du Medical Expenditure Panel Survey (MEPS) des EtatsUnis. Elle concerne 2 873 personnes avec des dépenses de santé strictement positives.
On s'intéresse particulièrement à la variable Mutuelle qui indique si la personne est
couverte par une mutuelle pour le ticket modérateur. Le modèle est le suivant :
log( Dépensesi )  1   2 Mutuelle i   3 LimPhys i   4 MalChri
  5 log( Revenui )   6 Agei   7 Femmei   i

avec : Dépenses : les dépenses de santé en $
Mutuelle : indicatrice de couverture par une Mutuelle
LimPhys : indicatrice de handicap
MalChr :
Nombre de maladie chronique
Revenu :
le revenu en $
Age :
l'âge de la personne (plus de 65 ans)
Femme :
Indicatrice si la personne est une femme
(la fonction log indique ici le logarithme naturel).

Les statistiques descriptives sur ces quelques variables vous sont données ci-dessous
Moyenne

Ecart-Type

Minimum

Maximum

Dépenses

7 278

11 851

3

125 610

Log(Dépenses)

8.069

1.359

1.099

11.741

Femme

0.580

0.494

0

1

Age

74.21

6.36

65

90

Mutuelle

0.597

0.491

0

1

LimPhys

0.434

0.496

0

1

MalChr

1.810

1.298

0

7

Revenu

23.331

22.598

0.023

312.460

Log(Revenu)

2.808

0.876

-3.772

5.744

On vous donne les résultats de 2 régressions estimées par MCO sur l'ensemble des
observations. Les deux dernières régressions (2A et 2B) concerne les personnes sans
ou avec une mutuelle. Dans le tableau, les écarts-type classiques sont entre
parenthèses.

Observations

Constante

Mutuelle

Régression 1

Régression 2

Régression 2A

Régression 2B

(ensemble)

(ensemble)

(Mutuelle = 0)

(Mutuelle = 1)

2 873

2 873

1 157

1 716

6,337

6,880

6,624

7,175

(0,292)

(0,085)

(0,141)

(0,109)

0,219
(0,047)

LimPhys

MalChr

Log(Revenu)

Age

0,475

0,488

0,508

0,479

(0,049)

(0,048)

(0,080)

(0,060)

0,389

0,391

0,430

0,363

(0,018)

(0,018)

(0,032)

(0,022)

0,072

0,096

0,117

0,042

(0,027)

(0,026)

(0,046)

(0,032)

0,007
(0,004)

Femme

-0,077
(0,046)

SCR

4 167,038

1 871,999

2 256,820

s

1,2001

1,2052

1,2742

1,1481



0,2219

0,2145

0,2154

0,2162

R² corrigé

0,2203

0,2136

0,2133

0,2148

-4 597,09

-4 610,77

-1 920,07

-2 669,96

17,6558

13,8954

Log. Vraisemb.
Test J-B

On vous demande de répondre aux questions suivantes :
(il n'est pas utile de rappeler la théorie des tests utilisés ici, il faut seulement les appliquer)

1. Donnez l’intervalle de confiance à 99% pour le nombre de maladie
chronique dans la première régression. [3 points]
Le paramètre estimé pour le nombre de maladie chronique dans la première régression
est : 0.389, son écart-type estimé est : sˆ = 0.018. On va construire un intervalle de
4

confiance à 99 % en se basant sur la loi normale (ce qui ici est quasiment la loi t de
Student avec 2873 degrés de liberté ):



ˆ   4
Pr  z0.99  4
 z0.99   0.99


sˆ
4



[0.5 point]

Le quantile de la distribution normale se trouve à la dernière ligne de la table de la
distribution de Student ci-joint : z0.99 = 𝑡0.005 (2866) = 2.576. [1 point]





Pr ˆ1  z0.95sˆ  1  ˆ1  z0.95sˆ  0.90
1

1

L’intervalle de confiance est donné par :





Pr ˆ4  z0.99sˆ   4  ˆ4  z0.99sˆ  0.99
4

4

Pr0.389  2.576  0.018   4  0.389  2.576  0.018  0.99
Pr0.389  0.046368   4  0.389  0.046368  0.99

[0.5 point]

Pr0.3426   4  0.4354  0.99

Si on suppose que les hypothèses de la régression MCO sont vérifiées, on a une probabilité de
99 % que la vraie valeur du paramètre nombre de maladie chronique dans la première
régression soit comprise entre 0.3426 et 0.4354. [1 point]

2. Les erreurs sont-elles normalement distribuées ? Pourquoi ? Qu’en
tirez-vous comme conséquence de ce test ? [2 points]
Le test de normalité présenté ici est le test de Jarque et Béra [0.25 point]. On compare la
statistique de test à une loi du Khi-deux à 2 degré de liberté parce que l’on teste le
coefficient d’asymétrie (Skewness) et le kurtosis de la distribution empirique des résidus.
Le quantile pour un niveau de test de 5 % est donc :  02.95 2  5.991 [0.5 point].
Dans ces deux régressions, les statistiques de test de Jarque et Béra sont largement
supérieure à ce quantile. Donc on rejette clairement l’hypothèse de normalité des erreurs
dans ces deux régressions. [0.25 point]
Cela affecte seulement la distribution des estimateurs et des différents tests de
significativité. Mais ici, vu la taille des échantillons (2873 dans les 2 premières
régressions), on peut continuer à utiliser les tests en se reposant sur la théorie
asymptotique. [1 point]

3. Peut-on retenir la régression 2 en la comparant à la régression 1 ?
Faites un test des restrictions de la régression 2 ? [3 points]
Avec les informations disponibles, on peut utiliser deux tests pour savoir si les trois restrictions
imposées dans la seconde régression (d’exclure mutuelle, âge et femme) sont acceptées par les
données. Le premier test est le test du ratio des vraisemblances et le second test à mettre est le test
F d’exclusion.

Le test du ratio des vraisemblances consistent à comparer la log-vraisemblance du modèle
non-contraint (log LU =  4597.09 ) à la vraisemblance du modèle contraint ( log LC =
 4610.77 ). [0.50 point]
La statistique de test du ratio des vraisemblances est :

LR  2  log LU  log LC   2   4597.09   4610.77 
 2  13.68
 27.36
[0.5 point]
Sous l’hypothèse nulle de la validité des trois restrictions (les paramètres de ces trois
variables sont nuls), cette statistique de test est distribuée selon une loi du Khi-deux à 3 degrés
de liberté (parce qu’il y a trois contraintes à tester) [1 point]. Les quantiles de cette
distribution pour un niveau de test de 5 % ou de 1% sont respectivement :

 02.95 3  5.991 et

 02.99 3  9.210

[0.5point]
La statistique de test étant largement supérieur au quantile à 99 %, on rejette l’hypothèse nulle
au niveau de test de 1 %. En conséquence, on a tort d’effectuer les restrictions d’exclusion de
ces trois variables. [0.5 point]

Alternativement, pour savoir si nous pouvons retenir la régression 2 en la comparant à la
régression 1, nous pouvons aussi utiliser le test F d’exclusion des variables mutuelle, âge et
femme. [0.5 point]
L’hypothèse nulle sera ici Ho :  2 = 0 ;  6 = 0 et  7 = 0 et l’hypothèse alternative est qu’au
moins un de ces paramètres est non nul. [0.5 point]
Le test F sera alors : F 

( R1  R2 ) J
 F J ; N  K1  [0.5 point]
(1  R1 ) N  K1

Ici avec R1 =0,2219 ; R2 = 0,2145 ; J = 3 ; N = 2873 et K1 = 7, on aura :
F

(0,2219  0,2145) 3
 9.085 [0.5 point]
(1  0,2219) 2873  7

On compare cette statistique de test à une loi F0.95 (3, 2866). Le quantile à 5% de la
distribution de Fisher est :

F0.95(3, 2866) = 2,605 [0.5 point]
Comme la statistique de test est largement supérieure à ce quantile, on rejette l’hypothèse de
nullité conjointe de ces trois paramètres. Il y a au moins un de ces paramètres qui est non nul
On ne peut pas omettre ces trois variables dans la régression donc nous ne pouvons pas
retenir la deuxième régression. [0.5 point]

1. Y-a-t-il une différence des paramètres estimés entre le modèle estimé
sur les personnes avec ou sans mutuelle (Régression 2A et 2B) ?
Effectuez un test global et des tests particuliers sur chaque
paramètre? [4 points]
a) Test global
Pour effectuer un test global de la différence des paramètres estimés entre ces deux sousgroupes, nous pouvons utiliser le test de Chow. Ce dernier compare les régressions 2A et 2B à
la régression 2. [0.5 point]
La statistique du test de Chow est :

Chow 

SCR2  SCR2 A  SCR2 B  K
SCR2 A  SCR2 B  N  2K 

Chow 

4167.038  1871.999  2256.820 4
1871.999  2256.820 2873  2  4



38.219 4
4128.819 2865

[0.5 point]

 6.63
La statistique de test de Chow est distribuée, sous l’hypothèse nulle d’égalité des paramètres
entre les groupes, selon une loi F de Fisher avec K = 4 degrés de liberté au numérateur, et N –
2K = 2865 degrés de liberté au dénominateur.
On trouve les quantiles dans les tables : F0.95 4 , 2865  2.372 pour un niveau de test de
5%. [0.5 point]
On conclut clairement au rejet de l’hypothèse nulle d’égalité des paramètres dans les trois
sous-échantillons parce que la statistique de test est supérieure à ce quantile de la loi F de
Fisher. Il y a des différences systématiques entre les 2 sous-échantillons. [0.5 point]

b) Tests particuliers sur chaque paramètre
Pour tester s’il y a une différence des paramètres estimés entre le modèle estimés sur les
personnes avec ou sans mutuelle, on peut aussi utiliser un test t de student sur chaque
paramètre. Ici, nous allons faire ce test que pour le paramètre de la variable indicatrice de
handicap.
La différence entre les paramètres estimés sera :

ˆ( 2a )  ˆ( 2b)  0.508  0.479  0.029
alors que la variance de cette différence sera (en tenant compte qu’il n’y a pas de covariance
du fait d’estimations séparées sur 2 sous-échantillons disjoints) :



    
 V ˆ  V ˆ 



V ˆ( 2 a )  ˆ( 2b )  V ˆ( 2 a )  V ˆ( 2b )  2Cov ˆ( 2 a ) , ˆ( 2b )
(2a)


[0.5 point]

( 2b )

 0.080  0.060  0.01
2

2

Dès lors le test t de significativité de cette différence sera :

t

ˆ( 2 a )  ˆ( 2b )



V ˆ( 2 a )  ˆ( 2b )





 0.029 0.029

 0.29
0.1
0.01

qui est clairement inférieur au quantile de la loi t de Student ( t0.0251153  N 0.0250,1  1.96 )
pour un niveau de test de 5 %. Donc l’effet de la variable « indicatrice de Handicap » n’est
pas significativement différent entre les 2 sous-périodes. [0.5 point]


Documents similaires


Fichier PDF seance 5
Fichier PDF statistiques sante communataire
Fichier PDF econometrie
Fichier PDF ch01 seance01
Fichier PDF ch01 section01
Fichier PDF ch01 section01


Sur le même sujet..