autodefense2015 .pdf



Nom original: autodefense2015.pdfTitre: Petit Guide d'Autodéfense StatistiqueAuteur: Jean-Baptiste Aubin, Colin Faverjon & Thibault Espinasse

Ce document au format PDF 1.4 a été généré par LaTeX with Beamer class version 3.24 / pdfTeX-1.40.14, et a été envoyé sur fichier-pdf.fr le 28/04/2015 à 11:14, depuis l'adresse IP 78.193.x.x. La présente page de téléchargement du fichier a été vue 495 fois.
Taille du document: 5 Mo (124 pages).
Confidentialité: fichier public


Aperçu du document


Petit Guide d'Autodéfense Statistique
Jean-Baptiste Aubin, Colin Faverjon & Thibault Espinasse

Institut Camille Jordan
27 4 2015

JB. Aubin & T. Espinasse (ICJ)

27 4 2015

1 / 57

Sur les présentateurs...

Jean-Baptiste Aubin
Enseignant-Chercheur à L'INSA de Lyon.
Thèmes de recherche : Statistique Nonparamétrique (outils qui restent
valides même quand on ignore -presque- tout des données)

JB. Aubin & T. Espinasse (ICJ)

27 4 2015

2 / 57

Sur les présentateurs...

Thibault Espinasse
Enseignant-Chercheur à l'Université Lyon 1
Thèmes de recherche : Statistique pour des graphes et réseaux

JB. Aubin & T. Espinasse (ICJ)

27 4 2015

3 / 57

Sur les présentateurs...

Colin Faverjon
Enseignant au Collège Jean Moulin, Aubervilliers
Thèmes de recherche : Pédagogie et théorie des nombres

JB. Aubin & T. Espinasse (ICJ)

27 4 2015

4 / 57

1 Introduction

2 Les Sondages

3 Biais d'interprétation

4 Indices

5 Conclusion

JB. Aubin & T. Espinasse (ICJ)

27 4 2015

5 / 57

Introduction
Notre société est dite numérique .

Sondages,
Indices (de popularité,
économiques, etc...),
Scores (électoraux, sportifs, etc...),
Capacités de nos appareils
électroniques,
Graphiques dans la presse, etc...

Nous sommes submergés quotidiennement par ces données chi rées.

JB. Aubin & T. Espinasse (ICJ)

27 4 2015

6 / 57

Les côtés positifs

Une donnée (un nombre) c'est
synthétique,
facile à interpréter car pas ambigu,
de compréhension rapide.

Bref, une donnée c'est

JB. Aubin & T. Espinasse (ICJ)

e cace.

27 4 2015

7 / 57

Les côtés positifs

Une donnée (un nombre) c'est
synthétique,
facile à interpréter car pas ambigu,
de compréhension rapide.

Bref, une donnée c'est

JB. Aubin & T. Espinasse (ICJ)

e cace.

27 4 2015

7 / 57

Les côtés négatifs
...oui mais par manque de temps/d'attention, on peut oublier de regarder le
contexte:

qui a publié l'information,
avec quelle méthodologie
(incertitude sur la donnée fournie,
domaine de validité, etc...),

On s'expose alors à des

manipulations).

JB. Aubin & T. Espinasse (ICJ)

erreurs d'interprétation (ou éventuellement à des

27 4 2015

8 / 57

Les côtés négatifs
...oui mais par manque de temps/d'attention, on peut oublier de regarder le
contexte:

qui a publié l'information,
avec quelle méthodologie
(incertitude sur la donnée fournie,
domaine de validité, etc...),

On s'expose alors à des

manipulations).

JB. Aubin & T. Espinasse (ICJ)

erreurs d'interprétation (ou éventuellement à des

27 4 2015

8 / 57

Introduction
La statistique est l'ensemble des méthodes qui ont pour objet
La collecte
Le traitement
L'interprétation
de données relatives à un groupe d'individus ou d'unités.
La statistique est une science utilisée dans presque tous les domaines de l'activité
humaine :
Sciences sociales
Économie
Biologie
Astronomie...
L'objet de cette conférence est de mettre en lumière les biais et erreurs courants
rencontrés dans des exemples de la vie publique.

JB. Aubin & T. Espinasse (ICJ)

27 4 2015

9 / 57

Introduction
La statistique est l'ensemble des méthodes qui ont pour objet
La collecte
Le traitement
L'interprétation
de données relatives à un groupe d'individus ou d'unités.
La statistique est une science utilisée dans presque tous les domaines de l'activité
humaine :
Sciences sociales
Économie
Biologie
Astronomie...
L'objet de cette conférence est de mettre en lumière les biais et erreurs courants
rencontrés dans des exemples de la vie publique.

JB. Aubin & T. Espinasse (ICJ)

27 4 2015

9 / 57

Introduction
La statistique est l'ensemble des méthodes qui ont pour objet
La collecte
Le traitement
L'interprétation
de données relatives à un groupe d'individus ou d'unités.
La statistique est une science utilisée dans presque tous les domaines de l'activité
humaine :
Sciences sociales
Économie
Biologie
Astronomie...
L'objet de cette conférence est de mettre en lumière les biais et erreurs courants
rencontrés dans des exemples de la vie publique.

JB. Aubin & T. Espinasse (ICJ)

27 4 2015

9 / 57

Deux visages

Macaulay :

Les chi res
disent toujours ce qu'un
homme qui sait les
manipuler veut leur faire
dire.
Disraeli : Il y a les
mensonges, les gros
mensonges, et les
statistiques.

JB. Aubin & T. Espinasse (ICJ)

H.G. Wells :

Le jugement
statistique sera un jour
aussi nécessaire à l'exercice
e cace des fonctions du
citoyen que la capacité de
lire et d'écrire.
S. Gasquet-More : La
virginité numérique ne peut
assurer une info digne d'une
démocratie authentique.

27 4 2015

10 / 57

Autodéfense ?
Interprétation, Utilisation


Qui →




Pourquoi








Comment




Comment

Sources ?



Analyse, Traitement


Qui →








Pourquoi





Données brutes ?



Collecte de données

JB. Aubin & T. Espinasse (ICJ)


Qui →




Pourquoi










Comment
27 4 2015

11 / 57

1 Introduction

2 Les Sondages

3 Biais d'interprétation

4 Indices

5 Conclusion

JB. Aubin & T. Espinasse (ICJ)

27 4 2015

12 / 57

1 Introduction

2 Les Sondages

3 Biais d'interprétation

4 Indices

5 Conclusion

JB. Aubin & T. Espinasse (ICJ)

27 4 2015

13 / 57

Sondages, méthodologie
Interprétation, Utilisation


Qui →





Pourquoi








Comment




Comment

Sources ?



Analyse, Traitement


Qui →








Pourquoi





Données brutes ?



Collecte de données

JB. Aubin & T. Espinasse (ICJ)


Qui →




Pourquoi










Comment
27 4 2015

14 / 57

Le mode d'échantillonnage

Il existe deux principaux modes d'échantillonnage :

1

la méthode
population,

2

la méthode

aléatoire:

on choisit un échantillon totalement au hasard dans la

par quotas:

on choisit un échantillon "représentatif" de la

population totale.

Remarque:

La précision du sondage ne dépend QUE de la taille de l'échantillon

sondé (et pas de la taille de la population totale !).

JB. Aubin & T. Espinasse (ICJ)

27 4 2015

15 / 57

Le mode d'échantillonnage

Il existe deux principaux modes d'échantillonnage :

1

la méthode
population,

2

la méthode

aléatoire:

on choisit un échantillon totalement au hasard dans la

par quotas:

on choisit un échantillon "représentatif" de la

population totale.

Remarque:

La précision du sondage ne dépend QUE de la taille de l'échantillon

sondé (et pas de la taille de la population totale !).

JB. Aubin & T. Espinasse (ICJ)

27 4 2015

15 / 57

Deux défauts de la méthode par quotas

1

l'imprécision obtenue avec la méthode par quotas est impossible à calculer!

2

choisir un échantillon "représentatif" de la population totale est impossible si
l'on n'a pas déjà sondé la population !

c'est peut-être pourquoi les statisticiens français ont longtemps penché pour la
méthode aléatoire...

JB. Aubin & T. Espinasse (ICJ)

27 4 2015

16 / 57

Deux défauts de la méthode par quotas

1

l'imprécision obtenue avec la méthode par quotas est impossible à calculer!

2

choisir un échantillon "représentatif" de la population totale est impossible si
l'on n'a pas déjà sondé la population !

c'est peut-être pourquoi les statisticiens français ont longtemps penché pour la
méthode aléatoire...

JB. Aubin & T. Espinasse (ICJ)

27 4 2015

16 / 57

Une victoire de la méthode par quotas

Élection présidentielle américaine de 1936
Sondage revue Literary Digest (10 millions de personnes) :
Roosevelt perdant
Institut Gallup ( échantillon représentatif bien moins conséquent) :
Roosevelt gagnant - 56%

Roosevelt a gagné avec 62% des voix.
Attention ! Il faut toujours préciser par rapport à quoi l'échantillon est
représentatif.

JB. Aubin & T. Espinasse (ICJ)

27 4 2015

17 / 57

Les limites de la méthodologie

Plaçons nous dans le cas d'un sondage idéal" créé par des professionnels intègres.

peu
de valeur prédictive (rien n'est plus di cile à prédire que le futur...)
le résultat du sondage est toujours sensible aux uctuations
d'échantillonnage et cette imprécision doit apparaître dans les résultats du
le sondage est une "photo" de la société à un temps donné et n'a que

sondage.
N.B.: une loi de juillet 1977 oblige chaque publiant de sondage à a cher la che
technique du sondage (méthode d'échantillonnage choisie, nombre de sondés,
représentativité, etc...)

JB. Aubin & T. Espinasse (ICJ)

27 4 2015

18 / 57

Les redressements
Il arrive (quasi-systématiquement en politique) que les sondages soient "redressés"
(i.e. on "sait" que les personnes se déclarent plus spontanément de gauche que du
FN par exemple -sinistrisme-).

Problème:

la façon de redresser est jalousement gardée secrète par les instituts

de sondage.



Impossible d'avoir accès aux données brutes!

Quelques biais supplémentaires possibles
Dans le monde réel,

sur-interpréter les
résultats (oubli de la fourchette d'imprécision due à la taille de l'échantillon,

Les commanditaires du sondage peuvent être tentés de
etc...)

JB. Aubin & T. Espinasse (ICJ)

27 4 2015

19 / 57

Les redressements
Il arrive (quasi-systématiquement en politique) que les sondages soient "redressés"
(i.e. on "sait" que les personnes se déclarent plus spontanément de gauche que du
FN par exemple -sinistrisme-).

Problème:

la façon de redresser est jalousement gardée secrète par les instituts

de sondage.



Impossible d'avoir accès aux données brutes!

Quelques biais supplémentaires possibles
Dans le monde réel,

sur-interpréter les
résultats (oubli de la fourchette d'imprécision due à la taille de l'échantillon,

Les commanditaires du sondage peuvent être tentés de
etc...)

JB. Aubin & T. Espinasse (ICJ)

27 4 2015

19 / 57

Les redressements
Il arrive (quasi-systématiquement en politique) que les sondages soient "redressés"
(i.e. on "sait" que les personnes se déclarent plus spontanément de gauche que du
FN par exemple -sinistrisme-).

Problème:

la façon de redresser est jalousement gardée secrète par les instituts

de sondage.



Impossible d'avoir accès aux données brutes!

Quelques biais supplémentaires possibles
Dans le monde réel,

sur-interpréter les
résultats (oubli de la fourchette d'imprécision due à la taille de l'échantillon,

Les commanditaires du sondage peuvent être tentés de
etc...)

JB. Aubin & T. Espinasse (ICJ)

27 4 2015

19 / 57

Les redressements
Il arrive (quasi-systématiquement en politique) que les sondages soient "redressés"
(i.e. on "sait" que les personnes se déclarent plus spontanément de gauche que du
FN par exemple -sinistrisme-).

Problème:

la façon de redresser est jalousement gardée secrète par les instituts

de sondage.



Impossible d'avoir accès aux données brutes!

Quelques biais supplémentaires possibles
Dans le monde réel,

sur-interpréter les
résultats (oubli de la fourchette d'imprécision due à la taille de l'échantillon,

Les commanditaires du sondage peuvent être tentés de
etc...)

JB. Aubin & T. Espinasse (ICJ)

27 4 2015

19 / 57

Exemple du sondage IPSOS du 26 mars 2005

Publié par le Figaro, il portait sur le traité Européen devant être voté en mai 2005.
La che technique nous apprend que
944 personnes ont accepté de répondre (biais possible)
48% d'entre elles sont sures d'aller voter (restent 453 presonnes)
31% de ces dernières n'ont pas exprimé d'intention de vote (abstention?)
(restent 313 personnes)
21% de celles-ci peuvent encore changer d'avis (restent 222 votants décidés)
Même sur 313 personnes, la marge d'imprécision est de +/- 7, 5% alors que le
NON était donné vainqueur avec 54%.

Conclusion?

JB. Aubin & T. Espinasse (ICJ)

27 4 2015

20 / 57

Sondages, objectivité
Interprétation, Utilisation


Qui →




Pourquoi








Comment

Sources ?



Analyse, Traitement


Qui →








Pourquoi








Comment

Données brutes ?



Collecte de données

JB. Aubin & T. Espinasse (ICJ)


Qui →




Pourquoi










Comment
27 4 2015

21 / 57

Deux sondages contradictoires
En Mars 2011, deux sondages sont parus sur l'opinion de la population française à
l'égard du Nucléaire

JB. Aubin & T. Espinasse (ICJ)

27 4 2015

22 / 57

Deux sondages contradictoires
En Mars 2011, deux sondages sont parus sur l'opinion de la population française à
l'égard du Nucléaire

JB. Aubin & T. Espinasse (ICJ)

27 4 2015

22 / 57

Deux sondages contradictoires
En Mars 2011, deux sondages sont parus sur l'opinion de la population française à
l'égard du Nucléaire
Le premier, commandé par EDF

Quelle est votre opinion à l'égard de la demande des écologistes
d'abandonner la production d'éléctricité nucléaire en France ?
Le second, commandé par EELV

Souhaitez-vous que la France...
Poursuive son programme nucléaire et construise de nouvelles
centrales ?
Arrête progressivement sur 25 ou 30 ans son programme nucléaire
et de faire fonctionner ses centrales ?
Arrête rapidement son programme nucléaire et de faire fonctionner
ses centrales ?

JB. Aubin & T. Espinasse (ICJ)

27 4 2015

22 / 57

De notre côté...
Question 1
Hitler a dit :

Je suis un ami des bêtes et j'aime particulièrement les chiens.

Pensez-vous que la grandeur d'un homme peut être jugée à la façon dont il traite
les animaux ?

Question 2
Gandhi a dit :

On peut juger la grandeur d'une nation par la façon dont les animaux y
sont traités.

Pensez-vous que la grandeur d'un homme peut être jugée à la façon dont il traite
les animaux ?

JB. Aubin & T. Espinasse (ICJ)

27 4 2015

23 / 57

Auto-défense

1

Qui a payé ?

2

L'étude porte-t-elle sur plus de 1000 personnes ?

3

Quelle est la question posée ?

4

Les résultats publiés tiennent-ils compte de la fourchette d'imprécision ?

JB. Aubin & T. Espinasse (ICJ)

27 4 2015

24 / 57

1 Introduction

2 Les Sondages

3 Biais d'interprétation

4 Indices

5 Conclusion

JB. Aubin & T. Espinasse (ICJ)

27 4 2015

25 / 57

Biais de con rmation
Interprétation, Utilisation


Qui →




Pourquoi








Comment




Comment

Sources ?



Analyse, Traitement


Qui →








Pourquoi





Données brutes ?



Collecte de données

JB. Aubin & T. Espinasse (ICJ)


Qui →




Pourquoi










Comment
27 4 2015

26 / 57

Biais de con rmation
On collecte les données dans le but de con rmer une hypothèse.

JB. Aubin & T. Espinasse (ICJ)

27 4 2015

27 / 57

Biais de con rmation
On collecte les données dans le but de con rmer une hypothèse.

JB. Aubin & T. Espinasse (ICJ)

27 4 2015

27 / 57

Biais de con rmation
On collecte les données dans le but de con rmer une hypothèse.

JB. Aubin & T. Espinasse (ICJ)

27 4 2015

27 / 57

Biais de con rmation
On collecte les données dans le but de con rmer une hypothèse.

JB. Aubin & T. Espinasse (ICJ)

27 4 2015

27 / 57

Biais de con rmation
On collecte les données dans le but de con rmer une hypothèse.

JB. Aubin & T. Espinasse (ICJ)

27 4 2015

27 / 57

Biais de con rmation
On collecte les données dans le but de con rmer une hypothèse.
Et de notre côté...

JB. Aubin & T. Espinasse (ICJ)

27 4 2015

27 / 57

Représentation des données
Interprétation, Utilisation


Qui →




Pourquoi








Comment




Comment

Sources ?



Analyse, Traitement


Qui →








Pourquoi





Données brutes ?



Collecte de données

JB. Aubin & T. Espinasse (ICJ)


Qui →




Pourquoi










Comment
27 4 2015

28 / 57

E ets marketing
Jouer sur les e ets de 3D.

(a)

Diagramme circulaire présenté par

Steve Jobs

JB. Aubin & T. Espinasse (ICJ)

(b)

Même données,

autre point de vue

27 4 2015

29 / 57

Coût du travail
Dans une note analytique de Informal European Council du 12 février 2015
signée par

Jean-Claude Juncker, le président de la comission européenne :

JB. Aubin & T. Espinasse (ICJ)

27 4 2015

30 / 57

Coût du travail
Dans une note analytique de Informal European Council du 12 février 2015
signée par

Jean-Claude Juncker, le président de la comission européenne :

Le coût du travail est trop élevé
The cost of labour (measured in unit labour costs) grew signi cantly in a
number of euro area countries, making their products more expensive, thereby
reducing their competitiveness

JB. Aubin & T. Espinasse (ICJ)

27 4 2015

30 / 57

Coût du travail
Dans une note analytique de Informal European Council du 12 février 2015
signée par

Jean-Claude Juncker, le président de la comission européenne :

Ou pas...

JB. Aubin & T. Espinasse (ICJ)

27 4 2015

30 / 57

Les tests
Interprétation, Utilisation


Qui →




Pourquoi








Comment

Sources ?



Analyse, Traitement


Qui →








Pourquoi








Comment

Données brutes ?



Collecte de données

JB. Aubin & T. Espinasse (ICJ)


Qui →




Pourquoi










Comment
27 4 2015

31 / 57

Les tests
Question
Peut-on a rmer de façon signi cative qu'une pièce est truquée ?

JB. Aubin & T. Espinasse (ICJ)

27 4 2015

32 / 57


Aperçu du document autodefense2015.pdf - page 1/124
 
autodefense2015.pdf - page 2/124
autodefense2015.pdf - page 3/124
autodefense2015.pdf - page 4/124
autodefense2015.pdf - page 5/124
autodefense2015.pdf - page 6/124
 




Télécharger le fichier (PDF)


autodefense2015.pdf (PDF, 5 Mo)

Télécharger
Formats alternatifs: ZIP



Documents similaires


autodefense2015
l2s3 stats
barometre politique sigma conseil mode de compatibilite
estimation statistique
le marche des outils technologiques de seconde main au cameroun
sondage d opinion

Sur le même sujet..