Comment éviter les sept péchés capitaux de la mauvaise interprétation statistique

Les statistiques sont un outil utile pour comprendre les tendances dans le monde qui nous entoure. Mais notre intuition nous laisse souvent tomber quand il s'agit d'interpréter ces modèles. Dans cette série, nous examinons certaines des erreurs courantes que nous commettons et comment les éviter en pensant aux statistiques, aux probabilités et aux risques.The Conversation

1. En supposant que les petites différences sont significatives

Beaucoup de fluctuations quotidiennes dans le marché boursier représentent le hasard plutôt que quelque chose de significatif. Les différences dans les sondages lorsqu'une partie est en avance d'un point ou deux ne sont souvent que des bruits statistiques.

Vous pouvez éviter de tirer des conclusions erronées sur les causes de ces fluctuations en exigeant de voir la «marge d'erreur» relative aux chiffres.

Si la différence est plus petite que la marge d'erreur, il n'y a probablement pas de différence significative, et la variation dépend probablement des fluctuations aléatoires.

Comment éviter les sept péchés capitaux de la mauvaise interprétation statistiqueLes barres d'erreur illustrent le degré d'incertitude d'un score. Lorsque ces marges d'erreur se chevauchent, la différence est probablement due au bruit statistique.


graphique d'abonnement intérieur



2. Equation de la signification statistique avec la signification du monde réel

Nous entendons souvent des généralisations sur la façon dont deux groupes diffèrent d'une manière ou d'une autre, comme le fait que les femmes sont plus nourrissantes alors que les hommes sont physiquement plus forts.

Ces différences s'inspirent souvent des stéréotypes et de la sagesse populaire, mais ignorent souvent les similitudes entre les personnes des deux groupes et la variation des personnes au sein des groupes.

Si vous choisissez deux hommes au hasard, il y a probablement beaucoup de différence dans leur force physique. Et si vous choisissez un homme et une femme, ils peuvent devenir très semblables en termes de soins, ou l'homme peut être plus nourrissant que la femme.

Vous pouvez éviter cette erreur en demandant la "taille de l'effet" des différences entre les groupes. C'est une mesure de combien la moyenne d'un groupe diffère de la moyenne d'un autre.

Si la taille de l'effet est petite, les deux groupes sont très similaires. Même si la taille de l'effet est grande, les deux groupes auront probablement beaucoup de variation en leur sein, de sorte que tous les membres d'un groupe ne seront pas différents de tous les membres d'un autre groupe.


3. Négliger de regarder les extrêmes

Le revers de la taille de l'effet est pertinent lorsque la chose sur laquelle vous vous concentrez suit "distribution normale"(Parfois appelé" courbe en cloche "). C'est là que la plupart des gens sont près du score moyen et seulement un petit groupe est bien au-dessus ou bien en dessous de la moyenne.

Quand cela se produit, un petit changement de performance pour le groupe produit une différence qui ne signifie rien pour la personne moyenne (voir le point 2) mais qui change plus radicalement le caractère des extrêmes.

Évitez cette erreur en réfléchissant si vous avez affaire à des extrêmes ou non. Lorsque vous traitez avec des gens ordinaires, les différences entre les petits groupes n'ont souvent aucune importance. Lorsque vous vous souciez beaucoup des extrêmes, les différences entre petits groupes peuvent avoir une importance considérable.

Comment éviter les sept péchés capitaux de la mauvaise interprétation statistiqueLorsque deux populations suivent une distribution normale, les différences entre elles seront plus apparentes aux extrêmes qu'aux moyennes.


4. Confiance coïncidence

Saviez-vous qu'il y a un corrélation entre le nombre de personnes qui se sont noyées chaque année aux États-Unis en tombant dans une piscine et le nombre de films dans lesquels Nicholas Cage est apparu?

Comment éviter les sept péchés capitaux de la mauvaise interprétation statistiqueMais y a-t-il un lien de causalité? tylervigen.com

Si vous regardez assez fort, vous pouvez trouver des modèles intéressants et des corrélations qui sont simplement dues à une coïncidence.

Juste parce que deux choses arrivent à changer en même temps, ou dans des modèles similaires, ne signifie pas qu'elles sont liées.

Évitez cette erreur en demandant à quel point l'association observée est fiable. Est-ce un cas unique, ou est-ce arrivé plusieurs fois? Peut-on prédire les associations futures? Si vous ne l'avez vu qu'une seule fois, il est probable que cela soit dû à une chance aléatoire.


5. Obtenir la causalité à l'envers

Quand deux choses sont corrélées - par exemple, le chômage et les problèmes de santé mentale - il pourrait être tentant de voir une voie causale «évidente» - dire que les problèmes de santé mentale mènent au chômage.

Mais parfois, la voie causale va dans l'autre sens, comme le chômage qui cause des problèmes de santé mentale.

Vous pouvez éviter cette erreur en vous rappelant de penser à la causalité inverse lorsque vous voyez une association. L'influence pourrait-elle aller dans l'autre direction? Ou pourrait-il aller dans les deux sens, créant une boucle de rétroaction?


6. Oublier de considérer les causes extérieures

Les gens échouent souvent à évaluer des «facteurs tiers» possibles, ou des causes extérieures, qui peuvent créer une association entre deux choses parce que les deux sont en fait des résultats du troisième facteur.

Par exemple, il pourrait y avoir une association entre manger au restaurant et améliorer la santé cardiovasculaire. Cela pourrait vous amener à croire qu'il existe un lien de causalité entre les deux.

Cependant, il se pourrait que ceux qui peuvent se permettre de manger régulièrement dans les restaurants soient dans une catégorie socioéconomique élevée et puissent également se permettre de meilleurs soins de santé, et que les soins de santé améliorent la santé cardiovasculaire.

Vous pouvez éviter cette erreur en vous rappelant de penser à des facteurs tiers lorsque vous voyez une corrélation. Si vous suivez une chose comme une cause possible, demandez-vous ce qui, à son tour, provoque cette chose? Ce troisième facteur pourrait-il entraîner les deux résultats observés?


7. Graphiques trompeurs

Il y a beaucoup de méfaits dans la mise à l'échelle et l'étiquetage de l'axe vertical sur les graphiques. Les étiquettes doivent montrer toute la gamme significative de ce que vous regardez.

Mais parfois, le graphiste choisit une gamme plus étroite pour faire une petite différence ou une association plus percutante. Sur une échelle de 0 à 100, deux colonnes peuvent avoir la même hauteur. Mais si vous tracez les mêmes données que 52.5 à 56.5, elles peuvent être radicalement différentes.

Vous pouvez éviter cette erreur en prenant soin de noter les étiquettes du graphique le long des axes. Soyez particulièrement sceptique à l'égard des graphiques non étiquetés.

Comment éviter les sept péchés capitaux de la mauvaise interprétation statistiqueLes graphiques peuvent raconter une histoire - les différences apparaissent plus ou moins grandes selon l'échelle.

A propos de l'auteur

Winnifred Louis, professeur agrégé, psychologie sociale, L'Université du Queensland et Cassandra Chapman, candidate au doctorat en psychologie sociale, L'Université du Queensland

Cet article a été publié initialement le The Conversation. Lis le article original.

Livres connexes:

at Marché InnerSelf et Amazon