Qu'est-ce que la négligence de la taille de l'échantillon?
La négligence de la taille de l'échantillon est un biais cognitif célèbre étudié par Amos Tversky et Daniel Kahneman. Cela se produit lorsque les utilisateurs d'informations statistiques tirent de fausses conclusions en ne tenant pas compte de la taille de l'échantillon des données en question.
La cause sous-jacente de la négligence de la taille de l'échantillon est que les gens ne comprennent souvent pas que des niveaux élevés de variance sont plus susceptibles de se produire dans de petits échantillons. Par conséquent, il est essentiel de déterminer si la taille de l'échantillon utilisé pour produire une statistique donnée est suffisamment grande pour permettre des conclusions significatives.
Savoir quand une taille d'échantillon est suffisamment grande peut être difficile pour ceux qui n'ont pas une bonne compréhension des méthodes statistiques.
Points clés à retenir
- La négligence de la taille de l'échantillon est un biais cognitif étudié par Amos Tversky et Daniel Kahneman qui consiste à tirer de fausses conclusions à partir d'informations statistiques, car ils n'ont pas pris en compte les effets de la taille de l'échantillon.Ceux qui souhaitent réduire le risque de négligence de la taille de l'échantillon doivent se rappeler que la taille des échantillons est associée à des résultats statistiques plus volatils et vice-versa.
Comprendre la négligence de la taille de l'échantillon
Lorsqu'une taille d'échantillon est trop petite, des conclusions précises et fiables ne peuvent pas être tirées. Dans le contexte de la finance, cela peut induire les investisseurs en erreur de diverses manières.
Par exemple, un investisseur pourrait voir un pour un nouveau fonds d'investissement, se vantant d'avoir généré des rendements annualisés de 15% depuis sa création. L'investisseur pourrait être rapide à inclure que ce fonds est leur billet pour la génération rapide de richesse. Cependant, cette conclusion pourrait être dangereusement erronée si le fonds n'investit pas depuis très longtemps. Dans ce cas, les résultats pourraient être dus à des anomalies à court terme et ont peu à voir avec la méthodologie d'investissement réelle du fonds.
La négligence de la taille de l'échantillon est souvent confondue avec la négligence du taux de base, qui est un biais cognitif distinct. Alors que la négligence de la taille de l'échantillon fait référence à l'omission de tenir compte du rôle des tailles d'échantillon dans la détermination de la fiabilité des allégations statistiques, la négligence du taux de base se rapporte à la tendance des gens à négliger les connaissances existantes sur un phénomène lors de l'évaluation de nouvelles informations.
Exemple réel de négligence de la taille de l'échantillon
Pour mieux comprendre la négligence de la taille de l'échantillon, considérons l'exemple suivant, qui est tiré des recherches d'Amos Tversky et Daniel Kahneman:
Une personne est invitée à tirer d'un échantillon de cinq balles et constate que quatre sont rouges et une verte.
Une personne tire un échantillon de 20 balles et constate que 12 sont rouges et huit sont vertes.
Quel échantillon fournit une meilleure preuve que les boules sont principalement rouges?
La plupart des gens disent que le premier échantillon, plus petit, fournit des preuves beaucoup plus solides parce que le rapport du rouge au vert est beaucoup plus élevé que l'échantillon plus grand. Cependant, en réalité, le rapport plus élevé est contrebalancé par la plus petite taille de l'échantillon. L'échantillon de 20 fournit en fait des preuves beaucoup plus solides.
Un autre exemple d'Amos Tversky et Daniel Kahneman est le suivant:
Une ville est desservie par deux hôpitaux. Dans le plus grand hôpital, 45 bébés naissent en moyenne chaque jour et dans le plus petit hôpital, 15 bébés naissent chaque jour. Bien que 50% de tous les bébés soient des garçons, le pourcentage exact varie de jour en jour.
Pendant un an, chaque hôpital a enregistré les jours où plus de 60% des bébés se trouvaient être des garçons. Quel hôpital a enregistré plus de ces jours?
Lorsqu'on leur a posé cette question, 22% des répondants ont déclaré que le plus grand hôpital ferait rapport plus de ces jours, tandis que 56% ont déclaré que les résultats seraient les mêmes pour les deux hôpitaux. En fait, la bonne réponse est que le plus petit hôpital enregistrerait davantage de tels jours, car sa taille plus petite produirait une plus grande variabilité.
Comme nous l'avons noté plus tôt, la racine de la négligence de la taille de l'échantillon est que les gens ne comprennent souvent pas que des niveaux élevés de variance sont plus susceptibles de se produire dans de petits échantillons. En investissant, cela peut être très coûteux en effet.
