Qu'est-ce que l'intervalle de confiance?
Un intervalle de confiance, dans les statistiques, fait référence à la probabilité qu'un paramètre de population tombe entre deux valeurs définies pendant une certaine proportion de temps. Les intervalles de confiance mesurent le degré d'incertitude ou de certitude dans une méthode d'échantillonnage. Un intervalle de confiance peut prendre n'importe quel nombre de probabilités, la plus courante étant un niveau de confiance de 95% ou 99%.
L' intervalle de confiance et le niveau de confiance sont interdépendants mais ne sont pas exactement les mêmes.
Comprendre l'intervalle de confiance
Les statisticiens utilisent des intervalles de confiance pour mesurer l'incertitude. Par exemple, un chercheur sélectionne différents échantillons au hasard dans la même population et calcule un intervalle de confiance pour chaque échantillon. Les jeux de données résultants sont tous différents; certains intervalles incluent le vrai paramètre de population et d'autres non.
Un intervalle de confiance est une plage de valeurs qui contiendrait probablement un paramètre de population inconnu. Le niveau de confiance fait référence au pourcentage de probabilité, ou de certitude, que l'intervalle de confiance contiendrait le véritable paramètre de population lorsque vous tirez plusieurs fois un échantillon aléatoire. Ou, dans la langue vernaculaire, "Nous sommes sûrs à 99% ( niveau de confiance) que la plupart de ces ensembles de données (intervalles de confiance) contiennent le véritable paramètre de population."
Points clés à retenir
- Un intervalle de confiance calcule la probabilité qu'un paramètre de population se situe entre deux valeurs définies.Les intervalles de confiance mesurent le degré d'incertitude ou de certitude dans une méthode d'échantillonnage.Le plus souvent, les intervalles de confiance reflètent des niveaux de confiance de 95% ou 99%.
Calcul d'un intervalle de confiance
Supposons qu'un groupe de chercheurs étudie les hauteurs des basketteurs du secondaire. Les chercheurs prennent un échantillon aléatoire de la population et établissent une hauteur moyenne de 74 pouces. La moyenne de 74 pouces est une estimation ponctuelle de la moyenne de la population. Une estimation ponctuelle en soi est d'une utilité limitée car elle ne révèle pas l'incertitude associée à l'estimation; vous ne savez pas à quelle distance cet échantillon moyen de 74 pouces pourrait être éloigné de la moyenne de la population. Ce qui manque, c'est le degré d'incertitude dans cet échantillon unique.
Les intervalles de confiance fournissent plus d'informations que les estimations ponctuelles. En établissant un intervalle de confiance à 95% en utilisant la moyenne et l'écart-type de l'échantillon et en supposant une distribution normale représentée par la courbe en cloche, les chercheurs arrivent à une limite supérieure et inférieure qui contient la vraie moyenne à 95% du temps. Supposons que l'intervalle soit compris entre 72 pouces et 76 pouces. Si les chercheurs prennent 100 échantillons aléatoires de la population de joueurs de basket-ball du secondaire dans son ensemble, la moyenne devrait se situer entre 72 et 76 pouces dans 95 de ces échantillons.
Si les chercheurs veulent une confiance encore plus grande, ils peuvent étendre l'intervalle à une confiance de 99%. Cela crée invariablement une gamme plus large, car elle laisse de la place à un plus grand nombre de moyens d'échantillonnage. S'ils établissent l'intervalle de confiance à 99% comme étant compris entre 70 pouces et 78 pouces, ils peuvent s'attendre à ce que 99 des 100 échantillons évalués contiennent une valeur moyenne entre ces nombres. Un niveau de confiance de 90% signifie que nous nous attendrions à ce que 90% des estimations d'intervalle incluent le paramètre de la population. De même, un niveau de confiance de 99% signifie que 95% des intervalles incluraient le paramètre.
Idées fausses courantes sur l'intervalle de confiance
La plus grande idée fausse concernant les intervalles de confiance est qu'ils représentent le pourcentage de données d'un échantillon donné qui se situe entre les limites supérieure et inférieure. Par exemple, on pourrait interpréter à tort l'intervalle de confiance de 99% susmentionné de 70 à 78 pouces comme indiquant que 99% des données d'un échantillon aléatoire se situent entre ces chiffres. Ceci est incorrect, bien qu'il existe une méthode d'analyse statistique distincte pour effectuer une telle détermination. Pour ce faire, il faut identifier la moyenne et l'écart type de l'échantillon et tracer ces chiffres sur une courbe en cloche.
