Qu'est-ce qu'un quartile?
Un quartile est un terme statistique décrivant une division des observations en quatre intervalles définis en fonction des valeurs des données et de leur comparaison avec l'ensemble des observations.
Comprendre les quartiles
Pour comprendre le quartile, il est important de comprendre la médiane comme mesure de la tendance centrale. La médiane des statistiques est la valeur moyenne d'un ensemble de nombres. Il s'agit du point auquel exactement la moitié des données se situe en dessous et au-dessus de la valeur centrale.
Donc, étant donné un ensemble de 13 nombres, la médiane serait le septième nombre. Les six nombres précédant cette valeur sont les nombres les plus bas dans les données, et les six nombres après la médiane sont les nombres les plus élevés dans l'ensemble de données donné. Parce que la médiane n'est pas affectée par des valeurs extrêmes ou des valeurs aberrantes dans la distribution, elle est parfois préférée à la moyenne.
La médiane est un estimateur robuste de la localisation, mais ne dit rien sur la façon dont les données de chaque côté de leur valeur sont réparties ou dispersées. C'est là qu'intervient le quartile. Le quartile mesure la dispersion des valeurs au-dessus et au-dessous de la moyenne en divisant la distribution en quatre groupes.
Points clés à retenir
- Le quartile mesure la dispersion des valeurs au-dessus et au-dessous de la moyenne en divisant la distribution en quatre groupes. Un quartile divise les données en trois points - un quartile inférieur, une médiane et un quartile supérieur - pour former quatre groupes de l'ensemble de données. pour calculer la plage interquartile, qui est une mesure de la variabilité autour de la médiane.
Comment fonctionnent les Quartiles
Tout comme la médiane divise les données en deux afin que 50% de la mesure se situe en dessous de la médiane et 50% au-dessus, le quartile décompose les données en trimestres de sorte que 25% de la mesure soit inférieure au quartile inférieur, 50 % sont inférieurs à la moyenne et 75% sont inférieurs au quartile supérieur.
Un quartile divise les données en trois points - un quartile inférieur, une médiane et un quartile supérieur - pour former quatre groupes de l'ensemble de données. Le quartile inférieur ou le premier quartile est désigné par Q1 et est le nombre du milieu qui se situe entre la plus petite valeur de l'ensemble de données et la médiane. Le deuxième quartile, Q2, est également la médiane. Le quartile supérieur ou troisième, noté Q3, est le point central qui se situe entre la médiane et le nombre le plus élevé de la distribution.
Maintenant, nous pouvons cartographier les quatre groupes formés à partir des quartiles. Le premier groupe de valeurs contient le plus petit nombre jusqu'à Q1; le deuxième groupe comprend Q1 à la médiane; le troisième ensemble est la médiane de Q3; la quatrième catégorie comprend Q3 jusqu'au point de données le plus élevé de l'ensemble complet.
Chaque quartile contient 25% du total des observations. Généralement, les données sont organisées du plus petit au plus grand:
- Premier quartile: 25% des nombres les plus bas Second quartile: entre 25, 1% et 50% (jusqu'à la médiane) Troisième quartile: 51% à 75% (au-dessus de la médiane) Quatrième quartile: les 25% les plus élevés des nombres
Exemple de quartile
Travaillons avec un exemple. Supposons que la distribution des scores en mathématiques dans une classe de 19 élèves par ordre croissant soit:
59, 60, 65, 65, 68, 69, 70, 72, 75, 75, 76, 77, 81, 82, 84, 87, 90, 95, 98
Tout d'abord, notez la médiane, Q2, qui dans ce cas est la dixième valeur: 75.
Q1 est le point central entre le plus petit score et la médiane. Dans ce cas, Q1 se situe entre le premier et le cinquième score: 68..
Q3 est la valeur moyenne entre Q2 et le score le plus élevé: 84..
Maintenant que nous avons nos quartiles, interprétons leurs nombres. Un score de 68 (T1) représente le premier quartile et le 25 e centile. 68 est la médiane de la moitié inférieure du score défini dans les données disponibles, c'est-à-dire la médiane des scores de 59 à 75.
Le T1 nous indique que 25% des scores sont inférieurs à 68 et 75% des scores des classes sont supérieurs. Q2 (la médiane) est le 50 e centile et montre que 50% des scores sont inférieurs à 75, et 50% des scores sont supérieurs à 75. Enfin, Q3, le 75 e percentile, révèle que 25% des scores sont supérieur et 75% sont inférieurs à 84.
Considérations particulières
Si le point de données pour Q1 est plus éloigné de la médiane que Q3 de la médiane, alors nous pouvons dire qu'il y a une plus grande dispersion parmi les plus petites valeurs de l'ensemble de données que parmi les plus grandes valeurs. La même logique s'applique si Q3 est plus éloigné de Q2 que Q1 de la médiane.
Alternativement, s'il y a un nombre pair de points de données, la médiane sera la moyenne des deux nombres du milieu. Dans notre exemple ci-dessus, si nous avions 20 élèves au lieu de 19, la médiane de leurs scores sera la moyenne arithmétique des dixième et onzième nombres.
Les quartiles sont utilisés pour calculer la plage interquartile, qui est une mesure de la variabilité autour de la médiane. L'intervalle interquartile est simplement calculé comme la différence entre le premier et le troisième quartile: Q3 - Q1. En effet, c'est la plage de la moitié médiane des données qui montre la répartition des données.
Pour les grands ensembles de données, Microsoft Excel dispose d'une fonction QUARTILE pour calculer les quartiles.
