Quelle est la moyenne Winsored?
La moyenne winsorisée est une méthode de moyenne qui remplace initialement les valeurs les plus petites et les plus grandes par les observations les plus proches. Ceci est fait pour limiter l'effet des valeurs extrêmes anormales, ou valeurs aberrantes, sur le calcul. Après avoir remplacé les valeurs, la formule de moyenne arithmétique est ensuite utilisée pour calculer la moyenne victorisée.
La formule de la moyenne Winsored est
La Moyenne gagnée = Nxn… xn + 1 + xn + 2… xn où: n = Le nombre de points de données les plus grands et les plus petits à remplacer par l'observation
Les moyennes gagnées sont exprimées de deux manières. Une moyenne winsorisée «k n » fait référence au remplacement des «k» observations les plus petites et les plus grandes, où «k» est un entier. Une moyenne winorisée "X%" implique le remplacement d'un pourcentage donné de valeurs des deux extrémités des données.
Comment calculer la moyenne gagnée
La moyenne gagnée est calculée en remplaçant les points de données les plus petits et les plus grands, puis en additionnant tous les points de données et en divisant la somme par le nombre total de points de données.
Que vous dit le Winsored?
La moyenne victorisée est moins sensible aux valeurs aberrantes car elle peut les remplacer par des valeurs moins extrêmes. Autrement dit, il est moins sensible aux contours par rapport à la moyenne. Cependant, si une distribution a des queues grasses, l'effet de la suppression des valeurs les plus élevées et les plus basses de la distribution aura peu d'influence en raison du nombre élevé de variabilité dans les chiffres de la distribution.
Points clés à retenir
- Une méthode de moyenne qui comprend le remplacement des valeurs les plus petites et les plus grandes par les observations les plus proches. Moins sensible aux valeurs aberrantes car elle peut les remplacer par des valeurs moins extrêmes. Contrairement à la moyenne ajustée, qui implique la suppression des points de données, bien que le résultat des deux ont tendance à être proches.
Exemple d'utilisation de la moyenne Winsored
On peut calculer la moyenne victorisée pour l'ensemble de données suivant: 1, 5, 7, 8, 9, 10, 14. Dans cet exemple, nous supposons que la moyenne victorisée est dans le premier ordre, nous remplaçons les valeurs les plus petites et les plus grandes par leur observations les plus proches.
L'ensemble de données apparaît maintenant comme suit: 5, 5, 7, 8, 9, 10, 10. La prise d'une moyenne arithmétique du nouvel ensemble produit une moyenne victorieuse de 7, 7, ou (5 + 5 + 7 + 8 + 9 + 10 + 10) divisé par 7.
Ou considérez une moyenne gagnée de 20% qui prend les 10% supérieurs et les 10% inférieurs et les remplace par leur prochaine valeur la plus proche. Nous allons winoriser l'ensemble de données suivant: 2, 4, 7, 8, 11, 14, 18, 23, 23, 27, 35, 40, 49, 50, 55, 60, 61, 61, 62, 75. Les deux les points de données les plus petits et les plus grands, ou 10%, seront remplacés par leur prochaine valeur la plus proche. Ainsi, le nouvel ensemble de données est: 7, 7, 7, 8, 11, 14, 18, 23, 23, 27, 35, 40, 49, 50, 55, 60, 61, 61, 61, 61. Le winsored la moyenne est de 33, 9, soit le total des données (678) divisé par le nombre total de points de données (20).
La différence entre la moyenne winsorisée et la moyenne ajustée
La moyenne gagnée comprend la modification des points de données, tandis que la moyenne ajustée implique la suppression des points de données. Il est courant que la moyenne victorisée et la moyenne ajustée soient proches.
Limites de l'utilisation de la moyenne Winsored
Un inconvénient majeur pour les moyens gagnés est qu'ils introduisent un biais dans l'ensemble de données. Certes, l'ensemble de données est idéalement moins biaisé après la modification que si des valeurs aberrantes étaient laissées.
En savoir plus sur Winsored Mean
Pour des informations connexes, sur les différences entre les calculs de moyennes clés.
