Quels sont les degrés de liberté?
Degrés de liberté fait référence au nombre maximal de valeurs logiquement indépendantes, qui sont des valeurs qui ont la liberté de varier, dans l'échantillon de données.
Points clés à retenir
- Degrés de liberté fait référence au nombre maximal de valeurs logiquement indépendantes, qui sont des valeurs qui ont la liberté de varier, dans l'échantillon de données. Le calcul des degrés de liberté est essentiel lorsque vous essayez de comprendre l'importance d'une statistique du chi carré et la validité de l'hypothèse nulle.
Comprendre les degrés de liberté
La façon la plus simple de comprendre conceptuellement les degrés de liberté est par un exemple:
- Considérons un échantillon de données composé, par souci de simplicité, de cinq nombres entiers positifs. Les valeurs peuvent être n'importe quel nombre sans relation connue entre elles. Cet échantillon de données aurait, en théorie, cinq degrés de liberté. Quatre des nombres de l'échantillon sont {3, 8, 5 et 4} et la moyenne de l'ensemble de l'échantillon de données se révèle être de 6, ce qui signifie que le le cinquième nombre doit être 10. Il ne peut en être autrement. Il n'a pas la liberté de varier. Le degré de liberté de cet échantillon de données est donc de 4.
La formule pour les degrés de liberté est égale à la taille de l'échantillon de données moins un:
La Df = N − 1 où: Df = degrés de liberté N = taille de l'échantillon
Les degrés de liberté sont couramment discutés en relation avec diverses formes de tests d'hypothèses en statistiques, comme le chi carré. Il est essentiel de calculer les degrés de liberté en essayant de comprendre l'importance d'une statistique du chi carré et la validité de l'hypothèse nulle.
Tests du chi carré
Il existe deux types différents de tests du chi carré: le test d'indépendance, qui pose une question de relation, telle que: "Existe-t-il une relation entre le sexe et les scores SAT?"; et le test d'adéquation, qui demande quelque chose comme "Si une pièce est lancée 100 fois, est-ce qu'elle reviendra 50 fois face et 50 fois?"
Pour ces tests, des degrés de liberté sont utilisés pour déterminer si une certaine hypothèse nulle peut être rejetée sur la base du nombre total de variables et d'échantillons dans l'expérience. Par exemple, lorsque l'on considère les étudiants et le choix des cours, un échantillon de 30 ou 40 étudiants n'est probablement pas assez grand pour générer des données significatives. Obtenir des résultats identiques ou similaires à partir d'une étude utilisant un échantillon de 400 ou 500 étudiants est plus valable.
Histoire des degrés de liberté
Le concept le plus ancien et le plus élémentaire des degrés de liberté a été noté au début des années 1800, entrelacé dans les travaux du mathématicien et astronome Carl Friedrich Gauss. L'utilisation et la compréhension modernes du terme ont été exposées en premier lieu par William Sealy Gosset, un statisticien anglais, dans son article "The Probable Error of a Mean", publié dans Biometrika en 1908 sous un pseudonyme pour préserver son anonymat.
Dans ses écrits, Gosset n'a pas spécifiquement utilisé le terme «degrés de liberté». Il a cependant donné une explication du concept tout au long du développement de ce que l'on pourrait éventuellement appeler la distribution en T de Student. Le terme réel n'a été rendu populaire qu'en 1922. Le biologiste et statisticien anglais Ronald Fisher a commencé à utiliser le terme «Degrés de liberté» lorsqu'il a commencé à publier des rapports et des données sur son travail de développement de chi-carrés.
