Qu'est-ce que l'analyse de la variance (ANOVA)?
L'analyse de variance (ANOVA) est un outil d'analyse utilisé en statistique qui divise une variabilité agrégée observée trouvée dans un ensemble de données en deux parties: les facteurs systématiques et les facteurs aléatoires. Les facteurs systématiques ont une influence statistique sur l'ensemble de données donné, contrairement aux facteurs aléatoires. Les analystes utilisent le test ANOVA pour déterminer l'influence des variables indépendantes sur la variable dépendante dans une étude de régression.
Les méthodes des tests t et z développées au 20e siècle ont été utilisées pour l'analyse statistique jusqu'en 1918, lorsque Ronald Fisher a créé la méthode d'analyse de la variance. L'ANOVA est aussi appelée analyse de variance de Fisher, et c'est l'extension des tests t et z. Le terme est devenu bien connu en 1925, après être apparu dans le livre de Fisher, "Méthodes statistiques pour les chercheurs". Il a été employé en psychologie expérimentale et s'est ensuite étendu à des sujets plus complexes.
La formule pour l'ANOVA est:
La F = MSEMST où: F = coefficient ANOVA MST = Somme moyenne des carrés due au traitement MSE = Somme moyenne des carrés due à l'erreur
Que révèle l'analyse de la variance?
Le test ANOVA est la première étape de l'analyse des facteurs qui affectent un ensemble de données donné. Une fois le test terminé, un analyste effectue des tests supplémentaires sur les facteurs méthodologiques qui contribuent de manière mesurable à l'incohérence de l'ensemble de données. L'analyste utilise les résultats du test ANOVA dans un test f pour générer des données supplémentaires qui s'alignent avec les modèles de régression proposés.
Le test ANOVA permet une comparaison de plus de deux groupes en même temps pour déterminer s'il existe une relation entre eux. Le résultat de la formule ANOVA, la statistique F (également appelée le rapport F), permet l'analyse de plusieurs groupes de données pour déterminer la variabilité entre les échantillons et au sein des échantillons.
Si aucune différence réelle n'existe entre les groupes testés, ce qui est appelé l'hypothèse nulle, le résultat de la statistique du rapport F de l'ANOVA sera proche de 1. Les fluctuations de son échantillonnage suivront probablement la distribution de Fisher F. Il s'agit en fait d'un groupe de fonctions de distribution, avec deux nombres caractéristiques, appelés degrés de liberté numérateur et degrés de liberté dénominateur.
Points clés à retenir
- L'analyse de variance, ou ANOVA, est une méthode statistique qui sépare les données de variance observées en différents composants à utiliser pour des tests supplémentaires.Une ANOVA unidirectionnelle est utilisée pour trois groupes de données ou plus, pour obtenir des informations sur la relation entre la personne à charge et la personne à charge. variables indépendantes. S'il n'existe pas de véritable variance entre les groupes, le rapport F de l'ANOVA doit être proche de 1.
Exemple d'utilisation de l'ANOVA
Un chercheur pourrait, par exemple, tester les étudiants de plusieurs collèges pour voir si les étudiants de l'un des collèges surpassent constamment les étudiants des autres collèges. Dans une application métier, un chercheur en R&D peut tester deux processus différents de création d'un produit pour voir si un processus est meilleur que l'autre en termes de rentabilité.
Le type de test ANOVA utilisé dépend d'un certain nombre de facteurs. Il est appliqué lorsque les données doivent être expérimentales. L'analyse de la variance est utilisée s'il n'y a pas d'accès à un logiciel statistique permettant de calculer l'ANOVA à la main. Il est simple à utiliser et convient mieux aux petits échantillons. Avec de nombreux plans expérimentaux, les tailles d'échantillon doivent être les mêmes pour les différentes combinaisons de niveaux de facteurs.
L'ANOVA est utile pour tester trois variables ou plus. Il est similaire à plusieurs tests t à deux échantillons. Cependant, cela entraîne moins d'erreurs de type I et convient à une série de problèmes. L'ANOVA regroupe les différences en comparant les moyennes de chaque groupe et comprend la répartition de la variance dans diverses sources. Il est utilisé avec des sujets, des groupes de test, entre les groupes et au sein des groupes.
ANOVA unidirectionnelle versus ANOVA bidirectionnelle
Il existe deux types d'ANOVA: unidirectionnel (ou unidirectionnel) et bidirectionnel. Unidirectionnel ou bidirectionnel fait référence au nombre de variables indépendantes dans votre analyse de test de variance. Une ANOVA unidirectionnelle évalue l'impact d'un facteur unique sur une seule variable de réponse. Il détermine si tous les échantillons sont identiques. L'ANOVA unidirectionnelle est utilisée pour déterminer s'il existe des différences statistiquement significatives entre les moyennes de trois groupes indépendants ou plus (non liés).
Une ANOVA bidirectionnelle est une extension de l'ANOVA unidirectionnelle. Avec un sens unique, vous avez une variable indépendante affectant une variable dépendante. Avec une ANOVA bidirectionnelle, il y a deux indépendants. Par exemple, une ANOVA bidirectionnelle permet à une entreprise de comparer la productivité des travailleurs en fonction de deux variables indépendantes, telles que le salaire et l'ensemble de compétences. Il est utilisé pour observer l'interaction entre les deux facteurs et teste l'effet de deux facteurs en même temps.
