Qu'est-ce que la régression pas à pas?
L'analyse de régression est une approche statistique largement utilisée qui cherche à identifier les relations entre les variables. L'idée est de regrouper les données pertinentes pour prendre des décisions mieux informées et est une pratique courante dans le monde de l'investissement. La régression pas à pas est la construction itérative pas à pas d'un modèle de régression qui implique la sélection automatique de variables indépendantes. La disponibilité de progiciels statistiques permet une régression pas à pas, même dans les modèles avec des centaines de variables.
Types de régression pas à pas
Le but sous-jacent de la régression pas à pas est, à travers une série de tests (tests F, tests t), de trouver un ensemble de variables indépendantes qui influencent significativement la variable dépendante. Cela se fait avec les ordinateurs par itération, qui est le processus qui mène aux résultats ou aux décisions en passant par des cycles ou cycles d'analyse répétés. La réalisation automatique de tests à l'aide de progiciels statistiques présente l'avantage de gagner du temps pour l'individu.
Points clés à retenir
- L'analyse de régression est une approche statistique qui cherche à comprendre et à mesurer les relations entre les variables indépendantes et dépendantes.La régression pas à pas est une méthode qui examine la signification statistique de chaque variable indépendante dans le modèle.L'approche de sélection directe ajoute une variable puis teste la signification statistique La méthode d'élimination vers l'arrière commence par un modèle chargé de nombreuses variables, puis supprime une variable pour tester son importance par rapport aux résultats globaux.La régression pas à pas a de nombreux critiques, car c'est l'approche qui ajuste les données dans un modèle pour obtenir le résultat souhaité.
La régression pas à pas peut être réalisée soit en essayant une variable indépendante à la fois et en l'incluant dans le modèle de régression si elle est statistiquement significative, soit en incluant toutes les variables indépendantes potentielles dans le modèle et en éliminant celles qui ne sont pas statistiquement significatives. Certains utilisent une combinaison des deux méthodes et il existe donc trois approches de régression pas à pas:
- La sélection vers l'avant commence sans aucune variable dans le modèle, teste chaque variable au fur et à mesure qu'elle est ajoutée au modèle, puis conserve celles qui sont jugées les plus statistiquement significatives - en répétant le processus jusqu'à ce que les résultats soient optimaux. supprimer une à la fois, puis tester pour voir si la variable supprimée est statistiquement significative.L'élimination bidirectionnelle est une combinaison des deux premières méthodes qui teste quelles variables doivent être incluses ou exclues.
Un exemple de régression pas à pas utilisant la méthode d'élimination vers l'arrière serait une tentative de comprendre la consommation d'énergie dans une usine en utilisant des variables telles que la durée de fonctionnement de l'équipement, l'âge de l'équipement, la taille du personnel, les températures extérieures et la période de l'année. Le modèle comprend toutes les variables, puis chacune est supprimée, une à la fois, pour déterminer laquelle est la moins significative sur le plan statistique. En fin de compte, le modèle pourrait montrer que la période de l'année et les températures sont les plus importantes, ce qui suggère peut-être que la consommation d'énergie maximale à l'usine est lorsque l'utilisation du climatiseur est à son maximum.
Limites de la régression pas à pas
L'analyse de régression, à la fois linéaire et multivariée, est largement utilisée dans le monde de l'investissement aujourd'hui. L'idée est souvent de trouver des modèles qui existaient dans le passé et qui pourraient également se reproduire à l'avenir. Une simple régression linéaire, par exemple, pourrait examiner les ratios cours / bénéfices et les rendements boursiers sur plusieurs années pour déterminer si les actions à faible ratio P / E (variable indépendante) offrent des rendements plus élevés (variable dépendante). Le problème avec cette approche est que les conditions du marché changent souvent et que les relations qui existaient dans le passé ne se vérifient pas nécessairement dans le présent ou l'avenir.
Pendant ce temps, le processus de régression par étapes a de nombreux détracteurs et il y a même des appels à cesser complètement d'utiliser la méthode. Les statisticiens notent plusieurs inconvénients de l'approche, y compris des résultats incorrects, un biais inhérent au processus lui-même et la nécessité d'une puissance de calcul importante pour développer des modèles de régression complexes par itération.
