Qu'est-ce que la multicolinéarité?
La multicolinéarité est l'occurrence d'intercorrélations élevées entre des variables indépendantes dans un modèle de régression multiple. La multicolinéarité peut conduire à des résultats biaisés ou trompeurs lorsqu'un chercheur ou un analyste tente de déterminer dans quelle mesure chaque variable indépendante peut être utilisée le plus efficacement pour prédire ou comprendre la variable dépendante dans un modèle statistique. En général, la multicolinéarité peut conduire à des intervalles de confiance plus larges et à des valeurs de probabilité moins fiables pour les variables indépendantes. Autrement dit, les inférences statistiques à partir d'un modèle avec multicolinéarité peuvent ne pas être fiables.
Comprendre la multicolinéarité
Les analystes statistiques utilisent plusieurs modèles de régression pour prédire la valeur d'une variable dépendante spécifiée en fonction des valeurs de deux variables indépendantes ou plus. La variable dépendante est parfois appelée variable de résultat, cible ou critère. Un exemple est un modèle de régression multivariée qui tente d'anticiper les rendements boursiers en fonction d'éléments tels que les ratios cours / bénéfices, la capitalisation boursière, les performances passées ou d'autres données. Le rendement des actions est la variable dépendante et les différents bits de données financières sont les variables indépendantes.
Points clés à retenir
- La multicollinéarité est un concept statistique où les variables indépendantes d'un modèle sont corrélées.La multicollinéarité entre les variables indépendantes se traduira par des inférences statistiques moins fiables.Il est préférable d'utiliser des variables indépendantes qui ne sont pas corrélées ou répétitives lors de la construction de modèles de régression multiples qui utilisent deux variables ou plus..
La multicollinéarité dans un modèle de régression multiple indique que les variables indépendantes colinéaires sont liées d'une certaine façon, bien que la relation puisse être ou non occasionnelle. Par exemple, les performances passées peuvent être liées à la capitalisation boursière, car les actions qui ont bien performé dans le passé auront une valeur marchande croissante. En d'autres termes, la multicolinéarité peut exister lorsque deux variables indépendantes sont fortement corrélées. Cela peut également se produire si une variable indépendante est calculée à partir d'autres variables de l'ensemble de données ou si deux variables indépendantes fournissent des résultats similaires et répétitifs.
L'un des moyens les plus courants d'éliminer le problème de la multicolinéarité consiste à identifier d'abord les variables indépendantes colinéaires, puis à les supprimer toutes sauf une. Il est également possible d'éliminer la multicolinéarité en combinant deux ou plusieurs variables colinéaires en une seule variable. Une analyse statistique peut ensuite être effectuée pour étudier la relation entre la variable dépendante spécifiée et une seule variable indépendante.
Exemple de multicollinéarité
Pour investir, la multicolinéarité est une considération courante lors de l'analyse technique pour prédire les mouvements futurs probables d'un cours d'un titre, tel qu'un titre ou un produit de base. Les analystes de marché veulent éviter d'utiliser des indicateurs techniques colinéaires dans la mesure où ils sont basés sur des données très similaires ou connexes; ils tendent à révéler des prédictions similaires concernant la variable dépendante du mouvement des prix. Au lieu de cela, l'analyse du marché doit être basée sur des variables indépendantes nettement différentes pour garantir qu'elles analysent le marché à partir de différents points de vue analytiques indépendants.
L'analyste technique réputé John Bollinger, créateur de l'indicateur Bollinger Bands, note qu '"une règle cardinale pour une utilisation réussie de l'analyse technique nécessite d'éviter la multicolinéarité au milieu des indicateurs".
Pour résoudre le problème, les analystes évitent d'utiliser deux ou plusieurs indicateurs techniques du même type. Au lieu de cela, ils analysent un titre à l'aide d'un type d'indicateur, tel qu'un indicateur de momentum, puis effectuent une analyse distincte à l'aide d'un type d'indicateur différent, tel qu'un indicateur de tendance.
Un exemple de problème potentiel de multicolinéarité consiste à effectuer une analyse technique uniquement à l'aide de plusieurs indicateurs similaires, tels que la stochastique, l'indice de force relative (RSI) et Williams% R, qui sont tous des indicateurs de momentum qui reposent sur des données similaires et sont susceptibles de produire des données similaires. résultats. Dans ce cas, il est préférable de supprimer tous les indicateurs sauf un ou de trouver un moyen de fusionner plusieurs d'entre eux en un seul indicateur, tout en ajoutant un indicateur de tendance qui n'est probablement pas fortement corrélé avec l'indicateur de momentum.
