Qu'est-ce qu'un échantillon de biais de sélection?
Le biais de sélection des échantillons est un type de biais causé par le choix de données non aléatoires pour l'analyse statistique. Le biais existe en raison d'une faille dans le processus de sélection des échantillons, où un sous-ensemble des données est systématiquement exclu en raison d'un attribut particulier. L'exclusion du sous-ensemble peut influencer la signification statistique du test ou produire des résultats déformés.
Comprendre le biais de sélection d'échantillon
Le biais de survie est un type courant de biais de sélection des échantillons. Par exemple, lors d'un contre-test d'une stratégie d'investissement sur un grand groupe d'actions, il peut être pratique de rechercher des titres qui contiennent des données pour toute la période d'échantillonnage. Si nous devions tester la stratégie par rapport à 15 ans de données sur les stocks, nous pourrions être enclins à rechercher des stocks contenant des informations complètes pour toute la période de 15 ans. Cependant, l'élimination d'un titre qui a cessé ses activités ou qui a quitté le marché sous peu entraînerait un biais dans notre échantillon de données. Étant donné que nous n'incluons que les actions qui ont duré la période de 15 ans, nos résultats finaux seraient erronés, car ceux-ci se sont suffisamment bien comportés pour survivre sur le marché.
Les indices de performance des hedge funds sont un exemple de biais de sélection d'échantillon soumis au biais de survie. Parce que les hedge funds qui ne survivent pas cessent de communiquer leurs performances aux agrégateurs d'indices, les indices qui en résultent sont naturellement orientés vers les fonds et les stratégies qui restent, donc «survivent». Cela peut également être un problème avec les services de reporting de fonds communs de placement populaires.
Les analystes peuvent s'adapter pour tenir compte de ces biais, mais peuvent introduire de nouveaux biais dans le processus.
