Qu'est-ce que le sur-ajustement?
Le sur-ajustement est une erreur de modélisation qui se produit lorsqu'une fonction est trop proche d'un ensemble limité de points de données. Le surajustement du modèle prend généralement la forme d'un modèle trop complexe pour expliquer les particularités des données à l'étude.
En réalité, les données souvent étudiées contiennent un certain degré d'erreur ou de bruit aléatoire. Ainsi, tenter de rendre le modèle conforme trop étroitement à des données légèrement inexactes peut infecter le modèle avec des erreurs substantielles et réduire son pouvoir prédictif.
Points clés à retenir
- Le sur-ajustement est une erreur de modélisation qui se produit lorsqu'une fonction est trop proche d'un ensemble limité de points de données. Les professionnels des finances doivent toujours être conscients des dangers d'un sur-ajustement d'un modèle basé sur des données limitées.
Comprendre le sur-ajustement
Par exemple, un problème courant consiste à utiliser des algorithmes informatiques pour rechercher de vastes bases de données de données de marché historiques afin de trouver des modèles. Avec suffisamment d'études, il est souvent possible de développer des théorèmes élaborés qui semblent prédire des choses telles que les rendements en bourse avec une précision proche.
Cependant, lorsqu'ils sont appliqués à des données en dehors de l'échantillon, ces théorèmes peuvent se révéler être simplement le surajustement d'un modèle à ce qui n'était en réalité que des occurrences fortuites. Dans tous les cas, il est important de tester un modèle par rapport à des données extérieures à l'échantillon utilisé pour le développer.
Les professionnels de la finance doivent toujours être conscients des dangers de sur-adapter un modèle basé sur des données limitées.
