Qu'est-ce que la modélisation prédictive?
La modélisation prédictive est le processus d'utilisation des résultats connus pour créer, traiter et valider un modèle qui peut être utilisé pour prévoir les résultats futurs. Il s'agit d'un outil utilisé dans l'analyse prédictive, une technique d'exploration de données qui tente de répondre à la question «que pourrait-il arriver à l'avenir?
Comprendre la modélisation prédictive
La migration rapide vers les produits numériques a créé une mer de données facilement disponibles et accessibles aux entreprises. Les mégadonnées sont utilisées par les entreprises pour améliorer la dynamique de la relation client-entreprise. Cette grande quantité de données en temps réel provient de sources telles que les médias sociaux, l'historique de navigation sur Internet, les données des téléphones portables et les plateformes de cloud computing.
En analysant les événements historiques, il est probable qu'une entreprise puisse prédire ce qui se passerait à l'avenir et planifier en conséquence. Cependant, ces données sont généralement non structurées et trop complexes pour être analysées par l'homme en peu de temps. En raison de la complexité que représentent d'énormes quantités de données, les entreprises utilisent de plus en plus des outils d'analyse prédictive pour prévoir le résultat d'un événement susceptible de se produire dans un avenir proche.
Fonctionnement de l'analyse prédictive
L'analyse prédictive collecte et traite des données historiques en grandes quantités et utilise des ordinateurs puissants pour évaluer ce qui s'est passé dans le passé, puis fournit une évaluation de ce qui se passera à l'avenir.
L'analyse prédictive utilise des prédicteurs ou des fonctionnalités connues pour créer des modèles prédictifs qui seront utilisés pour obtenir une sortie. Un modèle prédictif est capable d'apprendre comment différents points de données se connectent les uns aux autres. La régression et les réseaux de neurones sont deux des techniques de modélisation prédictive les plus utilisées.
Les entreprises utilisent de plus en plus la modélisation prédictive pour faire des prédictions sur les événements susceptibles de se produire dans un avenir proche.
Considérations particulières
Dans le domaine des statistiques, la régression fait référence à une relation linéaire entre les variables d'entrée et de sortie. Un modèle prédictif avec une fonction linéaire nécessite un prédicteur ou une caractéristique pour prédire la sortie / le résultat. Par exemple, une banque qui espère détecter le blanchiment d'argent à ses débuts pourrait intégrer un modèle prédictif linéaire.
La banque souhaite en particulier savoir lesquels de ses clients sont susceptibles de se livrer à des activités de blanchiment d'argent à un moment donné. Toutes les données des clients de la banque sont présentées et un modèle prédictif est construit autour de la valeur monétaire des transferts effectués par chaque client au cours d'une période donnée.
Le modèle apprend à reconnaître la différence entre une opération de blanchiment d'argent et une opération normale. Le résultat optimal du modèle devrait être un modèle indiquant quels clients ont blanchi de l'argent et lesquels ne l'ont pas fait. Si le modèle perçoit qu'un modèle de fraude émerge pour un client particulier, il créera un signal d'action qui sera suivi par les analystes de la fraude de la banque.
Les modèles prédictifs sont également utilisés dans les réseaux de neurones tels que l'apprentissage automatique et l'apprentissage profond, qui sont des domaines de l'intelligence artificielle (IA). Les réseaux de neurones sont inspirés par le cerveau humain et sont créés avec un réseau de nœuds interconnectés à des niveaux hiérarchiques qui représentent le fondement de l'IA. La puissance des réseaux de neurones réside dans leur capacité à gérer les relations de données non linéaires. Ils sont capables de créer des relations et des modèles entre les variables qui s'avéreraient impossibles ou trop chronophages pour les analystes humains.
Points clés à retenir
- La modélisation prédictive est le processus consistant à utiliser des résultats connus pour créer, traiter et valider un modèle qui peut être utilisé pour faire de futures prédictions. Deux des techniques de modélisation prédictive les plus utilisées sont la régression et les réseaux de neurones.
Ainsi, alors qu'une banque peut entrer des variables connues telles que la valeur des transferts initiés par ses clients dans son modèle afin d'obtenir le résultat souhaité de qui est susceptible de se livrer au blanchiment d'argent, un réseau de neurones peut créer un modèle plus puissant s'il le peut créer avec succès une relation entre les variables d'entrée telles que l'heure de connexion, l'emplacement géographique de l'utilisateur, l'adresse IP de l'appareil de l'utilisateur, le destinataire ou l'expéditeur des fonds, et toute autre fonctionnalité susceptible de constituer une activité de blanchiment.
D'autres techniques de modélisation prédictive utilisées par les sociétés financières comprennent les arbres de décision, l'exploration de données chronologiques et l'analyse bayésienne. Les entreprises qui tirent parti des mégadonnées grâce à des mesures de modélisation prédictives sont mieux à même de comprendre comment leurs clients interagissent avec leurs produits et peuvent identifier les risques et opportunités potentiels pour une entreprise.
