Qu'est-ce que l'entreposage de données?
L'entreposage de données est le stockage électronique d'une grande quantité d'informations par une entreprise ou une organisation. L'entreposage de données est une composante vitale de l'intelligence d'affaires qui utilise des techniques analytiques sur les données commerciales.
Le concept d'entreposage de données a été introduit en 1988 par les chercheurs d'IBM Barry Devlin et Paul Murphy. Le besoin d'entreposer les données a évolué à mesure que les systèmes informatiques devenaient plus complexes et géraient des quantités croissantes de données. Un ouvrage clé sur l'entreposage de données est «Building the Data Warehouse» de WH Inmon, qui a été publié pour la première fois en 1990 et a été réimprimé plusieurs fois depuis.
Fonctionnement de l'entreposage de données
L'entreposage de données permet de mieux comprendre les performances d'une entreprise en comparant des données consolidées à partir de plusieurs sources hétérogènes. Un entrepôt de données est conçu pour exécuter des requêtes et des analyses sur des données historiques dérivées de sources transactionnelles.
Une fois que les données ont été incorporées dans l'entrepôt, elles ne changent pas et ne peuvent pas être modifiées car un entrepôt de données exécute des analyses sur les événements qui se sont déjà produits en se concentrant sur les changements de données au fil du temps. Les données stockées doivent être stockées de manière sécurisée, fiable, facile à récupérer et facile à gérer.
Certaines étapes sont prises pour créer un entrepôt de données. La première étape est l'extraction des données, qui implique la collecte de grandes quantités de données à partir de plusieurs points source. Une fois les données compilées, elles passent par le nettoyage des données, le processus de recherche des erreurs dans les données et la correction ou l'exclusion des erreurs trouvées.
Les données nettoyées sont ensuite converties d'un format de base de données en un format d'entrepôt. Une fois stockées dans l'entrepôt, les données passent par le tri, la consolidation, la synthèse, etc. afin d'être plus coordonnées et plus faciles à utiliser. Au fil du temps, davantage de données sont ajoutées à l'entrepôt à mesure que les multiples sources de données sont mises à jour.
Points clés à retenir
- L'entrepôt de données est le stockage électronique d'une grande quantité d'informations par une entreprise ou une organisation.Un entrepôt de données est conçu pour exécuter des requêtes et des analyses sur des données historiques dérivées de sources transactionnelles à des fins de Business Intelligence et d'exploration de données. un aperçu des performances d'une entreprise en comparant des données consolidées à partir de plusieurs sources hétérogènes.
Considérations spéciales: exploration de données
Les entreprises peuvent stocker des données à des fins d'exploration et d'exploration de données, à la recherche de modèles d'informations qui les aideront à améliorer leurs processus commerciaux. Un bon système d'entreposage de données peut également permettre aux différents services d'une entreprise d'accéder plus facilement aux données des autres.
Par exemple, un entrepôt de données peut permettre à une entreprise d'évaluer facilement les données de l'équipe de vente et d'aider à prendre des décisions sur la façon d'améliorer les ventes ou de rationaliser le service. L'entreprise pourrait choisir de se concentrer sur les habitudes de dépenses de ses clients pour mieux positionner ses produits et augmenter ses ventes.
Avec l'entreposage de données, l'entreprise peut recueillir des données historiques sur les dépenses de ses clients au cours des 20 dernières années, par exemple, et exécuter des analyses sur ces données. Les informations obtenues pourraient donner un aperçu des préférences de ses consommateurs; l'heure du jour, du mois ou de l'année avec des ventes plus importantes; ou client ayant dépensé le plus pour l'année.
Un stockage et une gestion efficaces des données sont également ce qui rend les processus, tels que le lancement de réservations de voyage et l'utilisation de guichets automatiques.
Le processus d'exploration de données se décompose en cinq étapes:
- Les organisations collectent des données et les chargent dans leurs entrepôts de données, puis les stockent et les gèrent, soit sur des serveurs internes, soit sur le cloud.Les analystes commerciaux, les équipes de gestion et les professionnels des technologies de l'information accèdent aux données et déterminent comment elles souhaitent les organiser. Le logiciel d'application trie ensuite les données en fonction des résultats de l'utilisateur. L'utilisateur final présente enfin les données dans un format facile à partager, tel qu'un graphique ou un tableau.
Entreposage de données vs bases de données
Un entrepôt de données n'est pas nécessairement le même concept qu'une base de données standard. Une base de données est un système transactionnel qui est configuré pour surveiller et mettre à jour les données en temps réel afin de ne disposer que des données les plus récentes. Un entrepôt de données est programmé pour agréger des données structurées sur une période de temps. Par exemple, une base de données peut avoir uniquement l'adresse la plus récente d'un client, tandis qu'un entrepôt de données peut avoir toutes les adresses dans lesquelles le client a vécu au cours des 10 dernières années.
