Qu'est-ce que l'anonymisation des données
L'anonymisation des données vise à protéger les données privées ou sensibles en supprimant ou en cryptant les informations personnellement identifiables d'une base de données. L'anonymisation des données est effectuée dans le but de protéger les activités privées d'un individu ou d'une entreprise tout en maintenant l'intégrité des données recueillies et partagées. L'anonymisation des données est également appelée «obscurcissement des données», «masquage des données» ou «désidentification des données».
Décomposer l'anonymisation des données
Les entreprises génèrent, stockent et traitent d'énormes quantités de données sensibles dans le cours normal de leurs activités commerciales. Les progrès technologiques ont prospéré grâce aux informations pertinentes trouvées dans les données qui ont été générées et partagées entre divers secteurs et pays. L'innovation financière dans la technologie (fintech) a fait des progrès illimités dans la manière dont les services financiers sont personnalisés pour les clients, grâce à des données partagées provenant de secteurs tels que les médias sociaux et les établissements de commerce électronique. Les données partagées entre les médias numériques et les entreprises de commerce électronique ont aidé les deux secteurs à mieux faire connaître les produits sur leurs sites à un utilisateur ou un consommateur spécifique. Cependant, pour que les données partagées soient utiles sans compromettre l'identité des clients compilées dans la base de données, l'anonymisation doit être utilisée.
L'anonymisation des données en pratique
L'anonymisation des données est effectuée par la plupart des industries qui traitent des informations sensibles telles que les secteurs des soins de santé, des finances et des médias numériques tout en favorisant l'intégrité du partage des données. L'anonymisation des données réduit le risque de divulgation involontaire lors du partage de données entre pays, industries et même services au sein de la même entreprise. Par exemple, un hôpital partageant des données confidentielles sur ses patients avec un laboratoire de recherche médicale ou une entreprise pharmaceutique pourrait le faire de manière éthique s'il garde ses patients anonymes. Cela peut être fait en supprimant les noms, numéros de sécurité sociale, dates de naissance et adresses de ses patients de la liste partagée tout en laissant les composants importants requis pour la recherche médicale comme l'âge, les affections, la taille, le poids, le sexe, la race, etc.
Techniques d'anonymisation des données
L'anonymisation des données se fait de différentes manières, notamment la suppression, le chiffrement, la généralisation et une multitude d'autres. Une entreprise peut soit supprimer les informations personnelles identifiables (PII) de ses données collectées, soit crypter ces informations avec une phrase secrète forte. Une entreprise peut également décider de généraliser les informations collectées dans sa base de données. Par exemple, un tableau contient le revenu brut exact gagné par cinq PDG dans le secteur du commerce de détail. Supposons que les revenus enregistrés soient de 520 000 $, 230 000 $, 109 000 $, 875 000 $ et 124 000 $. Ces informations peuvent être généralisées en catégories telles que «<500 000 $» et «≥ 500 000 $». Bien que les données soient obscurcies, elles seront toujours utiles à l'utilisateur.
Raisonnement de l'anonymisation des données
L'anonymisation des données consiste à filtrer et masquer les informations classifiées de manière à ce qu'en cas de violation, les données acquises soient inutiles pour les coupables. La nécessité de protéger les données doit être considérée comme hautement prioritaire dans chaque organisation, car les informations classifiées qui tombent entre de mauvaises mains peuvent être utilisées à mauvais escient, intentionnellement ou non. Le manque de sensibilité lors du traitement des informations sensibles des clients peut coûter très cher aux entreprises en raison de la répression par les autorités réglementaires de la négligence grave. Les exigences légales et de conformité telles que la norme PCI DSS (Payment Card Industry Data Security Standard) imposent de lourdes amendes aux institutions financières en cas de violation de carte de crédit. La LPRPDE, une loi canadienne, régit la divulgation et l'utilisation des renseignements personnels par les sociétés. Il existe d'autres organismes de réglementation multiples qui ont été créés pour surveiller l'utilisation ou la mauvaise utilisation par une organisation des données privées.
Le décodage des données anonymisées est possible grâce à un processus connu sous le nom de désanonymisation (ou «ré-identification»). Étant donné que les données anonymisées peuvent être décodées et démêlées, les critiques estiment que l'anonymisation fournit un faux sentiment de sécurité.
