Retour

Anonymisation des données (Power Query)

Temps de lecture : 3 minutes

Dans de nombreuses tables se trouvent des données sensibles qui doivent être caché de certains utilisateurs.

Cet article en propose une des méthodes possibles.

Soit une table client (Customer) avec une colonne « contactName » qui contient les nom et prénom des contacts au sein des compagnies clientes.

Pour anonymiser ces noms et prénoms, l’utilisateur va d’abord « dupliquer » sa table Client (Customer)

Une 2ème table client se crée (Customer(2)) (1). Ensuite, l’utilisateur se place sur la colonne   « ContactName »(2) et effectue un clique droit avec sa souris puis clique sur « Regrouper Par » (3)

La fenêtre suivante s’affiche :

(Dans opération, sélectionner « Toutes les lignes » et remplacer le nom  dans « nouveau nom de colonne »)

La table est regroupé en deux colonnes, une contenant le nom et prénom du contact au sein de l’entreprise cliente  et une autre contenant les informations de la table client attaché à chaque ContactName

La prochaine étape consiste à indexer les noms de contact

L’utilisateur clique sur « Colonne d’index » (1) puis usr « A partir de 1 » pour affecter au premier contact présent dans la table la valeur 1 (2) ce qui créer la colonne d’index (3)

Pour éviter des erreurs, l’utilisateur convertit le format de la colonne d’index en texte en cliquant sur l’icone à gauche du nom de la colonne (1) et en choisissant un autre format (2)

L’utilisateur crée une colonne personnalisée en cliquant sur le bouton dédié dans le ruban (1) ce qui ouvrira une fenêtre (2) ou l’utilisateur devra renseigner le nom de sa colonne (3) et l’expression en langage M qui concatènera une texte dure « contact_ » avec le numero d’index au format texte (4) (en format nombre cela aurait provoquer une erreur)

Ce qui génére la colonne suivante :

A partir de ce point, l’utilisateur peut :
-soit supprimer les colonnes ContactName.1 et Index pour ne garder que « Contactname » et « Contact anonyme », ainsi la table client dupliqué (Customer (2) ) peut être utilisé comme une table de dimension à relier à la table  « Client ».

– soit déroulé la colonne « ContactName.1 » et ajouter les colonnes qu’ils souhaitent garder. Cela recréera la table Customer avec les 3  colonnes « ContactName », « Index », et  »Contact anonyme »

L’utilisateur peut supprimer les colonnes qu’ils ne souhaitent pas garder comme les colonnes « ContactName » et « ContactName.1.ContactName » puisque le but était d’anonymiser le contact ce qui est fait avec la présence de la colonne «Contact anonyme ».
Mais l’utilisateur peut garder le colonne ContactName et la masquer dans le modèle de données s’il considère qu’il en aura besoin plus tard.

Laisser un commentaire

Il n'y a pas de commentaires pour le moment. Soyez le premier à participer !