Résumé de l'article

Tristan Allard, Protection des données personnelles destinées à être publiées : description d’une attaque minimaliste sur un jeu de données pseudonymisé
Les logiciels d’aide à la décision basés sur des techniques d’intelligence artificielle sont de plus en plus utilisés dans le domaine de la justice. Or ces techniques nécessitent souvent d’accéder à de grandes quantités d’informations personnelles afin de réaliser un apprentissage de qualité. En France, le cadre légal semble aujourd’hui favorable à l’ouverture des jugements, pourvu que la vie privée des personnes concernées soit respectée. Cependant, la protection des données personnelles destinées à être publiées reste difficile techniquement. Cet article a pour objectif de décrire une attaque minimaliste qui a été réalisée en 2014 sur un jeu de données protégé par l’application d’un algorithme de pseudonymisa¬tion. L’originalité de cette attaque réside dans sa simplicité de fonctionnement – elle ne nécessite pas d’accès à un jeu de données auxiliaire – et dans sa cible – l’algorithme de pseudonymisation. Nous présentons la famille des algorithmes de pseudonymisation, décrivons et analysons l’attaque, et concluons sur la place de la pseudonymisation dans le Règlement Général sur la Protection des Données personnelles.

Mots-clef : anonymisation RGPD big data
t. 60, 2018: p. 183-188