• 15 heures
  • Moyenne

Ce cours est visible gratuitement en ligne.

course.header.alt.is_video

course.header.alt.is_certifying

J'ai tout compris !

Mis à jour le 23/12/2019

Anonymisez les données

Connectez-vous ou inscrivez-vous gratuitement pour bénéficier de toutes les fonctionnalités de ce cours !

Compétences évaluées

  • Évaluer la qualité d'une anonymisation de données

Description

On considère l'application de PrivateRun, qui stocke des informations dans deux tables côté utilisateur (montre ou portable) :

Table Utilisateur : Cette table ne possède qu'une seule ligne

NOM PRÉNOM Date de Naissance Numéro de Version Logiciel Montre Type de Navigateur
Tartempion Robert 15/8/1990 1.3 Firefox 65.3.2

Table Déplacements :

Jour Heure Localisation
12/3/2019 9:00 47.082795N, 2.416512E
12/3/2019 9:05 47.080807N, 2.407028E
12/3/2019 9:10 47.078194N, 2.409694E
12/3/2019 9:15 47.074502N, 2.408465E

Ces données sont ensuite exportées sur le serveur, mais après une anonymisation qui remplace le nom et le prénom par un identifiant (supposé) unique généré par la fonction de hachage MD5 appliquée à la concaténation du nom+prénom, et qui tronque le jour de naissance des individus, pour ne garder que le mois et l'année de naissance. Les données précédentes se retrouveront donc sur le serveur transformées comme suit :

Table Utilisateurs_serv :

ID DDN Version Navigateur
CBD2096691C96130D6FB27DCFE5DF503 8/1990 1.3 Firefox 65.3.2
1E1958BC9727BD79E5421EA4FA1ECC0F 8/1990 1.3 Firefox 60.3.5

Table Déplacements_serv :

ID Jour Heure Localisation
CBD2096691C96130D6FB27DCFE5DF503 12/3/2019 9:00 47.082795N, 2.416512E
CBD2096691C96130D6FB27DCFE5DF503 12/3/2019 9:05 47.080807N, 2.407028E
CBD2096691C96130D6FB27DCFE5DF503 12/3/2019 9:10 47.078194N, 2.409694E
CBD2096691C96130D6FB27DCFE5DF503 12/3/2019 9:15 47.074502N, 2.408465E
 1E1958BC9727BD79E5421EA4FA1ECC0F 12/3/2019 9:00 47.082795N, 2.416512E
 1E1958BC9727BD79E5421EA4FA1ECC0F 12/3/2019 9:05 47.080807N, 2.407028E
 1E1958BC9727BD79E5421EA4FA1ECC0F 12/3/2019 9:10 47.078194N, 2.409694E
1E1958BC9727BD79E5421EA4FA1ECC0F 12/3/2019 9:15 47.080807N, 2.407028E

 

  • Question 1

    Hypothèse : je suis un pirate informatique qui attaque le serveur de PrivateRun. Je cherche à récupérer les données de quelqu'un que je connais, nommé Robert Tartempion. Je sais qu'on utilise la fonction de hachage MD5 pour générer les identifiants. Est-ce que je suis capable de dire (avec une certitude de 100 %) quel ID est celui qui correspond à l'individu qui m'intéresse, en regardant simplement la valeur de l'ID ?

    • Oui

    • Non

  • Question 2

    On utilise maintenant une fonction de chiffrement paramétrée (on suppose que la clé est stockée de manière sécurisée et non accessible par le pirate) pour générer l'identifiant. La table Utilisateurs devient :

    Table Utilisateurs_serv :

    ID DDN Version Navigateur
    sdgh4ZEhjiged$'gehoir 8/1990 1.3 Firefox 65.3.2
    àbheuoirg15nige3*$$ge 8/1990 1.3 Firefox 60.3.5

    Supposons que le pirate connaisse les informations DDN, version et navigateur de Robert Tartempion. Est-ce qu'il est capable de retrouver (avec une certitude de 100 %) l'identifiant qui lui correspond ?

    • Oui

    • Non

  • Question 3

    On s'intéresse à la table suivante.

    Table Déplacements_serv :

    ID Jour Heure Localisation
    CBD2096691C96130D6FB27DCFE5DF503 12/3/2019 9:00 47.082795N, 2.416512E
    CBD2096691C96130D6FB27DCFE5DF503 12/3/2019 9:05 47.080807N, 2.407028E
    CBD2096691C96130D6FB27DCFE5DF503 12/3/2019 9:10 47.078194N, 2.409694E
    CBD2096691C96130D6FB27DCFE5DF503 12/3/2019 9:15 47.074502N, 2.408465E
     1E1958BC9727BD79E5421EA4FA1ECC0F 12/3/2019 9:00 47.082795N, 2.416512E
     1E1958BC9727BD79E5421EA4FA1ECC0F 12/3/2019 9:05 47.080807N, 2.407028E
     1E1958BC9727BD79E5421EA4FA1ECC0F 12/3/2019 9:10 47.078194N, 2.409694E
    1E1958BC9727BD79E5421EA4FA1ECC0F 12/3/2019 9:15 47.080807N, 2.407028E

    On suppose que l'attribut ID est un attribut sensible, et on suppose que le triplet (Jour, Heure, Localisation) est un quasi-identifiant. Donnez la réponse correcte.

    • Cette table est 2-anonyme et 2-diverse.

    • Cette table est 2-anonyme mais pas 2-diverse.

    • Cette table n'est pas 2-anonyme mais est 2-diverse.

    • Cette table n'est ni 2-anonyme, ni 2-diverse.