• 15 heures
  • Moyenne

Ce cours est visible gratuitement en ligne.

course.header.alt.is_video

course.header.alt.is_certifying

J'ai tout compris !

Mis à jour le 23/12/2019

Traquez les empreintes laissées par vos données

Connectez-vous ou inscrivez-vous gratuitement pour bénéficier de toutes les fonctionnalités de ce cours !

Comme nous venons d’en discuter dans la partie précédente, nous laissons tous une incroyable trace numérique, au travers de toutes les applications et tous les objets connectés avec lesquels nous interagissons.

Parfois, nous sommes conscients de laisser une trace. Par exemple, lorsque nous nous inscrivons sur un réseau social, nous sommes conscients d’indiquer notre nom, ou peut-être même de fournir d’autres données comme notre âge ou notre adresse. Lorsque nous nous connectons à d’autres amis, nous savons sans doute également que cette information sera stockée par le réseau social.

Ce dont nous nous doutons peut-être moins, c’est que lorsque nous naviguons sur le web, ce même réseau social sur lequel nous venons de nous inscrire va noter très consciencieusement les pages que nous visitons, et ce, même si nous ne nous sommes pas forcément connectés sur le site du réseau. Pire, le réseau social est capable de constituer des données sur des personnes qui ne sont même pas membres du réseau, mais parce qu’elle ont pu avoir accès à des informations personnelles issues par exemple de répertoires mail.

Un addon pour visualiser qui nous traque

Un addon assez édifiant, c'est-à-dire un logiciel s’intégrant dans un navigateur, est le logiciel Lightbeam (disponible sur le navigateur Firefox) que vous pouvez télécharger et tester.

Lightbeam traque en temps réel les sites web qui savent que vous avez visité une page. Par exemple, une simple visite d’une page, normalement institutionnelle, comme le site du ministère de l’Éducation nationale education.gouv.fr, montre plus de 25 connexions à des sites annexes, tels que Google, Facebook, Pinterest, Twitter, Doubleclick (la division publicité de Google), ou de nombreux sites de statistiques de mesure de fréquentation du site. Par la suite, Lightbeam est capable de reconstruire un graphe montrant l’ensemble des sites qui sont connus par ces acteurs. Si après avoir visité le site de l’Éducation nationale je me rends sur le site du journal « L’Équipe », Lightbeam pourra me montrer cette information.

Lightbeam est développé par Mozilla, une fondation à but non lucratif dont l’objectif est de travailler pour qu’Internet reste une ressource globale et partagée. Elle est autofinancée, et est donc indépendante. On peut donc penser que les logiciels qu’elle développe n’ont pas pour objectif de récolter des données personnelles à l’insu des individus.

Il est donc bon de garder à l’esprit, à chaque fois qu’on installe un logiciel, quel est le « business model », en particulier si le logiciel est gratuit : comment se finance l’éditeur de logiciels qui produit le logiciel ? Est-ce qu’il n’y a pas un risque que la gratuité de l’application cache une exploitation commerciale des données qu’elle va récolter ?

Quelles données Google possède sur moi ?

N’hésitez pas à faire défiler la page, vous vous rendrez compte que des informations très anciennes peuvent être stockées ! Il est intéressant de noter que Google met un petit avertissement en haut de la page « Vous êtes la seule personne à pouvoir voir ces données »... ce qui n’est pas tout à fait exact : ces informations proviennent du serveur de Google, il n'est pas impossible que certains employés de Google peuvent avoir accès à ces données (comme par exemple l’administrateur de la base de données).

Si on s’intéresse de plus près à la politique de protection des données de Google, on se verra expliquer que le transfert des données est sécurisé (ce qui fait que les données ne peuvent pas être interceptées par des tiers), et ensuite que la « sécurité » de vos données est assurée car « Nous répartissons les données sur plusieurs centres de données, afin qu'en cas d'incendie ou de catastrophe, elles puissent être transférées automatiquement vers des emplacements stables et sécurisés. » On parlerait plus volontiers de sûreté des données, plutôt que de sécurité, en particulier vis-à-vis de Google, dont la plupart des individus font usage gratuitement.

L'exploitation des données personnelles est un business

En fin de compte, à quoi servent toutes ces données ?

Eh bien, à être exploitées par des techniques d’apprentissage automatique. L’apprentissage automatique est une branche de l’intelligence artificielle, qui a besoin pour fonctionner d’un grand nombre de données, afin d’essayer de construire des modèles prédictifs. Ainsi, à l’aide de toutes les données qu’elle possède sur vous, Google est capable de déduire tout un tas d’informations.

Dans la plupart des cas, vous n’aurez jamais rempli ces champs. Ils ont été calculés automatiquement par des processus d’intelligence artificielle appliqués à du profilage.

Thématique de publicité Google
Thématique de publicité Google

On voit que Google explique que l'information sur la thématique provient d'un profilage basé sur des informations de visionnage de vidéos ou de leur moteur de recherches. Il est à noter que Google dit explicitement que vos données personnelles ne sont pas vendues à d’autres entreprises. Toutefois elle les possède et les exploite

Une solution : la collecte limitée des données

On le voit donc, de nombreuses données sont collectées sur nous par les entreprises du secteur du web.

Dans les cas cités précédemment, cette collecte est énorme, et sans doute démesurée par rapport à l’utilité qu’en fait l’individu concerné par les données : on ne recherche pas tous les jours dans ses 10 ans d’historique ! Aussi, en tant que concepteur d’applications sur des objets connectés, il convient d’appliquer le principe de collecte limitée des données, c'est-à-dire de ne collecter que les informations dont vous avez besoin pour remplir une tâche précise, et d’effacer ou de dégrader la précision de ces données une fois la tâche accomplie. Les utilisateurs ne sont en général pas très contents lorsqu’ils prennent conscience de l’envergure des données stockées sur eux par une application qu’ils pensaient bénigne !

Exemple de certificat de réussite
Exemple de certificat de réussite