Plus de tiers savent ce que vous faites en ligne

Pendant plus de deux décennies, les gens ont utilisé Internet pour rechercher, faire des achats, se faire des amis, trouver des dates et en apprendre davantage sur le monde. Et des tiers ont regardé et appris.

Lorsque vous ouvrez un site web, votre navigateur ne communique pas uniquement avec le site que vous souhaitez visiter. Ce site peut contenir des « tiers » — d’autres sites web intégrés avec lesquels votre navigateur interagit également, comme des annonceurs, des outils d’analyse d’audience ou des widgets de réseaux sociaux — qui peuvent observer votre comportement de navigation.

Ces entreprises utilisent souvent ces informations à des fins anodines, quoique parfois intrusives, comme la publicité ciblée ou le contenu personnalisé. Cependant, les traqueurs web tiers soulèvent des questions de respect de la vie privée des utilisateurs, car ils peuvent les identifier lorsqu'ils visitent plusieurs sites, retracer leur parcours de navigation et potentiellement établir un profil complet basé sur leur comportement en ligne.

Des chercheurs de l'Université de Washington ont réalisé la toute première analyse exhaustive du suivi Web par des tiers sur trois décennies et ont développé un nouvel outil, TrackingExcavator, permettant d'extraire et d'analyser les comportements de suivi sur une page Web donnée.

Ils ont constaté une multiplication par quatre du suivi par des tiers sur les principaux sites entre 1996 et 2016, et ont cartographié la complexité croissante des traqueurs sur plusieurs décennies.


graphique d'abonnement intérieur


« Le suivi par des tiers a débuté très tôt dans l'histoire du web », explique Adam Lerner, doctorant au département d'informatique et d'ingénierie, qui a présenté les conclusions de son équipe la semaine dernière à la conférence USENIX Security à Austin, au Texas. « L'impact potentiel du suivi web par des tiers suscite une inquiétude croissante, mais nous manquions d'un historique complet de l'évolution de ces traqueurs et des types d'informations qu'ils collectent. »

Au-delà des fenêtres pop-up

Lerner et sa collègue doctorante Anna Kornfeld Simpson ont entrepris de combler les lacunes de notre compréhension du suivi, en travaillant avec Franziska Roesner, professeure adjointe d'informatique et d'ingénierie, et Tadayoshi Kohno, professeur associé du Laboratoire de sécurité et de confidentialité de l'Université de Washington.

Roesner et Kohno avaient précédemment étudié les techniques de suivi Web par des tiers, notamment en développant une première taxonomie des approches de base utilisées par de nombreux traqueurs basés sur les cookies.

« Le suivi des comportements peut aller de méthodes "forcées", comme l'apparition d'une fenêtre contextuelle, à des méthodes plus "classiques", comme l'utilisation de cookies tiers pour suivre l'utilisateur », explique Kohno. « Jusqu'à présent, nous n'avions pas les outils nécessaires pour comprendre l'évolution de ces approches depuis les débuts du web. Désormais, nous pouvons constater la croissance du nombre et de la variété des traqueurs, et observer comment certaines méthodes sont tombées en désuétude tandis que d'autres gagnent en popularité. »

Ce projet représentait un véritable défi, car personne n'avait jusqu'alors collecté systématiquement d'informations sur le suivi au fil du temps. Pour pallier cette lacune, TrackingExcavator exploite les données d'une vaste archive de sites web en accès libre, connue sous le nom de Wayback Machine, qui conserve le contenu des sites web remontant jusqu'à 1996.

« Reconstituer le comportement de suivi à partir de la Wayback Machine est complexe, car cet outil a été conçu pour archiver le contenu web, et non les techniques de suivi », explique Kornfeld Simpson. « Nous avons dû développer des techniques pour extraire les informations de suivi des archives. Par exemple, nous avons collecté les cookies de suivi présents dans les en-têtes HTTP et le code JavaScript archivés, puis simulé le comportement de stockage des cookies du navigateur pour détecter les activités de suivi. »

On surveille de plus en plus le web

Cette reconstruction complexe a occupé une grande partie du temps de l'équipe au cours de l'année écoulée, mais le résultat final est un aperçu historique des tendances de suivi par des tiers pour les principaux sites Internet de 1996 à 2016. Ils ont quantifié l'augmentation du suivi Web par des tiers et illustré l'émergence de différentes techniques de suivi au fil du temps.

En 1996, le nombre moyen de requêtes tierces sur les principaux sites web était inférieur à un. Dix ans plus tard, ce nombre atteignait environ 1.5. Aujourd'hui, un site web populaire compte en moyenne au moins quatre traqueurs tiers qui analysent l'activité des utilisateurs. L'équipe souligne que ces chiffres sont probablement sous-estimés, car tous les sites web ne sont pas intégralement archivés.

Ils ont également constaté qu'aujourd'hui, les traqueurs individuels couvrent une part beaucoup plus importante du web.

Avant 2003, aucun outil de suivi ne pouvait observer le comportement de navigation sur plus de 5 % des sites les plus populaires. Ce chiffre est passé à 10 % en 2007. Aujourd'hui, de nombreux outils de suivi populaires couvrent au moins 20 % des sites, tandis qu'un tiers, Google Analytics, est présent sur plus d'un tiers des sites les plus fréquentés.

Ces résultats sont importants pour comprendre les effets du pistage sur la vie privée, car le suivi des utilisateurs sur un plus grand nombre de sites permet aux traqueurs de se faire une idée plus détaillée et plus précise de leur comportement.

Les défenseurs de la vie privée en alerte

Cette perspective historique sur 20 ans permet de comprendre clairement comment le suivi par des tiers a évolué au gré des différentes techniques, des progrès technologiques et de notre dépendance croissante à Internet. De manière générale, des tiers surveillent et collectent des informations. Notre réaction face à cette situation reste à déterminer.

« Sans replacer les pratiques de suivi actuelles dans l'histoire du web, il est impossible de savoir si les utilisateurs ont raison de s'inquiéter pour leur vie privée ou si les défenseurs de la vie privée crient au loup. De plus, nous ne pouvons pas évaluer l'impact des réactions médiatiques, des débats politiques ou des modifications des paramètres par défaut des navigateurs », explique Roesner.

« Nos travaux nous donnent les outils pour répondre à ces questions. Et nos conclusions suggèrent que le suivi en ligne devrait rester un sujet de préoccupation pour les défenseurs de la vie privée. »

Source: Université de Washington

Livres connexes

{amazonWS:searchindex=Livres;keywords=confidentialité sur Internet;maxresults=1}