Avec Predictive World Ubisoft prédit votre date de mort
Qu’est-ce qu’un algorithme puissant et omniscient peut prédire à votre sujet, en se basant sur votre vie digitale, les informations publiques et les Likes sur Facebook ?
A présent, en tant qu’humain #1067494, j’ai personnellement trouvé la réponse.
Ainsi, je me suis connecté avec un environnement en ligne appelé Predictive World : une interface qui traite les données utilisateurs, et qui a été développée récemment par l’éditeur de jeux vidéo Ubisoft.
Afin de participer, vous avez le choix entre laisser le programme avoir accès à votre profil Facebook (pour pouvoir gagner en précision en matière de profiling), ou bien donner vous-même un certain nombre d’informations basiques à votre sujet.
L’éditeur de jeux vidéo a développé Predictive World en collaboration avec le Psychometrics Centre de l’Université de Cambridge.
En se basant sur leurs recherches, et l’imagination aidant, l’outil peut alors générer des prédictions précises sur qui vous êtes, combien de bières vous engloutissez chaque semaine, votre poids, votre taille, combien de cigarettes vous fumez, et le jour de votre mort, parmi tant d’autres variables disponibles.
Le développeur de jeux vidéo s’était déjà plongé dans l’univers dangereux du Big Data, et des algorithmes de prédiction en les prenant comme l’un des thèmes du jeux d’aventure et d’action Watch Dogs 2 : un jeu dans lequel le héros Marcus Holloway est accusé à tort d’être le suspect principal dans une affaire criminelle alors qu’il était innocent, et ce par un système de collecte et d’analyse des données de tous les habitants de la ville.
Ubisoft nous assure qu’il s’agit justement du moment où la fiction rejoint la réalité. Predictive World montre tout simplement comment des données apparemment triviales à notre sujet, peuvent être compilées et traitées, afin de dégager des profils et des schémas :
Chaque jour, nous laissons derrière nous un volume de données représentant presque 5 milliards de Go. Ces informations proviennent de beaucoup de sources différentes : des transactions en ligne bien évidemment, des signaux GPS, des Likes sur les réseaux sociaux, des messages échangés, et même des tickets de stationnement, des distributeurs de boissons, etc.
Ces données sont ensuite vendues, achetées, et analysées à différents niveaux, afin de créer des probabilités solides et précises, sur qui nous sommes et ce que nous projetons de faire.
Comme nous l’avons déjà écrit sur notre blog, les Big Data couvrent beaucoup de catégories différentes.
Par exemple, il ne s’agit pas seulement des photos que vous avez prises de votre chat.
En effet, il s’agit plutôt d’une collection de photos de millions de chats différents, organisée par lieu géographique, avec un niveau de précision pouvant atteindre l’adresse et le nom de la rue. On peut d’ailleurs y voir votre contribution si vous avez rendu votre API publiquement disponible, en prenant votre photo au niveau des sites tels que Flickr, Twitpic, Instagram ou similaire.
Vous pouvez prendre ce scénario et le répliquer sur tous les sites où nos données sont collectées : les caméras de lecture automatique de plaques d’immatriculation (LAPI) sont encore un autre exemple de suivi, étant donné que nos plaques restent identiques, et ce même si nous changeons d’endroit.
En réalité, la DEA (Drug Enforcement Administration aux Etats-Unis) a développé ces dernières années une base de données regroupant la lecture des plaques minéralogiques au niveau national, et la partage avec les autorités locales et fédérales, sans indication précisant si cette dernière est accessible par la justice.
Il existe également cette base de données géante des bornes d’accès Wi-Fi, établie par les voitures Google StreetView, que Google utilisait pour aider et soutenir ses services de géolocalisation.
Predictive World est loin d’être le premier outil internet à se servir de notre vie digitale pour nous montrer comment ces acteurs majeurs des Big Data aboutissent à la création de profils. Ces derniers peuvent être utilisés, par exemple, dans le cas d’une candidature. En effet, nous savons qu’aujourd’hui la plupart des recruteurs examinent minutieusement nos profils sur les réseaux sociaux avant de décider de nous appeler, ou de nous convoquer à un entretien.
Un exemple d’outil utilisé pour montrer le volume d’informations que nous laissons derrière nous était un site appelé “We know what you’re doing”. Il collectait les choix que nous faisions en matière de contenu sur les réseaux sociaux, avec l’accord de Facebook, et par le biais de son API Graph.
Un autre s’appelait “Please Rob Me”. Lorsqu’il a été lancé en 2010, il utilisait les données d’enregistrement provenant du réseau social géolocalisé Foursquare, et qui ensuite était envoyées vers Twitter.
Lorsque ces informations étaient devenues publiquement disponibles sur Twitter, cela permettait en théorie à un voleur de savoir quand vous vous trouviez loin de votre domicile.
Cela n’était certainement que théorique lorsqu’ils ont lancé ce site, mais cette possibilité est devenue rapidement très pratique. Un groupe de voleurs a mis cette théorie en pratique en rentrant par effraction dans le domicile d’amis, après avoir lu les mises à jour de statut sur Facebook, afin de savoir quand ils ne seraient pas chez eux.
Mais revenons à Predictive World. Après votre inscription (je l’ai autorisé à avoir accès à mon profil Facebook, afin de voir comment il s’en sortait quand on lui mâchait le travail), il collecte les données telles que le genre, l’âge, et les pages que vous avez aimées, et combine ces informations avec des données démographiques locales, afin de générer un profil de qui vous êtes.
Comment a-t-il réussi ?
Eh bien tous ces détails peuvent être récupérés à votre sujet sur Facebook.
Ouah, mais ne peuvent-ils pas se tromper ?
Predictive World pense que je suis grande, grosse, avec 12.8% de chance de fumer de la marijuana, que je gagne le double du salaire minimum, que je suis appliquée à hauteur de 43%, et que je mourrai à l’âge de 84.9 ans.
Faux. Faux. Faux. Faux !
Ainsi, recadrons la question initiale : comment un algorithme puissant, que les institutions et la police risquent de consulter afin d’en savoir plus, mais qui voit plutôt la réalité au travers de lunettes cassées avec de plus une myopie sévère, pourrait deviner qui vous êtes en examinant votre vie digitale ?
Dans mon cas, il a deviné que je mesurais 10 cm de plus que ma taille réelle, que je pesais 22 kilos de plus que la réalité, que je gagnais 31% de mon salaire actuel, que je buvais 2 pints de bière par semaine (vous plaisantez, je suis allergique au gluten !), et que la probabilité que je fume de marijuana était de 12.8%.
Quel est l’impact de toute cette série d’inexactitudes, parmi tant d’autres, peut avoir sur la prédiction finale ?
En réalité, l’impact est important. En effet, comme le montre Predicitve World : mon espérance de vie monte de 84.9 à 95.1 ans après avoir corrigé toutes ces variables.
Alors qu’il est facile de voir où les Big Data peuvent récupérer des informations concrètes à notre sujet, telles que notre âge ou notre géolocalisation sur Facebook (si nous avons rendu ces données publiques et que nous avons dit la vérité), il est par contre plus difficile de comprendre comment ces Big Data peuvent deviner ces choses plus subjectives, telles que notre niveau de satisfaction dans la vie.
Sur ce point, Predictive World sera content de vous en dire plus. En effet, vous pouvez cliquer sur toute une série de rayons émanant d’un graphique circulaire plutôt intriguant, afin d’obtenir les détails sur la manière avec laquelle une variable en particulier est extraite.
Par exemple, les personnes qui aiment les mêmes choses que moi sur Facebook, ont tendance à se décrire eux-mêmes comme aimant la vie en général. Mais tout ne peut pas se résumer aux Likes. En effet, mon niveau de satisfaction est passé de 63% à 94.13%, après avoir précisé à l’outil que je n’étais pas aussi démunie qu’il le pensait initialement.
Cela ne se résume pas effectivement uniquement aux Likes. Predicitive World est basé sur un algorithme développé par le Psychometrics Centre, en utilisant une large gamme de données sources, telles que des données psychologiques et d’autres provenant des réseaux sociaux. L’échantillon concerne plus de 6 millions de participants à cette recherche, avec une infrastructure sur-mesure conçue pour ce projet particulier, et contenant plus de 6.3 milliards d’observations.
Ceci permet à Predicitve World de visualiser les relations entre les genres, les salaires, les lieux et les risques de crimes, la personnalité et la longévité, et bien plus encore.
En collectant et en traitant les empreintes numériques des utilisateurs, et en combinat les prédictions avec des données ouvertes, le système est capable de faire 70 prédictions à partir des données récoltées concernant un seul individu. Ces prédictions vont des traits de caractère et d’intelligence, à l’espérance de vie, en passant même par la tendance à courir des risques financiers.
Mais est-ce vraiment important que ces prédictions soient précises ?
Le plus important est de voir que ce genre d’informations peut être, et est, utilisé pour construire des profils détaillés de nous tous.
Récemment, par exemple, avant que Facebook ait annulé son projet, un assureur de voitures britannique allait utiliser les données de jeunes conducteurs, afin d’analyser leurs personnalités et faire des chiffrages en fonction de leurs profils.
Predictive World pose cette question : “est-ce que je veux que ma compagnie d’assurance détienne ce genre d’informations à mon sujet ?”.
Non, il est clair que je ne le veux pas !
Je ne sais pas ce qui est pire : avoir une compagnie d’assurance qui pense que je vais mourir à 85 ans, n’ayant ainsi pas peur de se ruiner en m’offrant une protection santé sur le long terme, ou bien une autre qui découvre que je suis diabétique (Predicitive World ne semble pas pouvoir savoir ceci, mais s’il le pouvait, il l’aurait fait en se basant sur l’espérance de vie moyenne des diabétiques que j’ai déjà dépassée), ou enfin avoir une compagnie d’assurance qui construit un profil plus précis et sérieux à votre sujet, afin de pouvoir se débarrasser de moi lorsqu’elle découvrira que j’ai du diabète.
Je ne sais pas si je veux aider Predictive World, une compagnie d’assurance ou une banque, pour qu’ils aient un profil plus précis me concernant. J’ai plutôt tendance à garder un profil Facebook marrant et assez vague.
Et vous que comptez-vous faire ?
Follow @ SophosFrance //platform.twitter.com/widgets.js
Partagez Quand allez-vous mourir ? Ubisoft vous répond grâce à Predictive World ! : http://wp.me/p2YJS1-365
Billet inspiré de When are you going to die? Ubisoft tool uses Facebook data to tell you, par Lisa Vaas, Sophos NakedSecurity.