Data scraping : guerre entre LinkedIn et hiQ Labs

Réseaux sociaux

Nous assistons à un procès opposant le géant des réseaux sociaux professionnels, LinkedIn, à une startup de la Silicon Valley appelée hiQ Labs. L’enjeu est le « data scraping », réalisé par hiQ et contesté par LinkedIn qui désire lancer un service similaire ! Quel est le risque vis à vis de l’interdiction d’accès à des données publiques ?

hiQ Labs

Il s’agit d’une bataille juridique qui a amèrement divisé l’opinion au sein des entreprises américaines, ses détracteurs estiment que l’impact sur la concurrence numérique pourrait être négatif.

Il s’agit de l’avenir d’internet, et il n’est pas question ici de la neutralité du net, étonnamment, mais d’une sorte de face-à face qui promet d’être historique : à savoir, le procès opposant le géant des réseaux sociaux professionnels, LinkedIn, à une minuscule startup de la Silicon Valley appelée hiQ Labs.

Le dernier développement fait état d’une alliance de l’EFF (Electronic Frontier Foundation), du moteur de recherche DuckDuckGo, et d’Internet Archive, qui a pesé dans la balance du côté de hiQ Labs. En effet, la semaine dernière, en classant le dossier et du coup en soutenant la startup, LinkedIn s’est vu reprocher d’essayer « d’entraver l’accès à l’information en ligne ».

Mais pourquoi ? Eh bien, comme toujours, l’argent, le pouvoir et pouvoir prendre une longueur d’avance !

LinkedIn, bien sûr, est une plateforme de réseautage professionnelle, tandis que hiQ Labs est une entreprise qui gagne de l’argent en faisant du « scraping » au niveau des profils publics des membres de LinkedIn, afin d’alimenter deux systèmes analytiques, Keeper et Skill Mapper.

Keeper peut être utilisé par des employeurs pour repérer les employés qui seraient susceptibles de quitter l’entreprise, tandis que Skill Mapper synthétise les compétences et la situation des employés actuels et futurs.

Pendant plusieurs années, ce système n’a posé aucun problème, jusqu’à ce qu’en 2016, LinkedIn décide de proposer un service similaire, envoyant à hiQ Labs et à d’autres acteurs du secteur des lettres de cessation et d’abstention, bloquant les bots qui scannaient ses pages.

LinkedIn a avancé deux arguments principaux :

  1. hiQ Labs réalise du « scraping » sur des données appartenant à LinkedIn, et représente une menace pour la vie privée de ses membres.
  2. hiQ Labs utilise, pour ce faire, des programmes bot-scraping qui ont des effets négatifs.

De façon controversée, LinkedIn a invoqué le fameux Computer Fraud and Abuse Act de 1986 (s’étant soi-disant inspiré du film hollywoodien WarGames) dans le cadre de cette affaire, qui est en réalité une loi criminelle anti-piratage, qui figurait également dans un célèbre procès que Facebook a intenté en 2009 contre Power Ventures.

Plus récemment, des problèmes similaires ont émergé suite à la plainte de la compagnie aérienne Ryanair contre Expedia pour un prétendu « scraping » de tarifs.

Apparemment, le data scraping est devenu une activité technologique en plein essor, mais il divise de plus en plus le secteur d’un point de vue idéologique.

Certains estiment que LinkedIn essaie simplement de bloquer un concurrent qui veut accéder à des données publiques, que LinkedIn d’ailleurs affiche sans les posséder réellement. Le fait de laisser faire LinkedIn, en utilisant une loi aussi draconienne que la CFAA, menacerait tout simplement la concurrence, et peut-être même (en écho aux arguments sur la neutralité du net) l’internet ouvert !

Selon l’EFF :

La position de LinkedIn aura également un impact sur les journalistes, les chercheurs et les organismes de surveillance, qui (de plus en plus) se reposent sur des outils automatisés, tels que des scrapers, pour les aider dans leur travail, dont une grande partie représente une activité protégée par le premier amendement.

D’autres voient des sociétés telles que hiQ Labs comme des parasites. Selon Rammi Essaid de Distil Networks, permettre une victoire de hiQ Labs dans cette affaire pourrait très bien légitimer, par inadvertance, les « bad bots », qui mènent des activités nuisibles telles que :

Des attaques par déni de service, le minage de données concurrentielles, la fraude en ligne, le détournement de compte, le vol de données, le vol de propriété intellectuelle, l’analyse de vulnérabilité non autorisée, le spam et la fraude publicitaire numérique.  

A l’heure actuelle, hiQ Labs est sur le point de gagner la bataille juridique, et en août dernier avait obtenu un jugement provisoire de la cour demandant à LinkedIn de cesser d’interdire l’accès à ses bots-scraping. La prochaine étape dans cette affaire aura lieu en mars 2018, lorsque le tribunal recueillera les arguments verbaux.

Piégé au milieu de cette bagarre, des millions d’utilisateurs de LinkedIn ont créé et construit un profil, qu’ils espèrent leur donnera une meilleure visibilité professionnelle.

Le fait que ces informations inexactes ou périmées, soient extraites par un tiers en secret, d’une manière qui pourrait les désavantager, n’était probablement pas le scénario qu’ils avaient imaginé en rejoignant le réseau.

Cependant, comme hiQ Labs ne fait qu’accéder à des informations récupérables par tout le monde, cette issue est inévitable de toutes les façons !

Pour finir, la perspective plutôt inquiétante n’est pas vraiment cette bagarre entre LinkedIn et hiQ où l’utilisateur est le produit, mais bien quel produit va-t-il devenir !



Billet inspiré de LinkedIn accused of chilling access to information online, sur Sophos nakedsecurity.

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion /  Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion /  Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion /  Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion /  Changer )

w

Connexion à %s

This site uses Akismet to reduce spam. Learn how your comment data is processed.