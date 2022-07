Le groupe Meta (Facebook et Instagram) porte plainte contre Octopus et son outil Octoparse d'extraction de données web.

Aux États-Unis, le groupe Meta intente une action en justice contre une société dénommée Octopus (Octopus Data). Elle est présentée comme la filiale américaine d'une entreprise chinoise Shenzhen Vision Technology et revendique un million de clients.

Depuis au moins mars 2015, Meta explique que Octopus exploite un service Octoparse conçu pour récupérer des profils de comptes d'utilisateurs et d'autres informations de divers sites web. Parmi ceux-ci, Amazon, eBay, Twitter, Yelp, Google, Target, Walmart, Indeed, LinkedIn, ainsi que Facebook et Intagram qui sont dans le giron de Meta.

Meta pointe ainsi du doigt du scraping avec une collecte automatisée de données qui va à l'encontre de ses conditions de service. " Moyennant paiement, les clients de Octopus peuvent lancer des attaques de scraping à partir de sa plateforme cloud ou faire appel à Octopus pour le faire directement sur des sites web. "

Action contre l'industrie du scraping

" Après avoir payé pour l'accès au logiciel de scraping, les clients ont compromis eux-mêmes leurs comptes Facebook et Instagram en fournissant leurs informations d'authentification à Octopus ", écrit Meta. " Octopus a conçu le logiciel pour récupérer les données accessibles à l'utilisateur lorsqu'il est connecté à son compte. "

" Des entreprises comme Octopus font partie d'une industrie émergente du scraping qui fournit des services d'automatisation à n'importe quel client. […] Cette industrie met le scraping à la disposition d'individus et entreprises qui n'auraient pas autrement les capacités de le faire. "

Octoparse aurait mis en place diverses fonctions pour empêcher une détection de scraping et blocage par Facebook et Instagram. Meta cherche à obtenir une injonction permanente contre Octopus qui de son côté met en avant un outil pour extraire des données web sans coder et transformer des pages web en feuilles de calcul structurées.