Plier du linge, essuyer une table, ou encore empiler des cubes en bois : ce sont les tâches répétitives confiées à des centaines de « cyber-travailleurs » à travers la Chine. Ces opérateurs, souvent des étudiants en informatique, portent des exosquelettes et des casques de réalité virtuelle pour que leurs gestes soient enregistrés avec une précision millimétrique. L'objectif est de générer des ensembles de données complexes, incluant les mouvements des articulations et les rotations du corps, qui ne peuvent être ni trouvées sur internet ni produites de manière synthétique. Ces données sont jugées essentielles pour rendre les robots plus « intelligents » et autonomes dans des environnements humains.
Pourquoi une telle stratégie de collecte de données a-t-elle été mise en place ?
La Chine a fait de la robotique une priorité stratégique nationale pour plusieurs raisons. Le gouvernement voit dans cette technologie une solution pour pallier la pénurie de main-d'œuvre et pour consolider l'avance technologique du pays face à ses concurrents, notamment les États-Unis. Pékin a donc massivement investi pour créer une infrastructure dédiée à cet apprentissage, avec plus de 40 centres de collecte de données annoncés, dont la moitié serait déjà opérationnelle. Ces usines de données sont financées par l'État et gérées par des entreprises locales de robotique.
Cette approche s'inspire du succès des grands modèles de langage, qui ont démontré que des quantités massives de données sont nécessaires pour développer des intelligences artificielles performantes. Des entreprises américaines comme Tesla utilisent une méthode similaire pour former leurs robots humanoïdes Optimus, mais à une échelle bien plus réduite. En Chine, des centres immenses, comme celui de la banlieue de Pékin, recréent des environnements spécifiques tels qu'une chaîne de montage automobile, une maison connectée ou un établissement de santé pour personnes âgées afin de former les robots à des scénarios concrets.
Le robot Optimus de Tesla
Quels sont les risques et les limites de cette méthode ?
Malgré l'enthousiasme et les investissements colossaux, cette méthode d'entraînement présente des défis majeurs. Le processus de collecte est décrit comme extrêmement lent et fastidieux. Ken Goldberg, chercheur en robotique à l'université de Californie à Berkeley, souligne que même avec des centaines de personnes, il faudra « beaucoup de temps pour obtenir suffisamment de données ». La rentabilité de ces usines de données reste donc incertaine, d'autant que le débat persiste parmi les experts pour savoir si c'est réellement la meilleure voie vers des robots pleinement intelligents.
L'afflux d'investissements a également créé une surchauffe du secteur. En novembre dernier, la puissante Commission nationale du développement et de la réforme a tiré la sonnette d'alarme, mettant en garde contre une spéculation excessive et les risques d'une « bulle » qui pourrait éclater avant même que des débouchés commerciaux concrets n'aient vu le jour. Le marché mondial est pourtant prometteur, estimé à 38 milliards de dollars d'ici 2035, mais la route vers la commercialisation à grande échelle semble encore longue et semée d'incertitudes.