Le secteur des robots humanoïdes, soutenu par des milliards d'investissements, ferait face à un risque de bulle selon des figures éminentes comme Rodney Brooks (cofondateur d'iRobot) et Yann LeCun (chef scientifique IA de Meta).
Ils pointent l'incapacité des approches actuelles, notamment en matière de dextérité et d'intelligence générale, à justifier les promesses faites par des entreprises comme Tesla et Figure.
La course pour développer des robots humanoïdes autonomes et polyvalents est en plein essor. Des sociétés comme Figure, récemment valorisée à un niveau "étonnant" de 39 milliards de dollars après une levée de fonds dépassant le milliard, ou encore Tesla avec son projet Optimus, nourrissent des ambitions démesurées.
Le PDG de Figure, Mike Cagney, et Elon Musk, promettent un impact économique significatif d'ici cinq ans. Cependant, deux des esprits les plus respectés du domaine, le roboticien Rodney Brooks et le scientifique en chef de l'IA chez Meta, Yann LeCun, viennent de jeter une ombre sur cet optimisme financier.
Ils estiment que nous sommes dans la phase initiale du cycle de battage médiatique (ou cycle de la hype) pour les humanoïdes, juste au moment où l'intelligence artificielle générale commence à descendre de son pic. Cette dichotomie entre l'optimisme financier et les réalités technologiques est au cœur de leur mise en garde.
La Dextérité Humaine : Un Mur Infranchissable pour les Robots Actuels
Rodney Brooks, roboticien de renom ayant passé des décennies au MIT, a co-écrit un article expliquant "Pourquoi les humanoïdes d'aujourd'hui n'apprendront pas la dextérité".
Son constat est sans appel : les centaines de millions, voire les milliards, de dollars investis par les capitaux-risqueurs et les grandes entreprises technologiques pour leur entraînement sont dépensés pour une approche qui ne peut pas aboutir. Pour lui, croire qu'une dextérité humaine sera atteinte dans les décennies à venir est "de la pure fantaisie".
Le cœur du problème réside dans les mains. Les mains humaines disposent d'environ 17 000 récepteurs tactiles spécialisés. Selon Brooks, aucune technologie robotique actuelle n'est proche de cette capacité.
Alors que l'apprentissage automatique a transformé la reconnaissance vocale et le traitement d'image grâce à des décennies de données spécifiques, il n'existe pas de "tradition" équivalente pour les données de toucher dont les robots auraient besoin.
Les tentatives de certaines entreprises, comme Figure ou Tesla, d'enseigner la dextérité aux robots en leur montrant des vidéos d'humains accomplissant des tâches sont particulièrement visées par le cofondateur d'iRobot.
Il souligne que les efforts pour construire des mains de type humain, même s'ils existent depuis des décennies, n'ont pas encore résolu ce goulot d'étranglement fondamental lié à l'acquisition de données sensorielles riches.
L'IA Manquante : Le Secret Inavoué de l'Industrie
De son côté, Yann LeCun, lauréat du prix Turing et pionnier du deep learning, pointe du doigt l'intelligence même de ces machines. Le chef scientifique de Meta a averti lors du symposium inaugural de l'Impact de l'IA Générative du MIT que le "grand secret de l'industrie" est qu'aucune de ces entreprises n'a la moindre idée de la manière de rendre ces robots suffisamment intelligents pour être "généralement utiles".
Il précise que si des robots peuvent être entraînés pour des tâches spécifiques, comme dans le domaine manufacturier, le robot domestique nécessitera des percées majeures en IA.
LeCun estime que les grands modèles de langage (LLM) actuels ne sont pas la solution. Il rappelle qu'un enfant de quatre ans a emmagasiné autant de données visuelles "à haut débit" que le plus grand des LLM sur le texte public, soulignant que "nous n'atteindrons jamais l'intelligence de niveau humain en nous entraînant uniquement sur du texte".
Pour sortir de cette impasse, l'avenir réside dans ce qu'on appelle les modèles du monde (world models). Ces systèmes IA apprennent à comprendre le monde physique à partir de données sensorielles (vidéo).
L'objectif est de prédire l'état futur du monde après une action imaginée par l'agent. LeCun, qui mène des recherches sur des architectures comme le V-JEPA, est convaincu que ces modèles sont la clé pour que les robots accomplissent des tâches "sans entraînement" (zero shot).
Quand la Physique et la Réalité Rattrapent les Promesses Audacieuses
Au-delà de l'intelligence et de la dextérité, Rodney Brooks soulève un point souvent négligé : la sécurité. Les robots humanoïdes bipèdes, en raison de l'énergie massive qu'ils doivent déployer pour rester debout et marcher, représentent un danger non négligeable en cas de chute.
Cette problématique physique s'ajoute aux défis logiciels, incitant Brooks à prédire que dans une quinzaine d'années, les humanoïdes qui réussiront ressembleront peu aux modèles anthropomorphes actuels.
Ils seront probablement dotés de roues, de multiples bras et de capteurs spécialisés, abandonnant la forme humaine pour des raisons d'efficacité. L'alerte lancée par Brooks et LeCun force l'industrie à se poser la question fondamentale : le financement massif d'expériences d'entraînement coûteuses peut-il réellement conduire à une production de masse évolutive sans adresser d'abord les goulots d'étranglement de l'IA fondamentale ?
Le débat fait rage, et l'échéance des cinq prochaines années fixée par certains entrepreneurs servira de juge de paix sur la viabilité de la forme humanoïde actuelle.