Story de la semaine / Intelligence artificielle / 18/05/2026

Robots humanoïdes : l’étonnante industrie derrière leur entraînement

Par Peter Milton

Pour rendre les futurs robots humanoïdes autonomes, il faut que l’intelligence artificielle apprenne à "voir" et à se repérer dans notre environnement. Et pour cela, des humains regardent à sa place…

Entraînement d'un robot humanoïde, dans un centre commercial fictif, aménagé au sein d'une usine en Chine (photo Stringer/Imaginechina/AFP).

On a tous déjà, souvent sans même le savoir, participé à l’entraînement des intelligences artificielles. Lorsque, pour pouvoir valider l’inscription à un site ou une transaction, il faut cliquer sur un vélo, une borne à incendie ou recopier un code composé de chiffres et de lettres emmêlés, c’est une façon de participer à l’entraînement des programmes d’IA. C’est une façon d’être leurs yeux et de traduire ce que l’on voit. Ces quelques clics, que l’on fait occasionnellement, certains les répètent à longueur de journée, des centaines de fois, parfois des milliers, contre quelques dollars. Comme cet homme, derrière un écran, qui regarde une image d’un chien qui montre les dents. Menace ou jeu ? Il hésite à peine et tranche en quelques secondes, cliquant sur menace, avant de passer à l’image suivante. Sans ce geste, qui ne nécessite pas de qualification particulière, les différents modèles d’IA ne fonctionneraient pas.

Transformation et classification des données

En effet, une intelligence artificielle n’apprend pas seule. Avant de produire la moindre réponse, ce programme doit être entraîné. Un entraînement qui ne repose pas uniquement sur des volumes de données, mais sur leur transformation : elles doivent être triées, corrigées, évaluées par des humains. Et ce travail ne disparaît pas une fois le modèle déployé, il devient juste invisible. Mais il est loin d’être anecdotique : la Banque mondiale estime entre 154 et 435 millions le nombre de travailleurs actuellement engagés dans des activités de microtâches en ligne, soit entre 4,4 % et 12,5 % de la main-d’œuvre mondiale. La fourchette est large, mais elle importe peu, l’ordre de grandeur dit l’essentiel. Car même dans sa borne basse, elle décrit un volume qui dépasse celui de plusieurs grandes économies européennes réunies.

Une partie de cette main-d’œuvre intervient directement dans le fonctionnement des modèles : identification d’objets dans des images, classification de textes, filtrage de contenus, évaluation de réponses. Elle exerce ce que la machine ne sait pas encore faire seule : le jugement. Ce travail n’assiste pas l’intelligence artificielle, il la rend possible. Ce que l’on observe n’est donc pas un ensemble de tâches dispersées, ni un simple support technique, ni une simple étape provisoire, c’est une véritable chaîne de production. Et dans cette chaîne d’un nouveau genre, le jugement humain devient une matière première. Il est collecté, fragmenté, standardisé, puis intégré dans des systèmes vendus comme des produits technologiques à forte valeur ajoutée. Le mécanisme n’a rien d’inédit, il est même au cœur de toutes les grandes filières industrielles : on extrait, on transforme, on valorise. Ce qui change n’est pas la logique, c’est ce qui est extrait : notre matière grise.

La géographie confirme cette structure. Environ 51 % de cette main-d’œuvre se situe en Asie de l’Est et dans le Pacifique, le reste se concentrant en Asie du Sud et en Afrique subsaharienne. Cette carte est immédiatement reconnaissable : c’est celle des chaînes industrielles mondialisées, du textile à l’électronique, telles qu’elles se sont construites depuis plusieurs décennies. L’intelligence artificielle n’a pas inventé une nouvelle organisation du travail, mais a réactivé une organisation existante. La question devient alors économique : où se crée la valeur et où est-elle captée ?

Microtâches pour microsalaire

Un cas documenté en mesure la structure. Dans la collaboration entre OpenAI et Sama au Kenya, environ 12,50 dollars de l’heure étaient facturés par travailleur. Les travailleurs eux-mêmes déclaraient percevoir autour de 2 dollars. Ratio : un pour six. Ce chiffre n’est pas isolé : une étude académique portant sur 3,8 millions de tâches réalisées sur Amazon Mechanical Turk - la plateforme de microtâches d’Amazon, qui compte environ 500 000 travailleurs actifs - établit un salaire médian du même ordre, autour de 2 dollars de l’heure, avec seulement 4 % des travailleurs dépassant le salaire minimum fédéral américain.

Robot humanoïde répétant différents scénarios d'activités de la vie quotidienne, dans un centre d'entraînement pour robots, au sein du Suzhou Embodied Artificial Intelligence Robotics Innovation Center, à Suzhou, en Chine (Photo Li Bo/Xinhua/AFP).

La valeur ne reste donc pas là où le travail est effectué : elle remonte la chaîne. Le marché mondial du labeling de données est estimé entre 4 et 6 milliards de dollars en 2025, avec une croissance annuelle projetée supérieure à 25 %. Scale AI, l’un des opérateurs centraux de ce secteur, a vu son chiffre d’affaires tripler en deux ans, de 290 millions de dollars en 2022 à 870 millions en 2024. En juin 2025, Meta a investi plus de 14 milliards de dollars pour en acquérir 49 %, valorisant l’entreprise à 29 milliards, soit plus du double de sa valeur de l’année précédente. Un pari sur une ressource… et sur le fait qu’elle restera rare. La suite immédiate a toutefois été plus turbulente : plusieurs clients majeurs, dont Google et OpenAI, ont réduit leurs engagements avec Scale AI dans les semaines suivant l’opération, révélant la fragilité structurelle d’un modèle trop concentré sur quelques donneurs d’ordres.

Robotisation et déplacement du travail humain

C’est là que le récit dominant se fissure. L’intelligence artificielle est généralement présentée comme une technologie d’automatisation, appelée à réduire le besoin de travail humain et à en faire baisser le coût. Mais les faits observables décrivent une dynamique différente : le développement des modèles s’accompagne d’une demande massive de travail humain. Un travail qui n’est non pas supprimé, mais déplacé, fragmenté, rendu invisible par le produit final. Et cette structure ne se limite pas aux modèles actuels. Les robots humanoïdes développés par des entreprises comme Tesla, Figure AI ou Agility Robotics nécessitent, eux aussi, de suivre un apprentissage à partir de données issues de comportements humains : gestes, déplacements, interactions physiques avec des objets. Avant d’agir, la machine doit observer. Et ce qu’elle observe, ce sont des humains.

Sauf que, désormais, on ne demande plus simplement à des humains de cliquer sur des photos ou identifier des objets. On les paye pour se filmer en train de réaliser des tâches du quotidien, de faire tout ce que l’on fait sans vraiment y réfléchir, par automatisme : se servir un café, refaire son lit, passer l’aspirateur ou le balai, repasser une chemise. Des étudiants, quand ils rentrent chez eux, se fixent un smartphone sur le front, comme une lampe frontale, pour filmer en "vue subjective" tout ce qu’ils font et transmettre les images aux entreprises qui développent des robots. Car si l’IA est désormais capable de réaliser des tâches infiniment complexes, "in silico", dans les circuits et puces de data centers, se déplacer dans la "vraie vie" pose encore de nombreux problèmes. Cuisiner ce n’est pas simplement suivre une recette. Il faut prendre en compte son environnement : la place dont on dispose sur un plan de travail, la qualité des ingrédients, la puissance du four… et des dizaines d’autres facteurs qu’il n’est pas toujours possible de mettre en équation ou de programmer via des capteurs. Comme si l’automatisation des tâches qui semblent les plus simples était en réalité la chose la plus complexe.

La main du robot Optimus, de Tesla (photo Tesla).

Donnée synthétique vs expertise humaine

La question de l’avenir de cette dépendance mérite d’être posée clairement. La donnée synthétique, celle générée par les modèles eux-mêmes, monte en puissance et absorbe déjà une part croissante du travail répétitif effectué par les humains, notamment les tâches d’entraînement les plus standardisées. Le travail de masse, celui du clic répété, est effectivement menacé. Mais ce mouvement déplace la dépendance des IA aux humains, il ne la supprime pas. En effet, à mesure que les modèles progressent, les tâches qui résistent à l’automatisation sont précisément les plus complexes : jugements ambigus, cas limites, situations que la machine ne sait pas encore résoudre seule ou comportements liés à la connaissance et la perception de son environnement. Le volume recule, mais l’exigence de qualité se déplace vers le haut.

Sources

Banque mondiale. The Global State of Online Work, rapport sur les travailleurs de l’économie numérique. Estimation de 154 à 435 millions de travailleurs engagés dans des micro-tâches en ligne, représentant 4,4 % à 12,5 % de la main-d’œuvre mondiale. Données sur la concentration géographique (51 % en Asie de l’Est et Pacifique).
CBS News. Enquête documentée sur la collaboration OpenAI / Sama au Kenya. Tarif facturé : 12,50 dollars de l’heure par travailleur. Rémunération déclarée par les travailleurs : environ 2 dollars de l’heure. Sama employait plus de 3 000 travailleurs au Kenya dans le cadre de ce contrat.
Hara et al. (2018). A Data-Driven Analysis of Workers' Earnings on Amazon Mechanical Turk, CHI Conference on Human Factors in Computing Systems. Étude portant sur 3,8 millions de tâches réalisées par 2 676 travailleurs. Salaire médian établi à environ 2 dollars de l’heure. Seulement 4 % des travailleurs dépassent le salaire minimum fédéral américain de 7,25 dollars.
Mordor Intelligence / Grand View Research / Coherent Market Insights. Estimations convergentes du marché mondial du data labeling : entre 4 et 6 milliards de dollars en 2025, avec un taux de croissance annuel composé supérieur à 25 % selon les cabinets.
Scale AI. Données financières publiques : chiffre d’affaires d’environ 290 millions de dollars en 2022, 870 millions en 2024. Projection de 2 milliards de dollars pour 2025, dans un contexte post-acquisition marqué par des départs de clients majeurs.
TechCrunch / Reuters / Wikipedia. Investissement de Meta dans Scale AI : plus de 14 milliards de dollars pour une participation de 49 %, valorisant l’entreprise à 29 milliards de dollars (juin 2025). Doublement de la valorisation en moins d’un an.
Projections sectorielles. Plusieurs cabinets d’analyse (dont Gartner, Grand View Research, Mordor Intelligence) anticipent une montée en puissance significative de la donnée synthétique dans les données d’entraînement au cours des prochaines années, sans que les trajectoires précises fassent consensus.

Précédentes Stories de la semaine

Protoxyde d’azote : à qui profite le "crime" ?
27/07/2026

C’est devenu une routine pour les éboueurs. Les lendemains de fête ou de célébration nationale, ils ramassent par centaines les bonbonnes d’acier aux couleurs…

Les reconversions réussies des anciens ministres du numérique
20/07/2026

Connaissez-vous Anne Le Hénanff ? Cette ancienne députée du Morbihan est l’actuelle Ministre déléguée auprès du ministre de…

La deuxième vie des généraux
13/07/2026

Le général Hervé Wattecamps a accepté une mission impossible. Organiser en quatre mois, montre en main, la visite du Pape Léon XIV à Paris, les 25 et…

Voir plus d'articles