Auteur : merakiki
Traduction : TechFlow
Depuis des décennies, l’application de la robotique est restée très limitée, principalement concentrée sur l’exécution de tâches répétitives dans des environnements industriels structurés. Cependant, l’intelligence artificielle (IA) d’aujourd’hui révolutionne le domaine de la robotique, permettant aux robots de comprendre et d’exécuter les instructions des utilisateurs tout en s’adaptant à des environnements dynamiques.
Nous entrons dans une nouvelle ère de croissance rapide. Selon Citibank, 1,3 milliard de robots seront déployés dans le monde d’ici 2035, leur champ d’application s’étendant des usines aux foyers et aux secteurs de services. Parallèlement, Morgan Stanley prévoit que le seul marché des robots humanoïdes pourrait atteindre 5 000 milliards de dollars d’ici 2050.
Bien que cette expansion libère un potentiel de marché considérable, elle s’accompagne également de défis majeurs en matière de centralisation, de confiance, de confidentialité et de scalabilité. Les technologies Web3, en soutenant des réseaux robotiques décentralisés, vérifiables, respectueux de la vie privée et collaboratifs, offrent des solutions transformatrices à ces problèmes.
Dans cet article, nous explorerons en profondeur la chaîne de valeur en constante évolution des robots IA, en nous concentrant particulièrement sur le domaine des robots humanoïdes, et nous révélerons les opportunités fascinantes issues de la convergence entre robots IA et technologies Web3.
Chaîne de valeur des robots IA
La chaîne de valeur des robots IA se compose de quatre couches fondamentales : matériel, intelligence, données et agents. Chaque couche s’appuie sur les autres, permettant aux robots de percevoir, raisonner et agir dans des environnements réels complexes.
Ces dernières années, la couche matérielle a connu des avancées significatives sous l’impulsion de pionniers du secteur tels que Unitree et Figure AI. Cependant, de nombreux défis clés subsistent dans les couches non matérielles, notamment le manque de jeux de données de haute qualité, l’absence de modèles fondamentaux universels, une compatibilité inter-appareils limitée et le besoin de calcul en périphérie fiable. Ainsi, les plus grandes opportunités de développement actuelles résident dans les couches intelligence, données et agents.
1.1 Couche matérielle : « le corps »
Aujourd’hui, la fabrication et le déploiement de « corps robotiques » modernes sont plus accessibles que jamais. Le marché compte déjà plus de 100 types différents de robots humanoïdes, notamment l’Optimus de Tesla, le G1 de Unitree, le Digit d’Agility Robotics et le Figure 02 de Figure AI.
Source : Morgan Stanley, « Humanoid 100 : la cartographie de la chaîne de valeur des robots humanoïdes »
Ces progrès sont dus à des percées technologiques dans trois composants clés :
-
Actionneurs : Agissant comme les « muscles » du robot, les actionneurs transforment les instructions numériques en mouvements précis. L’innovation dans les moteurs haute performance permet aux robots d’effectuer des mouvements rapides et précis, tandis que les actionneurs diélectriques élastomères (DEAs) conviennent aux tâches fines. Ces technologies améliorent considérablement la flexibilité des robots, par exemple l’Optimus Gen 2 de Tesla dispose de 22 degrés de liberté (DoF), tout comme le G1 de Unitree, tous deux affichant une flexibilité proche de celle de l’humain et des capacités de déplacement impressionnantes.
Source : Unitree présente son dernier robot humanoïde lors d’un match de boxe à la WAIC 2025 World Artificial Intelligence Conference
-
Capteurs : Des capteurs avancés permettent aux robots de percevoir et d’interpréter leur environnement via la vision, le LIDAR/RADAR, le toucher et l’audio. Ces technologies permettent une navigation sûre, des opérations précises et une perception contextuelle.
-
Calcul embarqué : Les CPU, GPU et accélérateurs IA (comme les TPU et NPU) embarqués traitent en temps réel les données des capteurs et exécutent les modèles IA, permettant une prise de décision autonome. Une connectivité fiable à faible latence assure une coordination sans faille, tandis qu’une architecture hybride edge-cloud permet de déléguer les tâches de calcul intensif si nécessaire.
1.2 Couche intelligence : « le cerveau »
À mesure que le matériel mûrit, l’attention du secteur se porte sur la construction du « cerveau du robot » : des modèles fondamentaux puissants et des stratégies de contrôle avancées.
Avant l’intégration de l’IA, les robots s’appuyaient sur des automatisations basées sur des règles, exécutant des actions préprogrammées sans intelligence adaptative.
Les modèles fondamentaux sont progressivement appliqués à la robotique. Cependant, les grands modèles de langage (LLMs) généralistes ne suffisent pas, car les robots doivent percevoir, raisonner et agir dans des environnements physiques dynamiques. Pour répondre à ces besoins, le secteur développe des modèles fondamentaux robotiques de bout en bout basés sur des stratégies. Ces modèles permettent aux robots de :
-
Percevoir : Recevoir des données multi-modales de capteurs (vision, audio, toucher)
-
Planifier : Estimer leur propre état, cartographier l’environnement et interpréter des instructions complexes, en reliant directement la perception à l’action pour réduire l’intervention humaine
-
Agir : Générer des plans de mouvement et émettre des commandes de contrôle pour une exécution en temps réel
Ces modèles apprennent des « stratégies » générales d’interaction avec le monde, permettant aux robots de s’adapter à diverses tâches et de fonctionner avec plus d’intelligence et d’autonomie. Les modèles avancés utilisent également un retour d’information continu, permettant aux robots d’apprendre de l’expérience et d’améliorer leur adaptabilité dans des environnements dynamiques.
Les modèles VLA relient directement les entrées sensorielles (principalement des données visuelles et des instructions en langage naturel) aux actions du robot, permettant à celui-ci d’émettre des commandes de contrôle appropriées en fonction de ce qu’il « voit » et « entend ». Parmi les exemples notables figurent RT-2 de Google, Isaac GR00T N1 de Nvidia, et π0 de Physical Intelligence.
Pour renforcer ces modèles, plusieurs approches complémentaires sont généralement intégrées, telles que :
-
Modèles du monde : Construire une simulation interne de l’environnement physique pour aider les robots à apprendre des comportements complexes, prédire les résultats et planifier des actions. Par exemple, Genie 3 de Google est un modèle du monde universel capable de générer des environnements interactifs d’une diversité inédite.
-
Apprentissage par renforcement profond : Permet aux robots d’apprendre des comportements par essais et erreurs.
-
Téléopération : Permet le contrôle à distance et la fourniture de données d’entraînement.
-
Apprentissage par démonstration (LfD)/apprentissage par imitation : Enseigne de nouvelles compétences aux robots en imitant les actions humaines.
Le schéma ci-dessous montre comment ces méthodes s’intègrent dans les modèles fondamentaux robotiques.
Source : Modèles du monde : le noyau de l’intelligence physique qui nous rapproche de l’AGI (World models: the physical intelligence core driving us toward AGI)
Quelques avancées open source récentes, telles que π0 de Physical Intelligence et Isaac GR00T N1 de Nvidia, marquent des progrès importants dans le domaine. Cependant, la plupart des modèles fondamentaux robotiques restent centralisés et propriétaires. Des entreprises comme Covariant ou Tesla conservent leur code et leurs jeux de données exclusifs, principalement en raison du manque de mécanismes d’incitation ouverts.
Ce manque de transparence limite la collaboration et l’interopérabilité entre plateformes robotiques, soulignant le besoin de normes on-chain pour le partage sécurisé et transparent des modèles, la gouvernance communautaire et des couches d’interopérabilité inter-appareils. Cette approche favorisera la confiance, la coopération et stimulera le développement du secteur.
1.3 Couche données : la « connaissance » du cerveau
Des jeux de données robotiques puissants reposent sur trois piliers : quantité, qualité et diversité.
Bien que le secteur ait fait des efforts pour accumuler des données, la taille des jeux de données robotiques existants reste très insuffisante. Par exemple, GPT-3 d’OpenAI a été entraîné sur 300 milliards de tokens, tandis que le plus grand jeu de données robotique open source, Open X-Embodiment, ne contient que plus de 1 million de trajectoires robotiques réelles couvrant 22 types de robots. Cela reste très loin de l’échelle nécessaire pour une généralisation robuste.
Certaines méthodes propriétaires, comme la collecte de données par Tesla via des data factories où les employés portent des combinaisons de capture de mouvement pour générer des données d’entraînement, permettent effectivement de recueillir davantage de données de mouvements réels. Cependant, ces méthodes sont coûteuses, la diversité des données est limitée et leur extension difficile.
Pour relever ces défis, la robotique exploite trois principales sources de données :
-
Données Internet : Leur volume est immense et leur extension facile, mais il s’agit principalement de données d’observation, dépourvues de signaux de capteurs et de mouvement. L’entraînement préalable de grands modèles visuels et linguistiques (comme GPT-4V et Gemini) sur ces données fournit des a priori sémantiques et visuels précieux. L’ajout d’étiquettes cinématiques aux vidéos permet de transformer les vidéos brutes en données d’entraînement exploitables.
-
Données synthétiques : Générées par simulation, elles permettent des expériences à grande échelle et couvrent des scénarios variés, mais ne reflètent pas entièrement la complexité du monde réel, ce qui est appelé le « sim-to-real gap ». Les chercheurs utilisent l’adaptation de domaine (augmentation de données, randomisation de domaine, apprentissage par adversaire) et le transfert sim-to-real pour combler cet écart, optimisant les modèles par itérations et les ajustant dans des environnements réels.
-
Données du monde réel : Bien que rares et coûteuses, elles sont essentielles pour le déploiement des modèles et pour combler l’écart entre simulation et réalité. Les données réelles de qualité incluent souvent des vues à la première personne (egocentric views), enregistrant ce que le robot « voit » lors des tâches, ainsi que des données de mouvement, enregistrant ses actions précises. Ces dernières sont généralement collectées par démonstration humaine ou téléopération, à l’aide de la réalité virtuelle (VR), de dispositifs de capture de mouvement ou d’enseignement tactile, garantissant que le modèle apprend à partir d’exemples réels précis.
Les recherches montrent que combiner données Internet, données réelles et données synthétiques pour l’entraînement robotique améliore significativement l’efficacité de l’entraînement et la robustesse des modèles, par rapport à l’utilisation d’une seule source (note TechFlow : la robustesse désigne la capacité d’un système à rester stable et performant en cas d’anomalies ou de situations dangereuses).
Par ailleurs, si augmenter la quantité de données est utile, la diversité des données est encore plus cruciale, notamment pour généraliser à de nouvelles tâches et morphologies robotiques. Pour atteindre cette diversité, il faut des plateformes de données ouvertes et un partage collaboratif, incluant la création de jeux de données inter-instances couvrant diverses morphologies robotiques, afin de stimuler le développement de modèles fondamentaux plus puissants.
1.4 Couche agents : « agents IA physiques »
La tendance vers des agents IA physiques s’accélère, ces robots autonomes étant capables d’agir de manière indépendante dans le monde réel. Les progrès de la couche agents dépendent du réglage fin des modèles, de l’apprentissage continu et de l’adaptation pratique à la morphologie unique de chaque robot.
Voici quelques opportunités émergentes pour accélérer le développement des agents IA physiques :
-
Apprentissage continu et infrastructure adaptative : Grâce à des boucles de rétroaction en temps réel et au partage d’expérience pendant le déploiement, les robots peuvent s’améliorer en continu.
-
Économie des agents autonomes : Les robots fonctionnent comme des entités économiques indépendantes — échangeant des ressources (puissance de calcul, données de capteurs) sur des marchés inter-robots et générant des revenus via des services tokenisés.
-
Systèmes multi-agents : Les plateformes et algorithmes de nouvelle génération permettent à des groupes de robots de se coordonner, collaborer et optimiser leur comportement collectif.
Convergence des robots IA et du Web3 : libérer un immense potentiel de marché
À mesure que les robots IA passent de la recherche au déploiement réel, plusieurs goulets d’étranglement de longue date freinent l’innovation et limitent la scalabilité, la robustesse et la viabilité économique de l’écosystème robotique. Ces obstacles incluent la centralisation des données et des modèles, le manque de confiance et de traçabilité, les restrictions de confidentialité et de conformité, ainsi que le manque d’interopérabilité.
2.1 Points douloureux rencontrés par les robots IA
-
Îlots centralisés de données et de modèles
Les modèles robotiques nécessitent des jeux de données vastes et diversifiés. Or, aujourd’hui, le développement des données et des modèles est très centralisé, fragmenté et coûteux, ce qui entraîne des systèmes cloisonnés et peu adaptatifs. Les robots déployés dans des environnements dynamiques réels souffrent souvent d’un manque de diversité des données et de robustesse des modèles.
-
Confiance, traçabilité et fiabilité
L’absence de registres transparents et auditables (y compris la provenance des données, le processus d’entraînement des modèles et l’historique des opérations robotiques) affaiblit la confiance et la responsabilité. Cela constitue un obstacle majeur à l’adoption des robots par les utilisateurs, les régulateurs et les entreprises.
-
Confidentialité, sécurité et conformité
Dans des applications sensibles comme la robotique médicale ou domestique, la protection de la vie privée est essentielle et doit respecter des réglementations strictes (telles que le RGPD européen). Les infrastructures centralisées peinent à soutenir une collaboration IA sécurisée et respectueuse de la vie privée, limitant le partage de données et freinant l’innovation dans les domaines réglementés ou sensibles.
-
Scalabilité et interopérabilité
Les systèmes robotiques rencontrent d’importants défis pour le partage des ressources, l’apprentissage collaboratif et l’intégration multi-plateformes et multi-morphologies. Ces limites fragmentent les effets de réseau et entravent le transfert rapide de compétences entre différents types de robots.
2.2 Robots IA x Web3 : des solutions structurelles pour des opportunités d’investissement
Les technologies Web3, grâce à des réseaux robotiques décentralisés, vérifiables, respectueux de la vie privée et collaboratifs, résolvent fondamentalement les problèmes ci-dessus. Cette convergence ouvre de nouveaux marchés d’investissement :
-
Développement collaboratif décentralisé : Par des réseaux incitatifs, les robots peuvent partager des données, co-développer des modèles et des agents intelligents.
-
Traçabilité et responsabilité vérifiables : La blockchain garantit l’immutabilité des sources de données et de modèles, de l’identité robotique et de l’historique des opérations, ce qui est crucial pour la confiance et la conformité.
-
Collaboration respectueuse de la vie privée : Des solutions cryptographiques avancées permettent aux robots de co-entraîner des modèles et de partager des insights sans exposer de données propriétaires ou sensibles.
-
Gouvernance communautaire : Les organisations autonomes décentralisées (DAOs) guident et supervisent les opérations robotiques via des règles et politiques on-chain transparentes et inclusives.
-
Interopérabilité inter-morphologies : Les cadres ouverts basés sur la blockchain favorisent la collaboration transparente entre différentes plateformes robotiques, réduisant les coûts de développement et accélérant le transfert de compétences.
-
Économie des agents autonomes : L’infrastructure Web3 confère aux robots une identité d’agent économique indépendant, leur permettant d’effectuer des transactions peer-to-peer, de négocier et de participer à des marchés tokenisés sans intervention humaine.
-
Réseaux d’infrastructure physique décentralisée (DePIN) : Le partage de ressources de calcul, de perception, de stockage et de connectivité peer-to-peer basé sur la blockchain renforce la scalabilité et la résilience des réseaux robotiques.
Voici quelques projets innovants qui stimulent ce secteur, illustrant le potentiel et les tendances de la convergence robots IA x Web3. Bien entendu, ceci est fourni à titre informatif et ne constitue pas un conseil en investissement.
Développement décentralisé de données et de modèles
Les plateformes Web3 incitent les contributeurs (combinaisons de capture de mouvement, partage de capteurs, upload visuel, annotation de données, voire génération de données synthétiques) à démocratiser le développement de données et de modèles. Cette approche permet de constituer des jeux de données et des modèles plus riches, diversifiés et représentatifs, bien au-delà de ce qu’une seule entreprise pourrait accomplir. Les cadres décentralisés améliorent également la couverture des cas limites, essentielle pour les robots opérant dans des environnements imprévisibles.
Exemples :
-
Frodobots : Un protocole de crowdsourcing de jeux de données réels via des jeux robotiques. Leur projet « Earth Rovers » — un robot de trottoir et un jeu mondial « Drive to Earn » — a permis de créer le jeu de données FrodoBots 2K, comprenant des images de caméra, des données GPS, des enregistrements audio et des données de contrôle humain, couvrant plus de 10 villes et totalisant environ 2 000 heures de conduite robotique téléopérée.
-
BitRobot : Plateforme incitative crypto développée par FrodoBots Lab et Protocol Labs, basée sur la blockchain Solana et une architecture subnet. Chaque subnet est un défi public, les contributeurs recevant des récompenses en tokens pour la soumission de modèles ou de données, stimulant la collaboration mondiale et l’innovation open source.
-
Reborn Network : Couche fondamentale pour un écosystème ouvert de robots AGI, fournissant la combinaison de capture de mouvement Rebocap, permettant à chacun d’enregistrer et de monétiser ses propres données de mouvement réelles, favorisant l’ouverture des jeux de données complexes pour robots humanoïdes.
-
PrismaX : Exploite la puissance des contributeurs communautaires mondiaux, garantit la diversité et l’authenticité des données via une infrastructure décentralisée, met en œuvre des mécanismes de validation et d’incitation robustes pour stimuler la croissance des jeux de données robotiques.
Preuve de traçabilité et de fiabilité
La blockchain offre une transparence de bout en bout et une responsabilité dans l’écosystème robotique. Elle garantit la traçabilité vérifiable des données et des modèles, l’authentification de l’identité et de la localisation physique des robots, et maintient un historique clair des opérations et de la participation des contributeurs. De plus, la validation collaborative, les systèmes de réputation on-chain et les mécanismes de validation basés sur la participation protègent la qualité des données et des modèles, évitant que des entrées de mauvaise qualité ou frauduleuses ne nuisent à l’écosystème.
Exemple :
-
OpenLedger : Une infrastructure blockchain IA permettant à la communauté de posséder, entraîner et déployer des modèles spécialisés sur des jeux de données communautaires. Son mécanisme « Proof of Attribution » garantit une récompense équitable aux contributeurs de données de haute qualité.
Tokenisation de la propriété, des licences et de la monétisation
Les outils de propriété intellectuelle natifs Web3 permettent la tokenisation et la licence de jeux de données spécialisés, de capacités robotiques, de modèles et d’agents intelligents. Les contributeurs peuvent intégrer des conditions de licence dans leurs actifs via des smart contracts, garantissant le paiement automatique de royalties lors de la réutilisation ou de la monétisation des données ou modèles. Cette méthode favorise un accès transparent et sans permission, créant un marché ouvert et équitable pour les données et modèles robotiques.
Exemple :
-
Poseidon : Couche de données décentralisée full-stack basée sur le protocole Story centré sur la propriété intellectuelle, fournissant des données d’entraînement IA légalement autorisées.
Solutions de protection de la vie privée
Les données générées dans des environnements tels que les hôpitaux, les chambres d’hôtel ou les foyers, bien que difficiles à obtenir publiquement, offrent une richesse contextuelle précieuse pour améliorer les modèles fondamentaux. Les solutions cryptographiques permettent de transformer ces données privées en actifs on-chain, traçables, composables et monétisables, tout en protégeant la vie privée. Les environnements d’exécution de confiance (TEEs) et les preuves à divulgation nulle de connaissance (ZKPs) permettent des calculs sécurisés et la validation des résultats sans révéler les données brutes. Ces outils permettent aux organisations d’entraîner des modèles IA sur des données sensibles distribuées tout en préservant la confidentialité et la conformité.
Exemple :
-
Phala Network : Permet aux développeurs de déployer des applications dans des TEEs sécurisés pour un traitement confidentiel de l’IA et des données.
Gouvernance ouverte et auditable
L’entraînement des robots repose souvent sur des systèmes propriétaires opaques et peu adaptatifs. Une gouvernance transparente et vérifiable est essentielle pour réduire les risques et renforcer la confiance des utilisateurs, des régulateurs et des entreprises. Les technologies Web3 permettent un développement collaboratif de l’intelligence robotique open source sous supervision communautaire on-chain.
Exemple :
-
Openmind : Une pile logicielle IA open source aidant les robots à penser, apprendre et collaborer. Ils ont proposé la norme ERC7777 pour établir un écosystème robotique vérifiable, axé sur la sécurité, la transparence et la scalabilité. Cette norme définit des interfaces standardisées pour gérer l’identité humaine et robotique, exécuter des ensembles de règles sociales, ainsi que l’enregistrement et la suppression des participants, clarifiant droits et responsabilités associés.
Dernières réflexions
À mesure que l’IA robotique converge avec les technologies Web3, nous entrons dans une nouvelle ère où les systèmes autonomes pourront collaborer et s’adapter à grande échelle. Les 3 à 5 prochaines années seront cruciales : l’évolution rapide du matériel stimulera l’émergence de modèles IA plus puissants, s’appuyant sur des jeux de données réels plus riches et des mécanismes de collaboration décentralisés. Nous prévoyons que des agents IA spécialisés émergeront dans des secteurs comme l’hôtellerie ou la logistique, créant d’immenses opportunités de marché.
Cependant, cette convergence entre IA robotique et cryptotechnologies pose aussi des défis. Concevoir des mécanismes d’incitation équilibrés et efficaces reste complexe et en constante évolution : le système doit récompenser équitablement les contributeurs tout en évitant les abus. La complexité technique est également un défi, nécessitant des solutions robustes et scalables pour intégrer de multiples types de robots. De plus, les technologies de protection de la vie privée doivent être suffisamment fiables pour gagner la confiance des parties prenantes, notamment lors du traitement de données sensibles. Enfin, l’environnement réglementaire évoluant rapidement exige une vigilance constante pour assurer la conformité dans différentes juridictions. Gérer ces risques et garantir des retours durables est essentiel pour stimuler le progrès technologique et l’adoption à grande échelle.
Restons attentifs à l’évolution de ce secteur, avançons ensemble par la collaboration et saisissons les opportunités qui émergent sur ce marché en pleine expansion.
L’innovation en robotique est un voyage qui se fait mieux à plusieurs :)
Enfin, je remercie Chain of Thought et leur ouvrage « Robotics & The Age of Physical AI » pour leur précieux soutien à mes recherches.