La nuova idea di Musk: Optimus potrebbe imparare a piegare i vestiti guardando dei video
Tesla sta fornendo al robot umanoide Optimus un "nuovo materiale didattico": non dipenderà più dai tute di motion capture o dal controllo remoto, ma verrà addestrato guardando video.
Tesla (TSLA.O) sta adottando un modello collaudato per addestrare il suo robot umanoide. Secondo fonti informate, il produttore di veicoli elettrici ha comunicato ai dipendenti alla fine di giugno che il progetto Optimus si concentrerà maggiormente su un approccio “puramente visivo”.
In precedenza, Tesla aveva utilizzato tute per la motion capture e visori di realtà virtuale per registrare i dati degli operatori umani e controllare a distanza i robot. Ora, l’azienda addestrerà principalmente i robot riprendendo in video i lavoratori mentre eseguono compiti, ad esempio insegnando loro come raccogliere oggetti o piegare una maglietta.
Le fonti riferiscono che abbandonare la motion capture e il controllo remoto consentirà al team di espandere più rapidamente la raccolta dei dati.
Questo cambiamento segna un importante aggiustamento nella strategia robotica di Tesla, allineando Optimus con la convinzione di lunga data del CEO Musk, secondo cui l’intelligenza artificiale può apprendere compiti complessi solo tramite telecamere. Tesla ha sempre utilizzato un metodo simile per addestrare il suo software di guida autonoma.
Il cambiamento è avvenuto poco dopo le dimissioni del responsabile del progetto Optimus, Milan Kovac. Secondo fonti informate, il responsabile AI Ashok Elluswamy ha assunto la guida del progetto.
La motion capture e il controllo remoto sono pratiche standard nel settore della robotica. Ad esempio, la società leader Boston Dynamics ha utilizzato il controllo remoto per addestrare il suo robot Atlas. Durante l’addestramento, i lavoratori indossano tute per la motion capture per eseguire vari compiti, i cui dati vengono poi inseriti nel robot. Le tute possono essere utilizzate anche per controllare a distanza i robot.
Non è ancora chiaro se in futuro Tesla tornerà a dare priorità alla motion capture e al controllo remoto, o se continuerà a sviluppare utilizzando i dati video raccolti in precedenza.
Robert Griffin, ricercatore senior presso l’Institute for Human and Machine Cognition, afferma che una grande quantità di dati di controllo remoto consente ai robot di apprendere tramite l’interazione fisica con l’ambiente. Ha dichiarato che affidarsi solo ai dati video rende difficile per i robot trasferire accuratamente le azioni viste nei video al mondo reale.
“Se usi solo dati video, non hai un’interazione fisica diretta,” ha detto.
Piegare magliette e raccogliere oggetti
Musk ha annunciato per la prima volta nel 2021 che Tesla avrebbe sviluppato un robot umanoide chiamato Optimus. Il miliardario ha dichiarato che il robot sarà in grado di svolgere compiti come il lavoro in fabbrica e l’assistenza.
Lo scorso anno, l’azienda ha assunto “operatori per la raccolta dati”. Queste posizioni prevedevano l’esecuzione e la registrazione di semplici compiti domestici. Secondo gli annunci di lavoro, gli operatori dovevano indossare per lunghi periodi tute per la motion capture e visori di realtà virtuale.
Fino alla fine di giugno, il progetto prevedeva ancora l’addestramento di Optimus tramite controllo remoto e tute per la motion capture. Secondo fonti informate, i lavoratori trascorrevano molto tempo a gestire problemi relativi all’abbigliamento e al robot stesso, limitando la quantità di dati che il team poteva raccogliere.
Dopo il cambiamento nel metodo di addestramento, i lavoratori hanno iniziato a registrare le proprie azioni utilizzando un set di cinque telecamere realizzate da Tesla. Secondo le fonti, queste telecamere sono montate su caschi e zaini pesanti indossati dai lavoratori e riprendono in tutte le direzioni, fornendo dati precisi sull’ambiente ai modelli AI.
Christian Hubicki, direttore del laboratorio di robotica della FAMU-FSU College of Engineering, afferma che queste telecamere da diverse angolazioni potrebbero consentire a Tesla di raccogliere dettagli più fini, “come la posizione delle articolazioni e delle dita”, e di localizzare meglio il robot. Ha aggiunto che questi video potrebbero anche integrare i dati raccolti in precedenza tramite controllo remoto.
Durante l’addestramento, i lavoratori ricevono istruzioni specifiche sui compiti, in particolare sui movimenti delle mani, per garantire che le azioni appaiano il più possibile simili a quelle umane. Un dipendente ha riferito che potrebbero trascorrere mesi a ripetere lo stesso compito semplice.
Jonathan Aitken, esperto di robotica dell’Università di Sheffield, afferma che Tesla potrebbe dover trovare un modo per far apprendere a Optimus vari compiti tramite azioni generalizzabili.
“A questa scala, devono avere un set di azioni generiche, altrimenti addestrare tutti i compiti richiederebbe un tempo estremamente lungo,” ha detto Aitken.
Ha aggiunto che Tesla potrebbe adottare una strategia simile a quella di Physical Intelligence, che insegna ai robot abilità trasferibili e flessibili fornendo loro grandi quantità di dati dimostrativi, invece di far loro memorizzare un singolo compito.
“Un approccio molto in stile Tesla allo sviluppo della robotica”
Questa nuova strategia è coerente con il modo in cui Tesla addestra il suo software di guida autonoma. Altre aziende di guida autonoma utilizzano sensori come lidar e radar millimetrici per addestrare il software, mentre Tesla si affida principalmente alle telecamere.
L’azienda raccoglie dati da milioni di veicoli Tesla dotati di 8 o 9 telecamere. Musk ha dichiarato che Tesla ha lanciato il software di guida assistita in Cina dopo aver addestrato il sistema AI con video pubblici delle strade asiatiche.
Nella call sugli utili di gennaio, Musk ha ammesso che “le esigenze di addestramento del robot umanoide Optimus potrebbero essere almeno 10 volte superiori a quelle richieste per le auto.”
“È un approccio molto in stile Tesla allo sviluppo della robotica. Nessun’altra azienda sta tentando di farlo su questa scala,” ha detto Aitken. “Hanno bisogno di una quantità di dati enorme, come per l’addestramento delle auto.”
Alan Fern, esperto di AI e robotica della Oregon State University, afferma che addestrare Optimus è per Tesla una sfida ancora più grande rispetto allo sviluppo delle auto a guida autonoma.
“Guidare è solo un compito,” ha detto. Affidarsi principalmente all’apprendimento tramite video “richiede che il robot comprenda ciò che accade nel video e abbia anche le abilità per svolgere il compito. Alcune cose si possono imparare osservando, ma altre richiedono pratica in simulatore o nel mondo reale.”
Esclusione di responsabilità: il contenuto di questo articolo riflette esclusivamente l’opinione dell’autore e non rappresenta in alcun modo la piattaforma. Questo articolo non deve essere utilizzato come riferimento per prendere decisioni di investimento.
Ti potrebbe interessare anche
Assorbendo il 7% della fornitura circolante: come gli ETF su bitcoin stanno silenziosamente rimodellando la struttura dell’offerta di mercato?
Gli ETF su bitcoin sono diventati una forza chiave nella rimodellazione dell'offerta e della domanda di mercato, detenendo oltre 1,4 milioni di BTC (più del 7% della circolazione totale). I modelli di flusso di capitale degli ETF rivelano comportamenti degli investitori come l'inseguimento dei rialzi e la fuga dalle perdite. Nuovi indicatori, come la differenza cumulativa dei flussi e il prezzo medio ponderato per flusso, aiutano ad analizzare il sentiment di mercato e la base dei costi. Poiché la velocità con cui gli ETF assorbono BTC supera di gran lunga la produzione mineraria, nel lungo termine ciò potrebbe accentuare la scarsità, anche se nel breve termine la volatilità rimane influenzata dalla psicologia degli investitori retail. Questi strumenti offrono prospettive innovative per comprendere le dinamiche di mercato. Riassunto generato da Mars AI. Questo riassunto è stato prodotto dal modello Mars AI e la sua accuratezza e completezza sono ancora in fase di aggiornamento iterativo.


In un anno ha attirato oltre 2 milioni di utenti: analisi retrospettiva sull'espansione del mercato NFT di Element
Nell'ultimo anno, Element, definito il più grande mercato L2, ha attirato oltre 2 milioni di nuovi utenti, un fatto raro nel settore dei mercati NFT. Cosa ha fatto Element di così giusto per ottenere il favore di così tanti utenti? Questo articolo esplorerà la questione.

In tendenza
AltroPrezzi delle criptovalute
Altro








