你以為的宇樹(shù)機(jī)器人(H1):
只通過(guò)一個(gè)訓(xùn)練框架,機(jī)器人就能成為 " 學(xué)人精 ",完成各種高難度敏捷動(dòng)作。
從這樣(下左圖)變成這樣(下右圖)。
要知道,由于仿真環(huán)境和真實(shí)物理世界之間的動(dòng)力學(xué)系統(tǒng)存在偏差,讓機(jī)器人敏捷、協(xié)調(diào)地完成各種類人動(dòng)作仍舊是一個(gè)巨大挑戰(zhàn)。
ASAP 方法解決的正是這個(gè)問(wèn)題,論文和代碼通通開(kāi)源。
有人感慨,看來(lái)機(jī)器人時(shí)代距我們只有幾步之遙。
簡(jiǎn)單總結(jié)論文核心提出了ASAP(Aligning Simulation and Real Physics,對(duì)齊模擬與真實(shí)物理)。
第一階段,使用經(jīng)過(guò)調(diào)整的人類運(yùn)動(dòng)數(shù)據(jù)在模擬環(huán)境中預(yù)訓(xùn)練運(yùn)動(dòng)跟蹤策略。
第二階段,將這些策略應(yīng)用到真實(shí)世界,并收集真實(shí)數(shù)據(jù)來(lái)訓(xùn)練一個(gè) " 殘差 " 動(dòng)作模型,用來(lái)彌補(bǔ)模型與真實(shí)世界物理動(dòng)態(tài)之間的差距。
然后 ASAP 將預(yù)訓(xùn)練的策略與差異動(dòng)作模型結(jié)合,并在模擬器中進(jìn)行微調(diào),以便更好地與真實(shí)世界物理動(dòng)態(tài)對(duì)接。
1、運(yùn)動(dòng)跟蹤預(yù)訓(xùn)練與真實(shí)軌跡收集:通過(guò)將人類視頻中的運(yùn)動(dòng)數(shù)據(jù)轉(zhuǎn)換為類人機(jī)器人動(dòng)作,我們?cè)谀M環(huán)境中預(yù)訓(xùn)練多個(gè)運(yùn)動(dòng)跟蹤策略,并生成真實(shí)世界的運(yùn)動(dòng)軌跡。
4、真實(shí)世界部署:最后,我們將微調(diào)過(guò)的策略直接應(yīng)用到現(xiàn)實(shí)世界中,不再需要差異動(dòng)作模型。
研究人員在三個(gè)遷移場(chǎng)景中評(píng)估了 ASAP 的效果——
從 IsaacGym 到 IsaacSim、從 IsaacGym 到 Genesis,以及從 IsaacGym 到真實(shí)世界。
使用的機(jī)器人是宇樹(shù) G1 人形機(jī)器人。
在特定動(dòng)作(詹姆斯消音步)上,可以看到使用 ASAP 后,機(jī)器人的穩(wěn)定性更好了。
最后來(lái)看下研究團(tuán)隊(duì)陣容。
共同一作有四位,分別是何泰然、高嘉偉、Wenli Xiao 和 Yuanhang Zhang。
其中何泰然本科畢業(yè)于上海交通大學(xué),現(xiàn)在是英偉達(dá) GEAR 的一員,之前還在 MSRA 實(shí)習(xí)過(guò)。
高嘉偉本科畢業(yè)于清華大學(xué),現(xiàn)在還在申請(qǐng)博士。
Wenli Xiao 也是英偉達(dá) GEAR 的一員。Yuanhang Zhang 本科畢業(yè)于上海交通大學(xué),現(xiàn)在在 CMU 讀研。
One More Thing
雖然動(dòng)作表現(xiàn)更擬人了,但是宇樹(shù)機(jī)器人還是沒(méi)逃過(guò)跳舞的命運(yùn)……
請(qǐng)欣賞宇樹(shù)版 APT。
(統(tǒng)治人類后又多了一段要?jiǎng)h除的黑歷史)
https://agile.human2humanoid.com/