国产一级黄片视频_精品无码免费成a人片_久久婷婷国产综合尤物精品_日韩精品亚洲精品无码专区

關(guān)于ZAKER 合作
量子位 16分鐘前

宇樹(shù)機(jī)器人成賽博科比!英偉達(dá) CMU 新研究,投籃模仿籃球巨星,代碼論文全開(kāi)源

你以為的宇樹(shù)機(jī)器人(H1):

實(shí)際上的宇樹(shù)機(jī)器人(G1):輕松來(lái)一個(gè)帥氣的科比投籃。

或者是像羅納爾多那樣華麗旋轉(zhuǎn)跳躍。

英偉達(dá)卡內(nèi)基梅隆大學(xué)一起,給宇樹(shù)機(jī)器人 " 一雪前恥 " 了(doge)。

只通過(guò)一個(gè)訓(xùn)練框架,機(jī)器人就能成為 " 學(xué)人精 ",完成各種高難度敏捷動(dòng)作。

從這樣(下左圖)變成這樣(下右圖)。

左圖演我做運(yùn)動(dòng)

要知道,由于仿真環(huán)境和真實(shí)物理世界之間的動(dòng)力學(xué)系統(tǒng)存在偏差,讓機(jī)器人敏捷、協(xié)調(diào)地完成各種類人動(dòng)作仍舊是一個(gè)巨大挑戰(zhàn)。

ASAP 方法解決的正是這個(gè)問(wèn)題,論文和代碼通通開(kāi)源。

有人感慨,看來(lái)機(jī)器人時(shí)代距我們只有幾步之遙。

主創(chuàng)之一 Jim Fan 也表示:期待 2030 年 " 人形 " 奧運(yùn)會(huì)吧。

顯著提高機(jī)器人靈活性和全身協(xié)調(diào)性

簡(jiǎn)單總結(jié)論文核心提出了ASAP(Aligning Simulation and Real Physics,對(duì)齊模擬與真實(shí)物理)。

這個(gè)框架主要分為兩個(gè)階段。

第一階段,使用經(jīng)過(guò)調(diào)整的人類運(yùn)動(dòng)數(shù)據(jù)在模擬環(huán)境中預(yù)訓(xùn)練運(yùn)動(dòng)跟蹤策略。

第二階段,將這些策略應(yīng)用到真實(shí)世界,并收集真實(shí)數(shù)據(jù)來(lái)訓(xùn)練一個(gè) " 殘差 " 動(dòng)作模型,用來(lái)彌補(bǔ)模型與真實(shí)世界物理動(dòng)態(tài)之間的差距。

然后 ASAP 將預(yù)訓(xùn)練的策略與差異動(dòng)作模型結(jié)合,并在模擬器中進(jìn)行微調(diào),以便更好地與真實(shí)世界物理動(dòng)態(tài)對(duì)接。

具體步驟分為四步:

1、運(yùn)動(dòng)跟蹤預(yù)訓(xùn)練與真實(shí)軌跡收集:通過(guò)將人類視頻中的運(yùn)動(dòng)數(shù)據(jù)轉(zhuǎn)換為類人機(jī)器人動(dòng)作,我們?cè)谀M環(huán)境中預(yù)訓(xùn)練多個(gè)運(yùn)動(dòng)跟蹤策略,并生成真實(shí)世界的運(yùn)動(dòng)軌跡。

2、差異動(dòng)作模型訓(xùn)練:基于真實(shí)世界的運(yùn)動(dòng)數(shù)據(jù),我們訓(xùn)練一個(gè) " 差異動(dòng)作模型 ",通過(guò)最小化模擬狀態(tài)(s_t)和真實(shí)世界狀態(tài)(s^r_t)之間的差距來(lái)進(jìn)行優(yōu)化。

3、策略微調(diào):我們固定差異動(dòng)作模型,并將其集成到模擬器中,以調(diào)整模擬和真實(shí)物理之間的匹配,然后微調(diào)之前訓(xùn)練好的運(yùn)動(dòng)跟蹤策略。

4、真實(shí)世界部署:最后,我們將微調(diào)過(guò)的策略直接應(yīng)用到現(xiàn)實(shí)世界中,不再需要差異動(dòng)作模型。

研究人員在三個(gè)遷移場(chǎng)景中評(píng)估了 ASAP 的效果——

從 IsaacGym 到 IsaacSim、從 IsaacGym 到 Genesis,以及從 IsaacGym 到真實(shí)世界。

使用的機(jī)器人是宇樹(shù) G1 人形機(jī)器人。

如上是從 IsaacGym 到 IsaacSim,G1 踢足球的四種不同動(dòng)作。值得一提的是,ASAP 在多個(gè)動(dòng)作中訓(xùn)練,不會(huì)過(guò)擬合特定示例。

從 IsaacGym 到 IsaacSim,從 IsaacSim 到真實(shí)世界,ASAP 微調(diào)前后 G1 運(yùn)動(dòng)跟蹤表現(xiàn)如上。

在特定動(dòng)作(詹姆斯消音步)上,可以看到使用 ASAP 后,機(jī)器人的穩(wěn)定性更好了。

由此可以看到,G1 能夠完成橫款大跳等有難度的運(yùn)動(dòng)動(dòng)作,在姿態(tài)上也和人類更為貼近。

四位華人共同一作

最后來(lái)看下研究團(tuán)隊(duì)陣容。

18 位作者中絕大多數(shù)都是華人面孔。

共同一作有四位,分別是何泰然、高嘉偉、Wenli Xiao 和 Yuanhang Zhang。

其中何泰然本科畢業(yè)于上海交通大學(xué),現(xiàn)在是英偉達(dá) GEAR 的一員,之前還在 MSRA 實(shí)習(xí)過(guò)。

高嘉偉本科畢業(yè)于清華大學(xué),現(xiàn)在還在申請(qǐng)博士。

Wenli Xiao 也是英偉達(dá) GEAR 的一員。Yuanhang Zhang 本科畢業(yè)于上海交通大學(xué),現(xiàn)在在 CMU 讀研。

One More Thing

雖然動(dòng)作表現(xiàn)更擬人了,但是宇樹(shù)機(jī)器人還是沒(méi)逃過(guò)跳舞的命運(yùn)……

請(qǐng)欣賞宇樹(shù)版 APT。

(統(tǒng)治人類后又多了一段要?jiǎng)h除的黑歷史)

項(xiàng)目地址:

https://agile.human2humanoid.com/

相關(guān)標(biāo)簽

相關(guān)閱讀

最新評(píng)論

沒(méi)有更多評(píng)論了