爱豆传媒映视AV-爱豆传媒在线观看-爱豆传媒在线观看ID-爱豆传媒在线看-爱豆福利导航-爱豆福利导航网-爱豆视频-爱豆视频在线观看高清-爱豆视频在线观看免费-爱豆网站免费观看官网

【TR35】具身智能如何“有用”?加州大學(xué)伯克利分校博士后羅劍嵐 發(fā)布時(shí)間:2025-05-30 09:34:18


他是讓機(jī)器人“用手做事”的中國面孔,是讓“真機(jī)強(qiáng)化學(xué)習(xí)”成為現(xiàn)實(shí)的破局者。他是入選2024年《麻省理工科技評論》“35歲以下科技創(chuàng)新35人”(TR35)榜單的加州大學(xué)伯克利分校博士后、人工智能與機(jī)器人專家羅劍嵐。



在一段操作看似流暢的視頻中,一只機(jī)器人手持鞭狀工具,從層層疊放的積木堆中精準(zhǔn)抽出指定積木塊。它動(dòng)作柔順、位姿穩(wěn)定,完成了高度精密的操作任務(wù)。對人類來說,這不僅需要肌肉控制的極度細(xì)膩,還要在毫厘之間掌控物理世界的不確定性。而HIL-SERL系統(tǒng)中的機(jī)器人,在短短兩小時(shí)訓(xùn)練后,就實(shí)現(xiàn)了100%的成功率。


01

操控優(yōu)先,

突破“大腦”短板


當(dāng)前多數(shù)機(jī)器人“會(huì)走會(huì)跳”,卻難以完成操作任務(wù),暴露出“重運(yùn)動(dòng)、輕操控”的結(jié)構(gòu)性短板。羅劍嵐并非“讓機(jī)器人跳舞更流暢”,而是“讓它學(xué)會(huì)用手做事”。

“操控能力是目前最短缺的能力,這一直是機(jī)器人行業(yè)皇冠上的明珠。”羅劍嵐指出。他強(qiáng)調(diào),當(dāng)前許多機(jī)器人系統(tǒng)仍停留在“運(yùn)動(dòng)能力”展示階段,但真正推動(dòng)生產(chǎn)力的,是具身智能系統(tǒng)的“操作力”,即應(yīng)對不確定環(huán)境的靈巧反應(yīng)能力。


“當(dāng)機(jī)器人必須識(shí)別不同材質(zhì)、抓取不同形狀并組裝部件時(shí),面對的是一個(gè)高度不確定、動(dòng)態(tài)變化的開放系統(tǒng)。”羅劍嵐說,這種區(qū)別,決定了技術(shù)價(jià)值是否真正落地。


羅劍嵐便投身于機(jī)器人控制與強(qiáng)化學(xué)習(xí)的交叉研究已有10年。在UC Berkeley讀博期間,他便系統(tǒng)性構(gòu)建了面向真實(shí)物理世界的學(xué)習(xí)框架。2022年博士后回歸伯克利人工智能實(shí)驗(yàn)室(BAIR)后,他帶領(lǐng)團(tuán)隊(duì)開發(fā)出全球首個(gè)在多任務(wù)上達(dá)到或超越人類水平的真機(jī)RL系統(tǒng)HIL-SERL(參考模仿學(xué)習(xí)基線)。


該系統(tǒng)突破性地實(shí)現(xiàn)了機(jī)器人在復(fù)雜操作任務(wù)中的全面泛化能力,完成抽取積木、安裝皮帶輪、電腦主板裝配等一系列高精度、多約束動(dòng)作任務(wù),且任務(wù)成功率達(dá)100%。


HIL-SERL最大的不同,是“以真機(jī)數(shù)據(jù)為核心”,放棄對仿真的依賴。這意味著每一次操作反饋都來自真實(shí)世界,機(jī)器人必須在極高的不確定性下迅速建模和反應(yīng)。這正是“操控”在具身智能中所代表的技術(shù)核心——不僅僅是能動(dòng),更是能理解物理世界并精準(zhǔn)交互。


“仿真器無法模擬真實(shí)世界的復(fù)雜性,唯有直面物理交互數(shù)據(jù),才能實(shí)現(xiàn)真正的智能進(jìn)化。”羅劍嵐說。他相信,唯有技術(shù)與場景共生,才能真正打開未來的智能系統(tǒng)之門。



02

科研與產(chǎn)業(yè)

形成正向飛輪



從UC Berkeley到Google X、再回到Berkeley,羅劍嵐幾乎橫跨了機(jī)器人領(lǐng)域最頂尖的學(xué)術(shù)與工業(yè)場域。他始終強(qiáng)調(diào):科研與產(chǎn)業(yè)之間不是兩條獨(dú)立的路徑,而是一個(gè)可以彼此賦能、持續(xù)反饋的正向飛輪,“場景錘煉算法,算法反哺場景。”


在伯克利,他聚焦算法機(jī)制創(chuàng)新,用強(qiáng)化學(xué)習(xí)解決“樣本效率”“任務(wù)泛化”等基礎(chǔ)難題;而在谷歌,他親歷工業(yè)界對系統(tǒng)可靠性、可部署性與硬件耦合性的極致要求。


“我建議青年研究者,不要只關(guān)注能否發(fā)頂刊論文,更要思考問題本身是否值得花時(shí)間。”他說,只有將科研問題放入實(shí)際系統(tǒng)中運(yùn)行,經(jīng)歷反饋、修正、再提升,才能真正形成技術(shù)飛輪。


盡管當(dāng)前多個(gè)機(jī)器人平臺(tái)已在實(shí)驗(yàn)室中展現(xiàn)驚艷表現(xiàn),但距離真正應(yīng)對工業(yè)級復(fù)雜環(huán)境,仍面臨魯棒性、實(shí)時(shí)性與自適應(yīng)能力的嚴(yán)峻挑戰(zhàn)。


通用人形機(jī)器人距離真正“有用”還缺哪些技術(shù)拼圖?羅劍嵐的答案是“閉環(huán)能力”,即機(jī)器人系統(tǒng)不僅能執(zhí)行任務(wù),還能從每一次交互中學(xué)習(xí)、改進(jìn)。他提出,未來10年,真正的通用具身智能系統(tǒng),必須具備這種“帶記憶”的學(xué)習(xí)能力——不是靠硬編碼或海量標(biāo)注數(shù)據(jù),而是靠自身交互中不斷獲得經(jīng)驗(yàn)。


“這是一種能從過去的失敗和成功中提煉策略的能力。”他說。比如一個(gè)機(jī)器人在初次嘗試裝配零件失敗后,不是回到仿真重頭再來,而是能立即理解偏差并調(diào)整策略,這種動(dòng)態(tài)學(xué)習(xí),是工業(yè)落地的必要前提。


“在谷歌期間,我深刻體會(huì)到工程可靠性的重要性;在伯克利,我敢于突破基礎(chǔ)科學(xué)。這種雙重歷練,構(gòu)成了我今天理解技術(shù)的方式。”羅劍嵐說。


03

從Demo到部署

走出實(shí)驗(yàn)室



隨著通用機(jī)器人研發(fā)逐步進(jìn)入深水區(qū),如何從演示級技術(shù)走向工程部署,成為評判技術(shù)成熟度與產(chǎn)業(yè)價(jià)值的關(guān)鍵尺度。

對羅劍嵐而言,TR35不僅是榮譽(yù),更是一份責(zé)任。“我希望把這個(gè)榮譽(yù)化作一種推動(dòng)力。”他說,“過去10年,我們讓強(qiáng)化學(xué)習(xí)在真實(shí)機(jī)器人上跑起來;接下來的10年,我們要讓它真正產(chǎn)生價(jià)值。”


幾個(gè)月前,羅劍嵐正式加入bbin寶盈機(jī)器人,擔(dān)任首席科學(xué)家。他牽頭組建的“具身智能研究中心”專注于“大小腦一體”的系統(tǒng)研究與落地。這一研究方向,聚焦“場景驅(qū)動(dòng)的具身智能數(shù)據(jù)采/訓(xùn)/推一體化綜合平臺(tái)”“多模感知仿人靈巧手及具身交互控制技術(shù)研究與驗(yàn)證”等核心課題,得到了上海市科委“科技創(chuàng)新行動(dòng)計(jì)劃-新一代信息技術(shù)領(lǐng)域技術(shù)攻關(guān)(第一批)項(xiàng)目”的支持。


“我們的目標(biāo),是讓機(jī)器人24×7地在真實(shí)世界中工作,不再只是Demo。”他說。他相信,機(jī)器人走出實(shí)驗(yàn)室進(jìn)入現(xiàn)實(shí)世界的“窗口期”正在到來。


“我希望未來的具身智能系統(tǒng),可以真正在工廠中裝配產(chǎn)品,在無人便利店里搬運(yùn)貨架,甚至在危險(xiǎn)區(qū)域中代替人類作業(yè)。”這是他正著手構(gòu)建的“閉環(huán)”。


“讓機(jī)器人成為現(xiàn)實(shí)世界的一員”,這不僅是他的科研方向,更是他對未來技術(shù)與社會(huì)的承諾。


轉(zhuǎn)載From:上海科技




主站蜘蛛池模板: 南部县| 浦北县| 正宁县| 星子县| 横峰县| 沈阳市| 南昌市| 滨海县| 台中县| 和龙市| 平遥县| 屏山县| 黄平县| 东丽区| 绥宁县| 邵东县| 临夏市| 尉氏县| 洪江市| 威远县| 乐至县| 澄迈县| 水富县| 年辖:市辖区| 五寨县| 简阳市| 三江| 阿荣旗| 内丘县| 波密县| 北碚区| 延边| 泾阳县| 普定县| 泗水县| 吕梁市| 兰州市| 博罗县| 武宁县| 花莲市| 铜鼓县|