本報記者 李勇
“過(guò)去我們談人形機器人技術(shù)時(shí),主要關(guān)注點(diǎn)在硬件,而這次是在大腦和小腦方面的技術(shù)跨越,也就是以VLA(結合了視覺(jué)、語(yǔ)言和動(dòng)作的多模態(tài)大模型)等為代表的具身智能大模型技術(shù)開(kāi)始與人形機器人本體融合、進(jìn)化,使人形機器人成為具身智能的關(guān)鍵載體。”談及具身智能和人形機器人目前的熱火,全國政協(xié)委員、天娛數字科技(大連)集團股份有限公司(以下簡(jiǎn)稱(chēng)“天娛數科”)CEO賀晗向《證券日報》記者表示:“這將是革命性的,是一場(chǎng)從‘機械軀殼’到‘數字生命’的進(jìn)化革命,讓門(mén)檻大幅降低、場(chǎng)景快速增多。”
在賀晗看來(lái),從技術(shù)發(fā)展角度,人形機器人可總結為基于程序控制的演示階段、基于大模型的模仿階段和基于海量3D數據的智能階段三個(gè)階段。其中,基于海量3D數據的智能階段也是人形機器人的覺(jué)醒紀元,是下一步的發(fā)展方向。賀晗表示,從被動(dòng)響應和執行到主動(dòng)感知和決策,核心是海量3D數據的喂養,通過(guò)世界模型+具身智能,創(chuàng )建對世界運作方式的內部表征,并具備行動(dòng)后果的推理能力,從而顯著(zhù)提升對真實(shí)世界的感知、推理、執行與預測能力,使機器人認識和理解3D世界,并能夠像人類(lèi)一樣進(jìn)行推理和規劃,不僅可以適應復雜多變的環(huán)境和任務(wù)需求,更為重要的是,具備自主決策、行動(dòng)與操作能力。
不談?dòng)布?,從推?dòng)具身智能發(fā)展角度看,賀晗認為當前的共性問(wèn)題是缺乏通用平臺。一是缺乏算法(大腦、小腦)通用開(kāi)發(fā)平臺,多數企業(yè)都要從0到1獨立研發(fā),導致重復投入和資源分散,影響成本更影響效率;二是缺乏通用3D數據平臺,高質(zhì)量3D數據集稀缺,3D數據采集設備未普及,3D數據獲取成本高、標準化程度低,制約具身智能深度訓練;三是缺乏通用標準認證平臺,硬件接口、通信協(xié)議、數據格式等缺乏統一規范,不同廠(chǎng)商的機器人本體構型與軟件架構互不兼容,具身智能難以跨本體,制約規?;瘧?;四是缺乏通用場(chǎng)景測試平臺,行業(yè)標準場(chǎng)景庫缺失;五是缺乏通用人才培養平臺。
為此,賀晗希望一是建立國家級具身智能發(fā)展規劃,推動(dòng)大腦、小腦與機械本體協(xié)同發(fā)展;二是鼓勵通用平臺建設,避免重復“造輪子”。鼓勵開(kāi)發(fā)從硬件到軟件、從底層到應用層、從AI模型底座到3D數據集的通用開(kāi)發(fā)套件,形成良好的產(chǎn)業(yè)協(xié)同創(chuàng )新氛圍,降低創(chuàng )業(yè)、研發(fā)門(mén)檻;三是加快標準建設,創(chuàng )建生態(tài)認證體系,鼓勵建立“具身智能兼容性認證”,對通過(guò)協(xié)議兼容性測試的產(chǎn)品給予一定補貼,降低異構系統整合成本;四是開(kāi)放場(chǎng)景生態(tài),加速技術(shù)迭代。在柔性生產(chǎn)、醫療康養、公共安全、應急救援等領(lǐng)域開(kāi)放應用場(chǎng)景,鼓勵建立跨行業(yè)測試平臺,降低企業(yè)技術(shù)驗證成本;五是加強復合型人才培養,在高校中設置具身智能、人工智能+機器人相關(guān)專(zhuān)業(yè)或方向,培養通才,破解“機械臂不懂神經(jīng)網(wǎng)絡(luò )”的認知割裂。
(編輯 張明富)
版權所有《證券日報》社有限責任公司
互聯(lián)網(wǎng)新聞信息服務(wù)許可證 10120240020增值電信業(yè)務(wù)經(jīng)營(yíng)許可證 京B2-20250455
京公網(wǎng)安備 11010602201377號京ICP備19002521號
證券日報網(wǎng)所載文章、數據僅供參考,使用前務(wù)請仔細閱讀法律申明,風(fēng)險自負。
證券日報社電話(huà):010-83251700網(wǎng)站電話(huà):010-83251800 網(wǎng)站傳真:010-83251801電子郵件:xmtzx@zqrb.net
安卓
IOS
掃一掃,加關(guān)注
掃一掃,加關(guān)注