鯨觀察|從路徑分野到殊途同歸,人形機(jī)器人行業(yè)技術(shù)融合趨勢(shì)初現(xiàn)
圖源:視覺(jué)中國(guó)
藍(lán)鯨新聞4月21日訊(記者 翟智超)隨著機(jī)器人行業(yè)發(fā)展逐步深入,其技術(shù)融合趨勢(shì)已初步顯現(xiàn)。
日前,具身智能機(jī)器人企業(yè)智平方在深圳正式發(fā)布新一代通用智能機(jī)器人AlphaBot 2。據(jù)介紹,AlphaBot 2通過(guò)視覺(jué)、語(yǔ)言與動(dòng)作的端到端協(xié)同,突破傳統(tǒng)機(jī)器人單任務(wù)訓(xùn)練的局限,聚焦場(chǎng)景化落地。
據(jù)藍(lán)鯨科技了解,目前聚焦場(chǎng)景化落地并非人形機(jī)器人發(fā)展的唯一方向。以宇樹(shù)科技、眾擎機(jī)器人為代表的企業(yè),則選擇高精度運(yùn)動(dòng)控制技術(shù)。
研發(fā)聚焦方向的不同,本質(zhì)上源于對(duì)機(jī)器人核心能力的不同側(cè)重。機(jī)器人行業(yè)人士李國(guó)華告訴藍(lán)鯨科技記者,聚焦場(chǎng)景化落地研發(fā)方向在于機(jī)器人的“大腦”——認(rèn)知與決策系統(tǒng),通過(guò)具身大模型融合視覺(jué)、語(yǔ)言與行動(dòng)模塊,賦予機(jī)器人理解任務(wù)指令、分析環(huán)境信息并規(guī)劃行動(dòng)策略的能力;聚焦高精度運(yùn)動(dòng)控制技術(shù)則專注于“小腦”,憑借先進(jìn)算法和精密硬件,將抽象指令轉(zhuǎn)化為精準(zhǔn)、流暢的肢體動(dòng)作,確保機(jī)器人在復(fù)雜環(huán)境中的穩(wěn)定運(yùn)行。
這種差異的出現(xiàn),或許是市場(chǎng)多元化需求的映射。一位人形機(jī)器人代理商對(duì)藍(lán)鯨科技記者表示,“一方面,科研、教育、娛樂(lè)等領(lǐng)域?qū)C(jī)器人的動(dòng)作技巧和智能交互能力有較高要求,給聚焦高精度運(yùn)動(dòng)控制技術(shù)企業(yè)提供了較大發(fā)展空間。另一方面,工業(yè)制造、商業(yè)服務(wù)、家庭服務(wù)等行業(yè)更關(guān)注機(jī)器人能否在實(shí)際場(chǎng)景中提高生產(chǎn)效率、降低成本、提升服務(wù)質(zhì)量,促使機(jī)器人企業(yè)不斷拓展應(yīng)用場(chǎng)景。”
盡管上述兩種路線存在差異,但融合趨勢(shì)已悄然顯現(xiàn)。
以AlphaBot 2為例,在軟件層面,AI2R Brain升級(jí)為Alpha Brain,并搭載全域全身VLA系統(tǒng),使機(jī)器人的認(rèn)知決策與運(yùn)動(dòng)控制實(shí)現(xiàn)深度協(xié)同,大幅提升全場(chǎng)景交互能力;硬件方面,34+自由度設(shè)計(jì)配合高續(xù)航配置,確保機(jī)器人在復(fù)雜工業(yè)、公共服務(wù)場(chǎng)景中靈活作業(yè)。智平方方面向藍(lán)鯨科技表示,“新一代智能終端需兼具交互便捷性與應(yīng)用多樣性,推動(dòng)軟硬件深度融合,才能實(shí)現(xiàn)真正的智能化應(yīng)用。”
同樣聚焦場(chǎng)景落地的魔法原子,也在融合之路上持續(xù)探索。3月底,魔法原子發(fā)布了“原子萬(wàn)象大模型”,其將多模態(tài)感知、自主導(dǎo)航、操作抓取與運(yùn)動(dòng)控制等功能融合,并與場(chǎng)景深度綁定,讓人形機(jī)器人在各種垂直場(chǎng)景中實(shí)現(xiàn)自主規(guī)劃和自主作業(yè)。
聚焦高精度運(yùn)動(dòng)控制技術(shù)企業(yè)也在主動(dòng)擁抱場(chǎng)景化轉(zhuǎn)型。以眾擎機(jī)器人為例,其去年年底發(fā)布的PM01機(jī)器人,它采用端到端神經(jīng)網(wǎng)絡(luò)解決方案,借助先進(jìn)的光學(xué)動(dòng)捕技術(shù),精準(zhǔn)采集海量人體運(yùn)動(dòng)數(shù)據(jù),通過(guò)強(qiáng)化學(xué)習(xí)和模仿學(xué)習(xí),提升擬人程度和適應(yīng)復(fù)雜環(huán)境的能力。
市場(chǎng)需求的升級(jí),是推動(dòng)技術(shù)路線融合的關(guān)鍵因素。深圳某人形機(jī)器人企業(yè)負(fù)責(zé)人稱,“近年來(lái),市場(chǎng)對(duì)機(jī)器人的要求越來(lái)越高,不僅希望機(jī)器人能在特定場(chǎng)景中完成任務(wù),還要求其具備更靈活的動(dòng)作技巧和智能交互能力。”
李國(guó)華說(shuō),“兩種技術(shù)融合,需要解決技術(shù)層面的兼容性問(wèn)題,以及如何實(shí)現(xiàn)信息在兩個(gè)系統(tǒng)之間的高效傳輸和協(xié)同工作。例如在復(fù)雜場(chǎng)景中,機(jī)器人需將認(rèn)知決策系統(tǒng)的指令實(shí)時(shí)傳遞至運(yùn)動(dòng)控制系統(tǒng),以完成精準(zhǔn)動(dòng)作。這對(duì)系統(tǒng)間通信的速度與準(zhǔn)確性提出了極高要求。”
盡管面臨挑戰(zhàn),技術(shù)融合或是趨勢(shì)。一位人形機(jī)器人行業(yè)分析師向藍(lán)鯨科技記者表示,“2025年或?qū)⒊蔀槿诵螜C(jī)器人的‘產(chǎn)業(yè)化元年’。兩種技術(shù)路徑本質(zhì)上是互補(bǔ)性探索,在萬(wàn)億級(jí)市場(chǎng)的激烈競(jìng)爭(zhēng)中,率先構(gòu)建‘認(rèn)知-決策-執(zhí)行’閉環(huán)的企業(yè),將在重塑人類工作與生活方式的進(jìn)程中搶占先機(jī),引領(lǐng)行業(yè)發(fā)展新方向。”