訂閱
糾錯(cuò)
加入自媒體

具身智能,沒(méi)在元年落地

圖片

12月初,國(guó)內(nèi)兩所領(lǐng)先高校先后推出了具身智能專(zhuān)業(yè)。這像是產(chǎn)學(xué)屆一次盛大的牽手,讓觀眾們幻想屬于國(guó)產(chǎn)具身智能的美滿(mǎn)未來(lái)。

12月8日,智元機(jī)器人宣布5000臺(tái)產(chǎn)品量產(chǎn)。2025年是國(guó)內(nèi)具身智能飛速發(fā)展的一年,從年初登上春晚舞臺(tái),到年末進(jìn)入頂級(jí)學(xué)術(shù)殿堂。具身智能賽道的參與者越來(lái)越多,而對(duì)其的理解也越來(lái)越豐富多元。

有人認(rèn)為,具身智能是AI的物理表征,有人認(rèn)為,具身智能是新的交互范式;你難以找到一個(gè)所有人都同意的定義,但有一個(gè)觀點(diǎn)人人認(rèn)同:具身智能跟我有關(guān)。

01

具身智能做不了什么?

大模型時(shí)代里,所有的工業(yè)體系都值得被重新做一遍。

樂(lè)觀者們?cè)趩?wèn)“具身智能不能做什么?”

旁觀者們?cè)诳矗?ldquo;具身智能可以疊衣服、可以做物流,可以踢足球,可以吸引人,還可以......”

繁榮的demo和真實(shí)的落地之間還存在巨大的差距。為了融資,具身智能們?nèi)急M“想象力”demo可以展示一種能力,但不同的demo體現(xiàn)的卻不一定展示了不同的算法能力。目前行業(yè)出現(xiàn)了一種“橫向擴(kuò)展”demo的現(xiàn)象,即所有的“花樣”其實(shí)是“一樣”,用相同元素的排列組合,營(yíng)造一種虛假的繁榮。這樣的矛盾是具身智能擴(kuò)張與技術(shù)積累的平衡之難;太深的技術(shù)積累,會(huì)導(dǎo)致投資太高,難以出成果,以至于被淘汰。

demo遍地,12月已至具身智能尚未落地。第一個(gè)原因是,具身智能的能力還沒(méi)有達(dá)到規(guī);拈T(mén)檻。討論具身智能的能力,要看具能智能簡(jiǎn)單任務(wù)的成功率、節(jié)拍、成本、可靠性。

雖然一些具身智能高度結(jié)構(gòu)化的實(shí)驗(yàn)室環(huán)境下表現(xiàn)穩(wěn)定,任務(wù)成功率可能超過(guò)80%,但如果放到真實(shí)環(huán)境下其成功率可能大幅度降低。更重要的是,即便單個(gè)任務(wù)成功率能提高,但是對(duì)于長(zhǎng)程任務(wù)來(lái)講,其成功率是相乘的結(jié)果,而小于1的數(shù)字相乘,得到的結(jié)果自然只會(huì)更低。

具身智能的真正落地既要找到合適的場(chǎng)景,也要保證成功率的提高。這條路要走多久還未可知,但可以確定的答案是具身智能的規(guī)模增長(zhǎng)與demo的增長(zhǎng)并不是絕對(duì)的正相關(guān)。就像狼來(lái)了的故事,人們?cè)?015年聽(tīng)過(guò)“這一年是具身智能的元年”

02

具身智能的chatgpt時(shí)刻

具身智能要在真實(shí)世界得到應(yīng)用,讓所有人都想去用它,才會(huì)出現(xiàn)chatgpt時(shí)刻。

資本急于開(kāi)拓具身智能的使用場(chǎng)景,但具身智能的公司們卻還要思考如何應(yīng)用,在哪些場(chǎng)景應(yīng)用。12月3日,特斯拉展示了機(jī)器人奔跑的視頻。是的,具身智能跑起來(lái)了,然后呢?在怎樣的場(chǎng)景下,需要機(jī)器人替代人類(lèi)去跑步呢?

產(chǎn)業(yè)現(xiàn)在將具身智能未來(lái)落地方向主要?dú)w結(jié)為三個(gè)場(chǎng)景:商業(yè)服務(wù)場(chǎng)景、工業(yè)場(chǎng)景、家庭場(chǎng)景。具身智能落地的順序也很大概率會(huì)是先商業(yè)服務(wù)再工業(yè)服務(wù)最后走進(jìn)家庭。

這樣的順序主要因?yàn)榫呱碇悄艿男枰罅康臄?shù)據(jù)訓(xùn)練,以建立一個(gè)世界模型。在這個(gè)模型之中,具身智能要可以思考,也可以預(yù)測(cè)下一步。然而,就像一個(gè)雞與蛋的問(wèn)題,因?yàn)榫呱碇悄懿痪邆鋵?shí)際場(chǎng)景中大量采集數(shù)據(jù)的機(jī)會(huì),導(dǎo)致也就無(wú)法快速地去建立模型。商業(yè)場(chǎng)景特別是酒店類(lèi),因?yàn)榄h(huán)境較為固定更容易訓(xùn)練,從價(jià)值來(lái)看,送餐機(jī)器人確實(shí)也解決了人力成本。

工業(yè)場(chǎng)景對(duì)效率要求高,替代自動(dòng)化的效率會(huì)是硬性門(mén)檻。我們看到,即便機(jī)器人能夠完美復(fù)刻一些工業(yè)操作,但相對(duì)于人手來(lái)講,其速度并不占優(yōu)勢(shì)。從用戶(hù)側(cè)來(lái)說(shuō),付費(fèi)購(gòu)買(mǎi)更慢的“人力資源”是一個(gè)虧本交易。從技術(shù)側(cè)來(lái)說(shuō),由于工業(yè)場(chǎng)景碎片化,數(shù)據(jù)難收集,因此難以起量,就更難打破成本、效率的限制。

最后,再說(shuō)說(shuō)家庭服務(wù)。對(duì)于具身智能進(jìn)入家庭的前景其實(shí)有兩個(gè)極端的角度,如果說(shuō)只需要期待陪伴、對(duì)話作用,或許具身智能可以很快的進(jìn)入消費(fèi)領(lǐng)域。畢竟從智能家居開(kāi)始,到現(xiàn)在的AI玩具,已經(jīng)人機(jī)交互已經(jīng)不是新鮮事。但是如果具身智能要真正成為一個(gè)家庭的“家庭成員”,那它面臨著安全,以及成本問(wèn)題。而被定義為“家庭成員”的具身智能多是覆蓋醫(yī)療、養(yǎng)老場(chǎng)景,審視其安全性更要慎重。

對(duì)于具身智能的普及之路,過(guò)程大概是從專(zhuān)精到通用。最開(kāi)始,可能是單場(chǎng)景單任務(wù)的穩(wěn)定執(zhí)行;然后過(guò)渡到單場(chǎng)景多任務(wù)的執(zhí)行;最后是,多場(chǎng)景多任務(wù)的穩(wěn)定執(zhí)行。

具身智能的發(fā)展也需要行業(yè)的共識(shí),即一套基準(zhǔn)測(cè)試,運(yùn)動(dòng)會(huì)賽不出具身智能的真差距。這一點(diǎn)的突破需要產(chǎn)學(xué)研的結(jié)合。學(xué)界方面,除了清華大學(xué)、上海交大已經(jīng)宣布增設(shè)具身智能專(zhuān)業(yè),還有一批國(guó)內(nèi)高校正在申請(qǐng)具身智能專(zhuān)業(yè)。

03

具身智能的繁榮與焦慮

千百年來(lái),人們一直夢(mèng)想著造出某種人造物,能自動(dòng)完成憑借人類(lèi)智慧、能力才能實(shí)現(xiàn)的工作。

在荷馬史詩(shī)《伊利亞特》中,掌管鍛造、雕刻的鐵匠之神赫菲斯托斯造出了金屬機(jī)器人和黃金打造的仆人,幫助他完成雜務(wù)。亞里士多德預(yù)言了自動(dòng)化工具的出現(xiàn),讓勞動(dòng)變得不再必要。《列子》中講述了工匠偃師為周穆王制作了一個(gè)栩栩如生、能歌善舞、甚至有感情的“機(jī)關(guān)人偶”!陡窳蟹鹩斡洝分忻枋隽艘粋(gè)機(jī)械裝置,有了它,“最愚蠢無(wú)知的人也可以撰寫(xiě)哲學(xué)、詩(shī)歌、政治、法律、數(shù)學(xué)和神學(xué)方面的書(shū)籍,不必憑借天賦或加以學(xué)習(xí)”。

過(guò)去,人們對(duì)具身智能的暢想總是,替代人類(lèi)去做無(wú)聊的、重復(fù)性的、低價(jià)值的工作;于此同時(shí)人們又擔(dān)心他們發(fā)展成為“掌控”人類(lèi)的神,2025年圍繞AI對(duì)人力的沖擊就印制了這一點(diǎn)。因此具身智能的未來(lái),不一定是替代重復(fù)性的工作,或許讓他們能夠替代人類(lèi)進(jìn)行危險(xiǎn)工作,才更有意義。

雖然焦慮具身智能的未來(lái),但具身智能帶來(lái)了相當(dāng)多產(chǎn)業(yè)的繁榮。對(duì)于芯片行業(yè)來(lái)說(shuō),一大批芯片廠商找到了產(chǎn)品的新增長(zhǎng)空間。

邊緣端,多家國(guó)產(chǎn)芯片廠商發(fā)布具身智能產(chǎn)品。極海發(fā)布G32R501實(shí)時(shí)控制MCU可滿(mǎn)足具身機(jī)器人在感知與決策、運(yùn)動(dòng)控制以及高效人機(jī)交互等方面的高算力、高效率與高精準(zhǔn)度等性能需求。以“MCU+Driver+IPM”全棧式電機(jī)專(zhuān)用芯片為核心,搭配極海自研電機(jī)算法平臺(tái),可應(yīng)用于機(jī)器人關(guān)節(jié)、工業(yè)編碼器、無(wú)框力矩電機(jī)等核心場(chǎng)景,構(gòu)建具身智能“神經(jīng)中樞”。

國(guó)民技術(shù)N32H7系列MCU憑借多核異構(gòu)架構(gòu)與超高主頻,提供強(qiáng)大算力與實(shí)時(shí)響應(yīng)能力,能夠滿(mǎn)足人形機(jī)器人對(duì)復(fù)雜控制與高同步性的嚴(yán)苛要求。其內(nèi)置的CORDIC協(xié)處理器能夠高效完成運(yùn)動(dòng)學(xué)涉及的三角/坐標(biāo)變換等數(shù)學(xué)計(jì)算,顯著釋放CPU負(fù)載。

全志科技MR系列機(jī)器人芯片采用12nm制程,集成CPU+GPU+NPU異構(gòu)架構(gòu),算力達(dá)3-4TOPs,功耗僅5W,支持毫秒級(jí)響應(yīng),為小米CyberDog、宇樹(shù)Unitree系列等產(chǎn)品提供運(yùn)動(dòng)控制和環(huán)境感知核心算力,成本僅為英偉達(dá)Jetson Nano的1/3。

瑞芯微的RK3588采用八核64位ARM架構(gòu) ,4顆cortex-A76 高性能內(nèi)核(主頻達(dá)2.4GHz)與4顆Gortex-A55 能效內(nèi)核(主頻2.0GHz)組合多任務(wù)處理和復(fù)雜計(jì)算能力出色。內(nèi)置6TOPS 算力的NPU,支持多種數(shù)據(jù)類(lèi)型與主流深度學(xué)習(xí)框架,能高效處理圖像識(shí)別、語(yǔ)音交互等A任務(wù)。業(yè)內(nèi)人士透露,瑞芯微面向具身智能行業(yè)已經(jīng)出貨上萬(wàn)片相關(guān)產(chǎn)品。

佰維存儲(chǔ)表示已推出適用于具身智能領(lǐng)域的eMMC、UFS、BGA SSD、LPDDR4X/5/5X 等產(chǎn)品,并積極拓展具身智能領(lǐng)域頭部客戶(hù)。根據(jù)第三方媒體拆解報(bào)告,宇樹(shù)科技的Go2智能機(jī)器狗中已應(yīng)佰維存儲(chǔ)的LPDDR4X、eMMC存儲(chǔ)產(chǎn)品。

算力端,英特爾、英偉達(dá)仍是機(jī)器人“頭部”算力的核心玩家。正如前文所說(shuō),具身智能的VLA需要構(gòu)建世界模型,而構(gòu)建模型必然帶動(dòng)算力需求。英特爾通過(guò)推出GPU+NPU+CPU的異構(gòu)系統(tǒng),滿(mǎn)足運(yùn)動(dòng)控制、AI推理的不同負(fù)載要求,實(shí)現(xiàn)VLA模型運(yùn)行。

此外,除了聚焦硬件,英偉達(dá)推出了NVIDIA Cosmos 平臺(tái)以加速物理AI。該平臺(tái)可以整合前沿生成式世界基礎(chǔ)模型 (WFM) 先進(jìn)分詞器、護(hù)欄以及用于加速數(shù)據(jù)處理和管理的高效工作流的集成平臺(tái)。為世界模型訓(xùn)練提供支持,并加速智能汽車(chē)(AV) 和機(jī)器人的物理 AI 開(kāi)發(fā)。

因?yàn)樯婕皺C(jī)械控制、邊緣算力等緩解,具身智能的芯片供應(yīng)商和汽車(chē)芯片的供應(yīng)商具有很高重合度。而具身智能的發(fā)展和汽車(chē)的發(fā)展也有了一些相似之處。

1885年,卡爾·本茨 制造了第一輛使用汽油內(nèi)燃機(jī)驅(qū)動(dòng)的三輪車(chē);蛟S,機(jī)器人現(xiàn)在的“社會(huì)角色”就像和汽車(chē)在1900-1910 年:是技術(shù)奇觀,卻不是社會(huì)基礎(chǔ)設(shè)施。而現(xiàn)在汽車(chē)已經(jīng)成為隨處可見(jiàn)的普通角色,具身智能的發(fā)展還要一定時(shí)間,但不會(huì)是百年之久。

確定的是,我們看到的是具身機(jī)器人角色還沒(méi)定型,但不是能力不足。

       原文標(biāo)題 : 具身智能,沒(méi)在元年落地

聲明: 本文由入駐維科號(hào)的作者撰寫(xiě),觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)