2025年全國(guó)兩會(huì)期間,"具身智能"首次被寫入政府工作報(bào)告,熱度持續(xù)高漲。近日,有鹿機(jī)器人宣布,在三月份連續(xù)完成了總額達(dá)6億元的具身智能通用大腦及機(jī)器人訂單。這無(wú)疑是今年開(kāi)年以來(lái),具身智能賽道上最引人矚目的大額訂單 。
東吳證券發(fā)布研報(bào)稱,2023年中國(guó)具身智能市場(chǎng)規(guī)模已經(jīng)達(dá)到4186億元,預(yù)計(jì)到2027年市場(chǎng)規(guī)模有望達(dá)到6328億元。
去年6月,有鹿機(jī)器人以超億元融資、超千萬(wàn)訂單,打響具身智能商業(yè)化的“第一槍”。數(shù)月后,有鹿機(jī)器人再次拿下震驚圈內(nèi)的訂單,再次彰顯出技術(shù)迭代與市場(chǎng)拓展的雙重加速度。
對(duì)整個(gè)賽道而言,AGI技術(shù)路徑不再模糊。企業(yè)實(shí)踐與市場(chǎng)反饋,讓其發(fā)展方向和應(yīng)用模式逐步清晰,為行業(yè)技術(shù)攻堅(jiān)、產(chǎn)品研發(fā)提供參考,有望引領(lǐng)賽道進(jìn)入全新快速發(fā)展階段。
突破具身智能瓶頸,打造雙腦協(xié)同新范式
當(dāng)大語(yǔ)言模型掀起AI熱潮時(shí),行業(yè)逐漸意識(shí)到:這場(chǎng)技術(shù)狂歡或許只是AGI的前奏。正如AI領(lǐng)域先驅(qū)李飛飛所言,未來(lái)智能體必須具備空間智能——既能理解3D物理世界,又能在數(shù)字孿生空間交互,這將是超越當(dāng)前技術(shù)的關(guān)鍵突破。
所謂的空間智能包含雙重維度:物理三維世界與數(shù)字三維世界的雙向映射。其終極目標(biāo)是構(gòu)建數(shù)字—物理世界的智能橋梁,而具身智能正是實(shí)現(xiàn)這一目標(biāo)的重要橋梁。近年來(lái),多模態(tài)大模型(MLMs)與世界模型(WMs)的突破,因其強(qiáng)大的感知推理能力,成為具身智能體“大腦”的理想架構(gòu)。
在國(guó)內(nèi)AI賽道中,專注打造智能體“大腦”的企業(yè)寥若晨星,且呈現(xiàn)明顯的“左右腦分工”格局。其中“左腦”代表語(yǔ)言大模型,承擔(dān)邏輯推理、語(yǔ)言處理等任務(wù),如DeepSeek、通義千問(wèn)等。
而“右腦”則代表物理大模型,更擅長(zhǎng)處理整體和視覺(jué)信息等,有鹿機(jī)器人便是其中別具一格的“右腦”流派踐行者。其所聚焦的“右腦”方向,即物理世界的Encoder和Decoder部分。從數(shù)據(jù)輸入、建模、三維世界復(fù)原、空間流動(dòng)把控,到預(yù)測(cè)未來(lái),有鹿機(jī)器人都在不斷優(yōu)化,旨在讓“右腦”真正能夠理解物理世界。
有鹿機(jī)器人另一大突破性在于實(shí)現(xiàn)“左右腦協(xié)同”。它運(yùn)用對(duì)齊技術(shù),將“左腦”“右腦”有效關(guān)聯(lián),以語(yǔ)言交互為手段,高效完成物理世界中的各項(xiàng)任務(wù)。
2023年,有鹿機(jī)器人聯(lián)合阿里云通義千問(wèn),研發(fā)了LPLM(LargePhysicalLanguageModel)大模型。該模型創(chuàng)新性整合語(yǔ)言大模型和物理世界,構(gòu)建起完整的雙腦協(xié)同架構(gòu),有效攻克了傳統(tǒng)具身模型存在的延遲高、準(zhǔn)確率低、泛化能力弱等技術(shù)瓶頸。
LPLM的核心優(yōu)勢(shì)在于其強(qiáng)大的通用性特征,可以實(shí)現(xiàn)在跨模態(tài)、跨場(chǎng)景、跨行業(yè)的數(shù)據(jù)中提取出許多共性信息,通過(guò)抽象、投影、轉(zhuǎn)移等過(guò)程,充當(dāng)一種基礎(chǔ)模型。目前該模型已定位為全形態(tài)機(jī)器人的通用型具身智能中樞,適用于輪式、復(fù)合式、人型等各類機(jī)器人形態(tài)。
要推動(dòng)具身智能真正落地,實(shí)現(xiàn)大模型與現(xiàn)實(shí)物理世界深度融合,僅依靠模型直接感知和操控客觀實(shí)體遠(yuǎn)遠(yuǎn)不足。
在語(yǔ)言大模型的演進(jìn)進(jìn)程中,數(shù)據(jù)短缺問(wèn)題愈發(fā)凸顯,這一難題同樣困擾著具身智能領(lǐng)域。如何高效運(yùn)用數(shù)據(jù)為模型提供充足“養(yǎng)分”,已然成為當(dāng)下亟待突破的關(guān)鍵瓶頸。目前,數(shù)據(jù)獲取途徑主要涵蓋三個(gè)類別:自主采集所得數(shù)據(jù)、借助仿真技術(shù)生成的數(shù)據(jù),以及互聯(lián)網(wǎng)上公開(kāi)可用的開(kāi)源數(shù)據(jù)。
有鹿機(jī)器人借鑒特斯拉FSD路線,通過(guò)將通用腦部署到量產(chǎn)的各類機(jī)器人終端,利用這些終端在真實(shí)場(chǎng)景中的實(shí)際運(yùn)行,持續(xù)自動(dòng)采集物理世界的交互數(shù)據(jù)。這種模式類似于特斯拉通過(guò)百萬(wàn)輛自動(dòng)駕駛汽車在路上行駛收集駕駛數(shù)據(jù),從而形成數(shù)據(jù)閉環(huán)。
基于先進(jìn)算法,有鹿機(jī)器人LPLM,在國(guó)際人工智能頂級(jí)競(jìng)賽中為中國(guó)勇奪9個(gè)冠軍,在多個(gè)項(xiàng)目里以絕對(duì)優(yōu)勢(shì)分?jǐn)?shù)戰(zhàn)勝NVIDIA、Google、Meta(Facebook)、三星等海外科技巨頭。
然而,數(shù)據(jù)收集與訓(xùn)練必須在真實(shí)場(chǎng)景中開(kāi)展。有鹿機(jī)器人計(jì)劃在4年內(nèi)完成10Trillion物理數(shù)據(jù)的收集與訓(xùn)練,這無(wú)疑是一項(xiàng)龐大的社會(huì)工程。為此,有鹿機(jī)器人以平臺(tái)化開(kāi)放形式,發(fā)起“有鹿世界模型—物理數(shù)據(jù)主理人計(jì)劃”,在中國(guó)設(shè)立數(shù)據(jù)五大區(qū)并配備物理世界主理人,全力加速科技與商業(yè)密度的融合連接。
打造的智能清潔“超級(jí)武器”
基于特斯拉FSD“數(shù)據(jù)—產(chǎn)品”飛輪效應(yīng)的啟示,鑒于具身智能模型訓(xùn)練需要持續(xù)獲取真實(shí)物理世界數(shù)據(jù),有鹿機(jī)器人從誕生之日起便以“研發(fā)即戰(zhàn)場(chǎng)”的姿態(tài)切入具身智能賽道。
這個(gè)誕生于杭州的科技新軍,敏銳捕捉到家庭場(chǎng)景中暗藏的十億級(jí)以上的市場(chǎng)藍(lán)?!?dāng)外賣機(jī)器人完成“最后一公里”的商品遞送,當(dāng)清潔機(jī)器人收走生活的冗余,當(dāng)人形機(jī)器人叩響客廳的大門,一個(gè)全鏈條服務(wù)生態(tài)正在悄然成型。
清潔機(jī)器人是有鹿機(jī)器人落子的第一道“門”。去年3月,有鹿機(jī)器人以通用大腦+專業(yè)設(shè)備的積木組合,發(fā)布了基于LPLM的軟硬件結(jié)合產(chǎn)品Master2000。這個(gè)可即插即用的通用具身大腦,讓掃地機(jī)、物流車、叉車等“鐵疙瘩”瞬間擁有自主決策能力。模塊化設(shè)計(jì)如同變形金剛般靈活,Master2000兩個(gè)月便斬獲頭部清潔設(shè)備商千萬(wàn)元訂單,并已開(kāi)始量產(chǎn)交付。
殊不知,這場(chǎng)商業(yè)勝利背后藏著破局之道。當(dāng)有鹿團(tuán)隊(duì)用“具身智能大腦”叩開(kāi)傳統(tǒng)廠商大門時(shí),迎接他們的不是“鮮花掌聲”,而是一盆“冷水”。在這個(gè)看重“實(shí)體價(jià)值”的傳統(tǒng)行業(yè),沒(méi)有一家廠商愿意為看不見(jiàn)摸不著的算法買單——即便這個(gè)“大腦”能賦予設(shè)備自主決策能力。
這次碰壁反而促使團(tuán)隊(duì)轉(zhuǎn)變思路:既然軟件無(wú)法獨(dú)立交易,何不讓算法“顯形”?他們創(chuàng)造性地將核心技術(shù)封裝成可感知的硬件模塊,通過(guò)反向采購(gòu)傳統(tǒng)掃地機(jī),集成自主研發(fā)的“具身大腦”,AI130商業(yè)巡掃機(jī)器人應(yīng)運(yùn)而生。這個(gè)融合軟硬一體技術(shù)的新產(chǎn)品,首次亮相即斬獲約300萬(wàn)元營(yíng)收,成功叩開(kāi)市場(chǎng)大門。
與傳統(tǒng)那些僅能實(shí)現(xiàn)全覆蓋清掃和巡檢清掃功能的室外清潔機(jī)器人相比,AI130搭載的LPLM大模型賦予設(shè)備深度決策能力,在完全開(kāi)放的各種路況下都可實(shí)現(xiàn)全天無(wú)人值守運(yùn)行。通過(guò)LLM呼叫功能,用戶可隨時(shí)通過(guò)自然語(yǔ)言召喚清潔服務(wù),系統(tǒng)會(huì)智能規(guī)劃最優(yōu)路徑并即時(shí)響應(yīng)。同時(shí),AI130采用免部署設(shè)計(jì),即插即用的特性使其能快速適應(yīng)各類復(fù)雜環(huán)境,顯著提升了運(yùn)維效率與使用體驗(yàn)。
數(shù)據(jù)顯示,AI130單臺(tái)設(shè)備日清掃面積達(dá)25000㎡,相當(dāng)于5—6名保潔人員的工作量,年省人工成本超35萬(wàn)元??梢?jiàn),這不是紙上談兵的數(shù)字游戲,而是真金白銀的成本革命。
目前,AI130的身影已融入城市肌理。從杭州亞運(yùn)村到上海中心大廈,從南京綠城玫瑰園到西安浐灞奧體中心,從深圳南山智園到武漢網(wǎng)絡(luò)安全基地,從武漢漢口江灘到梧桐雨生態(tài)公園,AI130在量產(chǎn)3個(gè)月內(nèi)就已在全國(guó)上百處地標(biāo)性項(xiàng)目中攻城略地,用“足跡”丈量著智能清潔的邊界。
截至12月底,有鹿機(jī)器人訂單金額就已經(jīng)已經(jīng)突破6000萬(wàn)。
阿里系技術(shù)天團(tuán),做具身智能破局者
這場(chǎng)從軟件授權(quán)到硬件集成的戰(zhàn)略轉(zhuǎn)型,不僅是商業(yè)模式的革新,更是智能設(shè)備價(jià)值維度的重構(gòu)革命。當(dāng)傳統(tǒng)廠商還在比拼電機(jī)功率與電池容量時(shí),有鹿團(tuán)隊(duì)已將AI的無(wú)形價(jià)值轉(zhuǎn)化為可觸摸、可驗(yàn)證的生產(chǎn)力工具—“通用大腦+專業(yè)設(shè)備”,與傳統(tǒng)制造業(yè)完美對(duì)接,為具身智能商業(yè)化開(kāi)辟了一條現(xiàn)實(shí)可行的技術(shù)路徑。
在有鹿機(jī)器人的技術(shù)基因里,流淌著“阿里系”的創(chuàng)新血脈。核心團(tuán)隊(duì)中,陳俊波與谷祖林兩位掌門人均出身阿里“嫡系”。
陳俊波曾任阿里云搜索部門反作弊算法方向負(fù)責(zé)人、菜鳥ET實(shí)驗(yàn)室算法負(fù)責(zé)人、阿里達(dá)摩院機(jī)器人實(shí)驗(yàn)室的負(fù)責(zé)人。
在阿里達(dá)摩院期間,陳俊波主導(dǎo)開(kāi)發(fā)的“小蠻驢”配送機(jī)器人累計(jì)完成超2000萬(wàn)單物流配送,定義了國(guó)內(nèi)末端無(wú)人配送紀(jì)錄。
伴隨著對(duì)大模型的研究,陳俊波判斷將來(lái)可以用一套算法,就可以實(shí)現(xiàn)對(duì)多產(chǎn)品線的支撐,就像智能手機(jī)的操作系統(tǒng)能適配不同品牌機(jī)型。
2023年,帶著對(duì)這一腦多型的技術(shù)愿景,陳俊波從阿里系的技術(shù)實(shí)驗(yàn)室轉(zhuǎn)戰(zhàn)具身智能,聯(lián)合前SeedMail創(chuàng)始人、阿里巴巴機(jī)器人CEO、矩陣汽車總裁谷祖林開(kāi)啟了具身智能的創(chuàng)業(yè)征程。這種“科學(xué)家主導(dǎo)+連續(xù)創(chuàng)業(yè)者為輔”的組合,聚焦于大模型與具身智能的融合創(chuàng)新。
阿里巴巴集團(tuán)CEO吳泳銘曾表示,生成式AI最大的想象力,絕不是在手機(jī)屏幕上做一兩個(gè)新的超級(jí)App,而是接管數(shù)字世界,改變物理世界。
在數(shù)字經(jīng)濟(jì)重鎮(zhèn)杭州,除了廣為人知的“七小龍”,有鹿機(jī)器人作為“具身智能新四小龍”的代表,致力于為每一臺(tái)傳統(tǒng)設(shè)備植入一顆“通用智能大腦”,讓原本機(jī)械運(yùn)轉(zhuǎn)的機(jī)器就此“聰明”起來(lái)。依托LPLM技術(shù)所具備的通用性優(yōu)勢(shì),有鹿機(jī)器人仿佛擁有了一把萬(wàn)能鑰匙,足以撬動(dòng)規(guī)模達(dá)萬(wàn)億級(jí)別的龐大商機(jī)。
可以預(yù)見(jiàn),當(dāng)數(shù)字智能真正滲透到物質(zhì)世界的肌理,我們將見(jiàn)證人類文明的又一次跨越。
關(guān)鍵詞: