科普時(shí)報(bào)記者 陳杰?
“當(dāng)前,智能機(jī)器人所取得的進(jìn)展主要集中在底層建模和控制方面,但傳統(tǒng)物理模型難以適應(yīng)交互環(huán)境變化,迫切需要將模型訓(xùn)練與深度學(xué)習(xí)融合推進(jìn)?!苯眨迦A大學(xué)訪問教授張建偉在首屆國(guó)際基礎(chǔ)科學(xué)大會(huì)“基礎(chǔ)科學(xué)與人工智能論壇”上指出,機(jī)器人在面臨未來(lái)動(dòng)態(tài)和非結(jié)構(gòu)環(huán)境下的相關(guān)研究已成為行業(yè)重要話題之一。
誠(chéng)然,ChatGPT帶來(lái)的智能化應(yīng)用,已經(jīng)讓人們對(duì)大規(guī)模及算法快速進(jìn)化下的智能機(jī)器人有了更高的期待。而在工業(yè)領(lǐng)域,機(jī)器人的廣泛應(yīng)用讓工業(yè)自動(dòng)化成為可能,智能化則成為其下一個(gè)目標(biāo)。
(資料圖片)
微億智造創(chuàng)新系統(tǒng)部負(fù)責(zé)人馬元巍博士告訴記者,工業(yè)界傳統(tǒng)的自動(dòng)化方案基本上都是將知識(shí)灌入機(jī)器人系統(tǒng),通過編程的形式實(shí)現(xiàn)自動(dòng)批量處理事務(wù)的功能。因此誕生了一系列計(jì)算機(jī)視覺的任務(wù)和機(jī)器人控制的任務(wù),比如一個(gè)完整的抓取分揀操作,包含了3D感知、配準(zhǔn)、點(diǎn)云分割、抓取點(diǎn)估計(jì)、任務(wù)重排、規(guī)劃、2D校準(zhǔn)等任務(wù),通過強(qiáng)大的工業(yè)軟件將這些技術(shù)點(diǎn)耦合在一起,催生了工業(yè)上的絕大部分應(yīng)用?!斑@樣的應(yīng)用具有可控、重復(fù)性高的特點(diǎn),但是整個(gè)方案實(shí)施成本高、柔性低、換線復(fù)雜,并且每個(gè)方案都是獨(dú)特的,缺乏基準(zhǔn)和技術(shù)一致性,非常不利于整體技術(shù)的進(jìn)步。”
正因如此,幾乎每個(gè)行業(yè)對(duì)自動(dòng)化的“解決方案”這四個(gè)字有錐骨之痛。如何破解這一現(xiàn)象,則成為智能機(jī)器人產(chǎn)業(yè)發(fā)展的重點(diǎn)方向。
“人類經(jīng)常被物化為工業(yè)流水線中最柔性的執(zhí)行機(jī)構(gòu),是因?yàn)槿擞^察和學(xué)習(xí)周圍的環(huán)境,使用自己的大腦充分利用自己的身體完成各種復(fù)雜的任務(wù),并且在執(zhí)行中不斷受到更新自己的認(rèn)知?!瘪R元巍表示,這種模式正是智能化追求的一種理想形式,也是1950年圖靈在論文中提到的具身智能。
行業(yè)專家普遍認(rèn)為,工業(yè)智能化發(fā)展始于具身智能。
具身智能是指具有身體的人工智能,需要與真實(shí)世界進(jìn)行交互。這種交互不僅涉及視覺上的高維特征提取,還包括其他感官信息,例如聽覺、嗅覺、味覺和觸覺。通過這種交互,智能體可以獲取物理世界的真實(shí)反饋,并通過反饋來(lái)學(xué)習(xí)并進(jìn)化,可以幫助機(jī)器人更好地完成任務(wù)。
具身智能執(zhí)行步驟一般為多傳感器從真實(shí)到模擬,然后從模擬到真實(shí)的過程,具體的過程就是通過多種感知設(shè)備和算法,盡量將現(xiàn)實(shí)世界的信息能夠還原到虛擬環(huán)境中,然后在經(jīng)過模擬和規(guī)劃后,將算法和規(guī)劃應(yīng)用到實(shí)際機(jī)器人上。
產(chǎn)業(yè)界以前為什么不提具身智能呢?馬元巍認(rèn)為,主要還是因?yàn)榧夹g(shù)復(fù)雜,各個(gè)技術(shù)點(diǎn)發(fā)展不成熟。隨著人工智能技術(shù)的快速發(fā)展,尤其是大語(yǔ)言模型徹底改變了語(yǔ)義理解和頂層規(guī)劃的困難?!癈hatGPT證明了大語(yǔ)言模型具有較強(qiáng)的綜合思考、邏輯能力、數(shù)理能力,大語(yǔ)言模型越來(lái)越被證明,其作為機(jī)器人的上層邏輯規(guī)劃器是非常有希望的,一舉改變了機(jī)器人系統(tǒng)不智能的缺點(diǎn)。多模態(tài)模型的發(fā)展,為統(tǒng)一圖像、行為理解、語(yǔ)音、動(dòng)作等提供了技術(shù)基礎(chǔ)。”
基于當(dāng)前智能技術(shù)的發(fā)展,微億智造提出了獨(dú)特的工業(yè)智能機(jī)器人漸進(jìn)式路線:以“眼手腦云”的實(shí)施架構(gòu)為基礎(chǔ),聚焦于可累積數(shù)據(jù)場(chǎng)景和通用關(guān)鍵技術(shù),打造虛實(shí)結(jié)合的應(yīng)用產(chǎn)品,漸進(jìn)式地實(shí)現(xiàn)機(jī)器人智能化。
縱觀整個(gè)工業(yè)智能的發(fā)展,之所以遠(yuǎn)遠(yuǎn)比不上消費(fèi)端的發(fā)展速度,其根本原因是相關(guān)基礎(chǔ)元素沒有被很好地?cái)?shù)字化。有理由相信,隨著各種大模型的發(fā)展和應(yīng)用,機(jī)器人的感、知、控等技術(shù)將飛速發(fā)展,實(shí)現(xiàn)工業(yè)智能化的要素將逐漸齊備。
當(dāng)然,這肯定需要一個(gè)過程。正如張建偉所言,未來(lái)的機(jī)器人大概率會(huì)是通用智能機(jī)器人,一個(gè)機(jī)器人既能夠給你端茶倒水,又能到餐館服務(wù),還能到工廠干活?!斑@將是智能機(jī)器人產(chǎn)業(yè)的大目標(biāo),也是一個(gè)非常艱巨的目標(biāo)?!?/p>
關(guān)鍵詞: