近日,動(dòng)態(tài)北京人形機(jī)器人創(chuàng)新中心以直播的北京方式展示了人形機(jī)器人“大腦”的最新突破。搭載通用具身智能平臺(tái)“慧思開(kāi)物”的人形人首tga智能體,在行業(yè)首次實(shí)現(xiàn)全局場(chǎng)景感知與動(dòng)態(tài)記憶突破,機(jī)器局場(chǎng)景感可以做到眼里有活、次實(shí)手里有數(shù),現(xiàn)全為日后人形機(jī)器人走向家庭、知?jiǎng)由虡I(yè)、態(tài)記工業(yè)場(chǎng)景提供了可直接落地的憶突智能底座。
去年,動(dòng)態(tài)北京人形機(jī)器人創(chuàng)新中心發(fā)布全球首個(gè)實(shí)現(xiàn)“一腦多機(jī)”“一腦多能”的北京通用具身智能平臺(tái)——慧思開(kāi)物,為機(jī)器人配備更聰明的人形人首tga“大腦”和“小腦”。該平臺(tái)在發(fā)布之初就顛覆了傳統(tǒng)機(jī)器人基于單一場(chǎng)景、機(jī)器局場(chǎng)景感單一任務(wù)做專(zhuān)項(xiàng)開(kāi)發(fā)的次實(shí)傳統(tǒng)模式,推動(dòng)提升機(jī)器人在復(fù)雜環(huán)境里自主決策與執(zhí)行能力。現(xiàn)全
如今,搭載了慧思開(kāi)物平臺(tái)的智能體,實(shí)現(xiàn)了空間記憶等核心突破,讓機(jī)器人實(shí)現(xiàn)了從被動(dòng)執(zhí)行到主動(dòng)干活、從執(zhí)行“短視”的簡(jiǎn)單任務(wù)到完成長(zhǎng)程的復(fù)雜任務(wù)的關(guān)鍵跨越。
傳統(tǒng)機(jī)器人依賴(lài)瞬時(shí)視覺(jué),“所見(jiàn)即所得”。一旦物體離開(kāi)機(jī)器人的視野便相當(dāng)于“消失”,場(chǎng)景發(fā)生變化后機(jī)器人也跟著“失憶”了,無(wú)法完成復(fù)雜推理與長(zhǎng)程任務(wù)。這就很難使其像人一樣干復(fù)雜的活。
直播中,慧思開(kāi)物Agent(智能體)以真機(jī)實(shí)時(shí)運(yùn)行的方式,展示了機(jī)器人流暢完成遞水、拿紙巾等任務(wù)。整個(gè)過(guò)程中,機(jī)器人有了“空間感”。即使物品離開(kāi)視野,機(jī)器人仍可精準(zhǔn)定位,不再只是處理眼前的工作,還能根據(jù)空間記憶推理出目標(biāo)物體的位置、狀態(tài)與環(huán)境的關(guān)系。
這是因?yàn)楸本┤诵螜C(jī)器人創(chuàng)新中心為其打造了行業(yè)首個(gè)全局場(chǎng)景感知與動(dòng)態(tài)空間記憶系統(tǒng),它配備的“動(dòng)態(tài)語(yǔ)義地圖”,可以記錄看到的物體類(lèi)別、顏色、位置等并實(shí)時(shí)更新,系統(tǒng)還能實(shí)現(xiàn)跨時(shí)間、跨視角持久記憶。
“根據(jù)實(shí)際測(cè)試,機(jī)器人在涉及多步移動(dòng)、感知、抓取等的復(fù)雜多步驟長(zhǎng)程任務(wù)中,這套空間記憶完整鏈路的準(zhǔn)確率都能夠穩(wěn)定在100%。”北京人形機(jī)器人創(chuàng)新中心相關(guān)負(fù)責(zé)人解釋?zhuān)幢阍诿鎸?duì)視角切換、物體遮擋等常見(jiàn)擾動(dòng)的影響下,整體任務(wù)完成率仍維持在98%以上。
這意味著,機(jī)器人真正擁有全局空間記憶和常識(shí),在家庭取物、物料分揀、物流整理等場(chǎng)景中,即便視角切換、物體遮擋、環(huán)境變化,依然能穩(wěn)定完成任務(wù)。
現(xiàn)在的機(jī)器人還有個(gè)痛點(diǎn):記不住人、分不清偏好,每次與同一個(gè)人交互都像第一次見(jiàn)面,做每一項(xiàng)工作都像第一次做。為此,慧思開(kāi)物Agent通過(guò)一套用戶(hù)記憶系統(tǒng),實(shí)現(xiàn)擬人化主動(dòng)交互,讓機(jī)器人可以分辨出來(lái)誰(shuí)是誰(shuí),只要見(jiàn)過(guò)一次,就能長(zhǎng)期記住行為偏好,提供個(gè)性化服務(wù)。
比如,用戶(hù)隨口說(shuō)“口渴”時(shí),機(jī)器人通過(guò)人臉匹配調(diào)取歷史記憶,識(shí)別出用戶(hù)偏愛(ài)可樂(lè),主動(dòng)為用戶(hù)把可樂(lè)取來(lái)。它還能讓機(jī)器人具備跨任務(wù)上下文延續(xù)能力。當(dāng)用戶(hù)下達(dá)“繼續(xù)做昨天的事”“把上次的文件給我”等跨時(shí)間任務(wù),機(jī)器人也能“想”起來(lái)。
“正因如此,機(jī)器人還可以自主感知環(huán)境、主動(dòng)發(fā)現(xiàn)需求,做到眼里有活。”相關(guān)負(fù)責(zé)人說(shuō),通過(guò)這一技術(shù)的突破和延展,機(jī)器人不再是冰冷的執(zhí)行機(jī)器,而是記得你、理解你、主動(dòng)服務(wù)你的智能伙伴。
機(jī)器人不僅要眼里有活,還得“手上有數(shù)”。過(guò)去,讓機(jī)器人抓取某些物品時(shí),它往往能抓得起來(lái),但抓不好、控不住。為了解決這個(gè)行業(yè)難題,慧思開(kāi)物Agent搭載“視覺(jué)+觸覺(jué)”的感知能力,能根據(jù)目標(biāo)物品的特性調(diào)節(jié)自己的抓取力度,讓機(jī)器人更有感知、更能理解,最終實(shí)現(xiàn)“手上有數(shù)”的效果,日后也能安全、精準(zhǔn)、穩(wěn)定地干活。