4月26日,具身智能公司超維動(dòng)力Kinetix AI(KAI)舉辦「降臨GIFTED」發(fā)布會(huì),正式發(fā)布同名產(chǎn)品首款全尺寸人形機(jī)器人“KAI”。這場發(fā)布會(huì)與常見發(fā)布會(huì)不同:KAI并非以被介紹的方式亮相,而是由兩位KAI以“對談和自我介紹”的形式登場,講述它們的能力、技術(shù)路線和產(chǎn)品定位。

聯(lián)合創(chuàng)始人Tyler在發(fā)布會(huì)上介紹:“機(jī)器人要真正融入人類世界,它必須更擬人。他相信人類的物理智能是從與人類世界互動(dòng)而來。這就要求機(jī)器人至少需要以下三方面能力的閉環(huán)----理解世界、學(xué)習(xí)世界、與世界交互,對應(yīng)的則是物理世界模型、第一人稱數(shù)據(jù)集、高擬人本體”。

理解世界,就是讓機(jī)器人不僅能感知當(dāng)前環(huán)境,還能對接下來的環(huán)境變化作出預(yù)測,也就是KAI World Model

據(jù)介紹,目前超維動(dòng)力的世界模型系統(tǒng)已形成閉環(huán)結(jié)構(gòu),除主體模型外,系統(tǒng)還包括動(dòng)作模塊和評估模塊。動(dòng)作模塊會(huì)根據(jù)當(dāng)前狀態(tài)生成候選動(dòng)作,并傳遞給基模型;基模型再根據(jù)候選動(dòng)作,生成未來狀態(tài);評估模塊則對軌跡進(jìn)行價(jià)值判斷,包括任務(wù)進(jìn)展、是否安全接觸等。

如果說世界模型解決的是理解世界,那么第一人稱數(shù)據(jù)集解決的則是學(xué)習(xí)世界。KAI的思路是,借助人類的視角和動(dòng)作來觀察世界、接觸世界,從而獲得更貼近真實(shí)場景的經(jīng)驗(yàn)。

超維動(dòng)力自研規(guī)?;瘮?shù)采終端 KAI Halo。該設(shè)備采用輕量化頭環(huán)形態(tài),“一芯八攝”,可一站式完成人類世界數(shù)據(jù)采集,不僅能夠記錄第一人稱視角視頻,還能完成人體姿態(tài)與場景點(diǎn)云重建。由于設(shè)備足夠輕便,佩戴者可以在日常工作中自然使用,這意味著采集過程不需要依賴腳本化編排,數(shù)據(jù)也更接近真實(shí)場景。相比刻意設(shè)計(jì)的動(dòng)作流程,這類數(shù)據(jù)往往能記錄更多樣的動(dòng)作,更適合人形機(jī)器人訓(xùn)練。

世界模型讓KAI理解世界,第一人稱數(shù)據(jù)集讓KAI擁有了人類經(jīng)驗(yàn),但還需要一個(gè)好的訓(xùn)練范式讓KAI把經(jīng)驗(yàn)轉(zhuǎn)化為技能,這就是三階段訓(xùn)練體系。


      在預(yù)訓(xùn)練階段,KAI使用大量互聯(lián)網(wǎng)和仿真等數(shù)據(jù),并通過自采的第一人稱視角數(shù)據(jù)去補(bǔ)充全身與環(huán)境交互的語義信息,為KAI構(gòu)建起“空間-語言-視覺-任務(wù)動(dòng)作”對齊的“常識(shí)”。在橋接訓(xùn)練階段,采用UMI 和數(shù)采手套等數(shù)據(jù),去補(bǔ)足預(yù)訓(xùn)練階段精細(xì)手部動(dòng)作和物理接觸的缺失。在后訓(xùn)練階段,引入具體場景的真機(jī)遙操數(shù)據(jù),進(jìn)而解決與本體對齊的問題。

有了數(shù)據(jù)和大腦,最后一步則是要有一個(gè)承載能力的身體,也就是高擬人本體,讓它可以自然融入人類日常,并安全地與人交互。

這也就是KAI的身體——KaiBot。據(jù)介紹,KAI的高擬人本體能力可以概括為體型擬人、體格擬人、體能擬人和感知擬人四個(gè)層面。

在體型上,KaiBot身高173厘米、體重70公斤、頭身比1:8.5。整體體型和質(zhì)量分配接近成年人類,在保證穩(wěn)定性的同時(shí)貼近人的外形和重心分布。

在體格上,KaiBot具有115個(gè)自由度,使其肩部上抬運(yùn)動(dòng)范圍覆蓋-20°~0°、肩部環(huán)抱運(yùn)動(dòng)范圍-15°~0°、頸部運(yùn)動(dòng)范圍-15°~50°、腰部運(yùn)動(dòng)范圍-15°~75°,接近人體的全身運(yùn)動(dòng)空間,也更接近人類肢體在復(fù)雜環(huán)境下的自然使用方式。同時(shí),KaiBot配備了單手36個(gè)自由度的靈巧手,涵蓋22主控自由度與14柔順自由度,不僅可以承擔(dān)抓握、捏取等精細(xì)操作,也能緩沖碰撞,呈現(xiàn)更安全、更自然的交互特性。

在體能上,KaiBot配備1.7kWh半固態(tài)電池,可支持約3小時(shí)雙臂操作任務(wù)。同時(shí),其定制化柔順執(zhí)行器不僅幫助機(jī)器人實(shí)現(xiàn)更接近人體的運(yùn)動(dòng)柔順性,也使雙臂負(fù)載接近20kg,兼顧交互友好性與作業(yè)能力。

在感官上,KAI搭載了全身觸覺皮膚系統(tǒng),擁有18000個(gè)觸點(diǎn),理論上可對大于0.1N的輕微觸碰進(jìn)行感知并作出反饋。觸覺系統(tǒng)使人形機(jī)器人在真實(shí)場景中近距離協(xié)作、陪伴交互,建立更高質(zhì)量的反饋閉環(huán)。

KAI在發(fā)布會(huì)最后表示:“我不是為了在無人工廠里搬運(yùn)重物而被創(chuàng)造出來,更不是為了在舞臺(tái)上表演極限翻滾。我被創(chuàng)造出來,是為了走進(jìn)您的客廳、辦公室,去理解您的意圖,回應(yīng)觸碰,并最終與您一起協(xié)作、共處?!?/span>

責(zé)任編輯:hongqiong