機(jī)器人能夠?qū)ξ锢矶蓳碛兄庇X理解,聽起來可能像艾薩克·阿西莫夫的小說情節(jié)。不過,谷歌機(jī)器人部門的科學(xué)家卻透露,他們已經(jīng)打造出這樣的機(jī)器人。目前,即使是最有能力的機(jī)器人,也很難完成投擲、滑動(dòng)、旋轉(zhuǎn)、擺動(dòng)、接球和其他運(yùn)動(dòng)技能,但是這些科學(xué)家表示,他們的研究工作將為未來的機(jī)器人系統(tǒng)奠定基礎(chǔ)。
谷歌學(xué)生研究員Andy Zeng在一篇博客文章中寫道:“盡管機(jī)器人在高效抓取物體、視覺自適應(yīng)甚至從現(xiàn)實(shí)世界經(jīng)驗(yàn)中進(jìn)行學(xué)習(xí)等方面已經(jīng)取得了相當(dāng)大的進(jìn)步,但機(jī)器人操作仍然需要仔細(xì)考慮如何拾取、處理和放置各種物體——尤其是在非結(jié)構(gòu)化的環(huán)境中。但是,機(jī)器人能不能學(xué)會(huì)有利地使用動(dòng)力學(xué),培養(yǎng)物理‘直覺’,從而讓它們更有效地完成任務(wù)?”
為了回答這個(gè)問題,Zeng和同事們與普林斯頓、哥倫比亞和麻省理工學(xué)院的研究人員合作,開發(fā)了一種他們稱之為TossingBot的拾取機(jī)器人,該機(jī)器人可以學(xué)會(huì)抓取物體并將其扔進(jìn)“自然范圍”之外的盒子里。它不僅達(dá)到了之前最先進(jìn)模型的兩倍速度,而且實(shí)現(xiàn)了兩倍的有效放置范圍,并可以通過自我監(jiān)督進(jìn)行改善。
要想實(shí)現(xiàn)具有可預(yù)測(cè)性的投擲并不容易,即使對(duì)人類來說也是如此。抓力、姿勢(shì)、質(zhì)量、空氣阻力、摩擦力、空氣動(dòng)力學(xué)和無數(shù)其他變量都會(huì)影響物體的軌跡。通過反復(fù)試驗(yàn)來模擬射彈物理是有可能的,但Zeng指出,這將耗費(fèi)大量的計(jì)算資源,需要大量的時(shí)間,而且不會(huì)生成一般普遍的規(guī)律。
相反,TossingBot使用射彈彈道模型來估計(jì)物體到達(dá)目標(biāo)位置所需的速度,而且它使用端到端的神經(jīng)網(wǎng)絡(luò)——以生物神經(jīng)元為模型的數(shù)學(xué)函數(shù)層——根據(jù)來自頭頂攝像機(jī)的視覺和深度數(shù)據(jù)進(jìn)行訓(xùn)練,以此來預(yù)測(cè)基于估計(jì)值的調(diào)整度。Zeng說,這種混合方法使系統(tǒng)能夠達(dá)到85%的投擲準(zhǔn)確度。
教會(huì)TossingBot抓取物體有點(diǎn)棘手。首先,它需要反復(fù)嘗試“不好的”抓取,直到找到更好的方法,同時(shí)通過以前所未有的速度隨機(jī)投擲物體來提高投擲能力。經(jīng)過大約14小時(shí)、1萬次抓取和投擲嘗試后,TossingBot可以在大約87%的時(shí)間里牢牢抓取放置在雜亂堆積物品中的物體。
或許更令人印象深刻的是,經(jīng)過一兩個(gè)小時(shí)的訓(xùn)練,TossingBot可以適應(yīng)從未見過的地點(diǎn)和物品,比如假水果、裝飾物品和辦公用品。Zeng說:“TossingBot很可能學(xué)會(huì)更多地依賴幾何線索(如形狀)來學(xué)習(xí)抓取和投擲。這些新出現(xiàn)的特性都是自我學(xué)習(xí),除了任務(wù)級(jí)的抓取和投擲之外,沒有任何明確的監(jiān)督。然而,它們似乎足以使系統(tǒng)區(qū)分對(duì)象類別(如乒乓球和記號(hào)筆)。”
研究人員承認(rèn),由于TossingBot使用嚴(yán)格的視覺數(shù)據(jù)作為輸入,如果對(duì)易碎物體進(jìn)行測(cè)試,可能會(huì)妨礙它在測(cè)試中對(duì)新物體做出反應(yīng)的能力。但是他們也表示,結(jié)合物理學(xué)和深度學(xué)習(xí),將會(huì)是未來一個(gè)有希望的方向。
關(guān)鍵詞: 谷歌拾取機(jī)器人