幫我個忙,拿一下你旁邊的東西。隨便什么都行。即使這個東西是你以前從來沒有見過的,你的大腦還是會自動推理出你該怎樣抓這個東西,用多大的力量。這種智慧和靈巧讓你成為一個人類。 (你是人類吧?)
讓機(jī)器人去做同樣的事,你會得到一個空洞的眼神或者發(fā)現(xiàn)物體被冰冷的機(jī)器捏成一團(tuán)。機(jī)器人擅長做高強度的重復(fù)性工作,但他們在學(xué)習(xí)操控新物體方面仍然有待提高。所以一家名為Embodied Intelligence的公司應(yīng)運而生,它把機(jī)器人和人類的力量融合到一個新的系統(tǒng)中,使得研究人員可以更輕松地給機(jī)器人傳授新任務(wù)。它就像是一個虛擬現(xiàn)實游戲,只是你需要控制一個巨大的機(jī)器人。
如果你想教機(jī)器人去做一些像拿起扳手之類的事,方法有很多。第一個就是對它拿起東西所需要的所有動作進(jìn)行簡單粗暴的編程。一行接一行地敲代碼。這種方法非常沉悶和辛苦。
(L-R)Embodied Intelligence創(chuàng)始團(tuán)隊:Peter Chen(首席執(zhí)行官),Pieter Abbeel(總裁兼首席科學(xué)家),Rocky Duan(首席技術(shù)官),張?zhí)旌疲ㄑ芯靠茖W(xué)家)。
強化學(xué)習(xí)是一項更新、更復(fù)雜的技術(shù)。加州大學(xué)伯克利分校的實驗室和Embodied Intelligence一起對一個名叫Brett的機(jī)器人進(jìn)行了研究,這個機(jī)器人可以通過推測,自己將方塊放在方孔里。當(dāng)它每做出一個讓方塊接近洞口的隨機(jī)動作時,人工智能就會收到獎勵。幾次嘗試之后,機(jī)器人越來越接近目標(biāo)直到成功,它可以在10分鐘之內(nèi)通過自學(xué)掌握一個兒童游戲。
所以簡單粗暴的編程是不靈活的,而從頭開始進(jìn)行強化學(xué)習(xí)又非常耗時。畢竟機(jī)器人只是一個受物理世界規(guī)律束縛的物理機(jī)器,它只能在一定的時間內(nèi)進(jìn)行有限的嘗試。 (在模擬過程中使用強化學(xué)習(xí)可以大幅提高速度,因為虛擬的嘗試和錯誤發(fā)生地更快。)
模仿學(xué)習(xí)是一項更精確的技術(shù),一個操作員給機(jī)器人演示該如何把方塊放入方孔當(dāng)中。它跟直接操縱機(jī)器人一樣容易,但是機(jī)器人將無法自學(xué)新的任務(wù)。
Embodied Intelligence想要創(chuàng)造一個將模仿和強化混合起來的學(xué)習(xí)系統(tǒng)。通過VR頭顯和控制器,人類可以遙控機(jī)器人執(zhí)行某項任務(wù)。它在操作員和機(jī)器人之間創(chuàng)建了一個更加自然的動力學(xué)連接,為了與人類動作相匹配,機(jī)器會學(xué)習(xí)一些算法來引導(dǎo)機(jī)器人的運動。然后強化學(xué)習(xí)就開始了,機(jī)器人會通過反復(fù)試驗和錯誤來改善自己的動作,直到它可以比人類做得更好。
“通常情況下,你希望你的機(jī)器人是個超人,而不是和人類一樣。” Embodied Intelligence的聯(lián)合創(chuàng)始人兼總裁Pieter Abbeel說?!澳阆M鼈円坏┱莆樟艘豁椉寄埽涂梢酝ㄟ^自己的反復(fù)試驗,使得這項技能更快、更準(zhǔn)確、更可靠,這個過程不需要人類的持續(xù)指導(dǎo),因為人類的動作速度無法與機(jī)器人相媲美?!?/p>
想象一下未來的工廠。不再需要辛苦的程序員們?yōu)榱魉€上執(zhí)行不同的任務(wù)的每個機(jī)器人編寫代碼,而是只需在VR中展示動作。機(jī)器人起初可能會有些生疏,但隨著時間的推移,他們會用人工智能來熟悉自己的動作。隨著研究人員對算法的不斷改進(jìn),機(jī)器人可能會承擔(dān)起一項人類教授的特定任務(wù),并用通過自己的摸索去完成不同的事情。
這個系統(tǒng)仍然處于萌芽階段。目前它正在開發(fā)PR2研究機(jī)器人,這個機(jī)器人相對來說反應(yīng)較慢,動作較笨拙。目前來說任何現(xiàn)代機(jī)器人都遠(yuǎn)不如人類靈巧,所以即使它可以很好地學(xué)習(xí)操作員的動作,也不能復(fù)制抓取的細(xì)節(jié)。但是,如果Embodied intelligence有了自己的方法,那么制造商很快就可以向工廠推出可以效仿人類的機(jī)器人,然后讓他們進(jìn)行自我加強。
想象一下多個機(jī)器人一起使用這樣的系統(tǒng),可以達(dá)到怎樣的效果。如果你有100臺機(jī)器人通過網(wǎng)絡(luò)相互聯(lián)系,其中一臺學(xué)到了一些特別有用的東西,那么它就可以把這些知識傳遞給同伴。我們正在談?wù)撘粋€潛在的強大蜂巢思想。機(jī)器人甚至不必具有相同的形狀和尺寸。研究人員已經(jīng)想出了如何將知識在不同類型的機(jī)器之間轉(zhuǎn)換的方法。
就短時間內(nèi)來看,這個想法不僅能使機(jī)器人變得更加智能,也會使人類教起來更容易。在實驗室里編程需要花費大量時間并且需要具有博士學(xué)位,大多數(shù)人都不具備這兩項條件。 Embodied Intelligence的聯(lián)合創(chuàng)始人兼首席執(zhí)行官Peter Chen說:“我們意識到的是任何可以使用VR頭顯的人都能夠快速地為機(jī)器人傳授新技能。這種民主化將使機(jī)器人技術(shù)真正騰飛起來,傳統(tǒng)的機(jī)器人技術(shù)普及面遠(yuǎn)不及軟件,因為任何有電腦的人都可以修補它?!?/p>
這是否會使機(jī)器人更容易取代人類工作人員?當(dāng)然有可能。我們看到越來越多的機(jī)器人開始和人類一起工作,接手繁瑣而重復(fù)的任務(wù),讓工人可以去從事那些需要敏銳觸覺的獨特人類工作。如果我們希望這種關(guān)系可以達(dá)到更好的效果,就需要讓我們的機(jī)器人同事快速學(xué)習(xí),以免他們成為一種會用扳手打我們的頭的負(fù)擔(dān),而不是一種解脫。
- QQ:61149512