百度AI學(xué)會了舉一反三 離強(qiáng)人工智能又近了一步
你一定知道,AI 在下圍棋上已經(jīng)比人類厲害了。不過,絕大多數(shù)在完成特定任務(wù)上性能卓越的 AI,實(shí)際上只是面向單一任務(wù)進(jìn)行訓(xùn)練出來的而已,如果一個(gè) AI 的任務(wù)是
2017-03-31 12:10:33
來源:新浪科技??

  你一定知道,AI 在下圍棋上已經(jīng)比人類厲害了。不過,絕大多數(shù)在完成特定任務(wù)上性能卓越的 AI,實(shí)際上只是面向單一任務(wù)進(jìn)行訓(xùn)練出來的而已,如果一個(gè) AI 的任務(wù)是下棋,它就只會一步一步下棋,你要是突然問他“怎么下才能贏?”它根本不知道,八成會宕機(jī)。

  這就是你暫時(shí)不需要擔(dān)心 AI 終結(jié)人類的原因:它不會舉一反三,沒法解決一些在認(rèn)知上跨度比較大的任務(wù)。舉個(gè)例子,在《坦克大戰(zhàn)》里,勝利的方式是盡量保存更多的磚塊,吃掉增益,擊毀所有的敵方坦克,一個(gè)正常的人類玩家可能玩上一兩盤就明白了,而 AI 可能會把所有的磚塊全都打掉,輸?shù)舫汕先f盤游戲才能迎來第一盤勝利。

  人很容易理解“保存磚塊只打坦克”這句話,但 AI 理解不了,它只會玩游戲,不會聽話。

  想要實(shí)現(xiàn)強(qiáng)人工智能,甚至通用人工智能,這個(gè)問題遲早有一天要解決。PingWest品玩發(fā)現(xiàn),近日百度發(fā)布的一篇論文顯示,該公司搭建了一個(gè) AI 系統(tǒng),組合了計(jì)算機(jī)視覺和自然語言處理兩種技術(shù),讓 AI 學(xué)會了“舉一反三”:在一個(gè)專門架設(shè)的游戲環(huán)境中,AI 控制的角色可以理解并執(zhí)行過去從未發(fā)出,也從未定義過的指令,且成功率達(dá)到了 90%。

  研究團(tuán)隊(duì)由深度學(xué)習(xí)研究院杰出科學(xué)家徐偉帶領(lǐng),采用的是監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)所組合的深度學(xué)習(xí)技術(shù)。研究人員設(shè)計(jì)了很簡單的游戲場景 XWORLD,在一個(gè) 8 x 8 的游戲空間,AI 控制一個(gè)主角,一些磚塊和可以“吃”的水果,位置均隨機(jī)。他們采用的訓(xùn)練房室很簡單,1)直接給出一句自然語言指令,比如“請前往蘋果的位置”,然后根據(jù) AI 的行為獎(jiǎng)罰;2)用自然語言向 AI 發(fā)問,比如“在北邊的水果是什么?”根據(jù)答案正確與否獎(jiǎng)罰。

  至于地圖什么情況、哪些是磚塊哪些是水果、北是什么方向、蘋果長啥樣,AI 則是采用計(jì)算機(jī)視覺來進(jìn)行判斷的。很快研究人員就發(fā)現(xiàn),AI 不需要以往那么多的訓(xùn)練次數(shù),就可以實(shí)現(xiàn)舉一反三,準(zhǔn)確地執(zhí)行一些從未聽過的新指令,比如“請去到無花果的西邊”、“你可以去蘋果和香蕉的中間嗎?”、“請移動(dòng)到紅色/綠色的蘋果”,以及回答非指令問題,比如“靠南的水果是什么”(西瓜)。

  如果你已經(jīng)學(xué)會了怎樣用水果刀削蘋果,那你幾乎不需要指導(dǎo)也能用水果刀削梨和火龍果。其實(shí)這就是舉一反三,因?yàn)橥ㄟ^將感官獲得的資訊進(jìn)行認(rèn)知整合(特別是語言方面),從而實(shí)現(xiàn)知識和經(jīng)驗(yàn)的遷移,對于人類而言是一件特別容易的事情。但在過去計(jì)算機(jī)一直無法實(shí)現(xiàn),除非人類對“反三”中每一種可能出現(xiàn)的狀況都預(yù)先編程。

  在徐偉團(tuán)隊(duì)論文描述的實(shí)驗(yàn)中,AI 系統(tǒng)能夠從訓(xùn)練指令中學(xué)習(xí)語法,處理和回答新的指令、問題,意味著計(jì)算機(jī)終于首次在某種特定的環(huán)境下獲得了舉一反三的能力。機(jī)器學(xué)習(xí)中,這種能力的術(shù)語叫做“零樣本學(xué)習(xí)”(zero-shot learning ability)。

  對于這項(xiàng)技術(shù),接下來百度還有新的打算。除了讓 AI 在 XWORLD 環(huán)境里增加新的功能,理解更多、更復(fù)雜的指令之外,徐偉團(tuán)隊(duì)還打算將它遷移到虛擬的三維空間中進(jìn)行訓(xùn)練,最終極目標(biāo)則是在實(shí)際環(huán)境中,讓人類教師用自然語言來訓(xùn)練機(jī)器人。

  不管終極目標(biāo)能否實(shí)現(xiàn),至少今天,在像人類一樣學(xué)習(xí)的道路上,機(jī)器又往前邁了一步。

最新文章
1
快手電商舉行2024華北達(dá)人雙十一啟動(dòng)會,助力達(dá)人大促GMV高效爆發(fā)
2
CNCC2024:可靈AI用戶已超360萬 獨(dú)立App即將上架
3
增混大電量時(shí)代來臨,寧德時(shí)代以驍遙電池驅(qū)動(dòng)市場與自身雙增長
4
補(bǔ)齊自研CPU拼圖后,高通統(tǒng)一了PC、手機(jī)、汽車芯片架構(gòu)
5
我國電信業(yè)擴(kuò)大對外開放,哪些行業(yè)將受益?
6
Mini LED背光產(chǎn)線又迎新玩家,助力智能電視行業(yè)逆勢回暖
7
走訪歐洲家電賣場,中外家電賣場竟有這些差異?
8
小米澎湃OS 2蛻變!盧偉冰:一眼快 一眼新
9
終于淘汰LCD!蘋果iPad mini 8首次升級OLED屏幕
10
新冷年+雙11+以舊換新,空調(diào)品質(zhì)換新怎么選?
11
方太高端全場景廚電睿隱系列發(fā)布,引領(lǐng)廚房未來十年變革
12
超越代際,以睿作答 | 方太2024幸福洞見大會暨全球新一代高端全嵌冰箱發(fā)布圓滿落幕
13
方太全球新一代高端全嵌冰箱 超越代際越極登場
14
快手電商推出“鴿王爭霸賽”活動(dòng),過億話題曝光量引爆賽鴿季熱度
15
點(diǎn)燃電競觀賽熱潮,2024 PEL秋季賽總決賽直播累計(jì)觀眾數(shù)量超4000萬
16
7個(gè)第一,11個(gè)首發(fā),訊飛星火放大招,大模型規(guī)模化落地可期!
17
全球手機(jī)市場,小米逼近三星蘋果
18
AI手機(jī)看榮耀:榮耀MagicOS 9.0正式發(fā)布,開啟手機(jī)自動(dòng)駕駛新時(shí)代
19
推動(dòng)行業(yè)標(biāo)準(zhǔn)化進(jìn)程,華寶新能電小二發(fā)布光充戶外電源(SG)企業(yè)標(biāo)準(zhǔn)
20
當(dāng)貝采用極米光機(jī),投影行業(yè)從競爭走向競合,格局打開了
關(guān)于我們

微信掃一掃,加關(guān)注

商務(wù)合作
  • QQ:61149512