国产香蕉伊蕉伊中文在线视频,国产v亚洲v天堂无码久久久91

首頁家居家電手機(jī)數(shù)碼 IT互聯(lián)網(wǎng)電商零售汽車出行游戲娛樂半導(dǎo)體新基建酷品評(píng)測(cè)

原創(chuàng)

2020-12-25 08:00:24

來源：釘科技??

2016年,Alphabet的DeepMind與AlphaGo一起問世,該AI一直領(lǐng)先于人類最好的棋手。一年后,工作繼續(xù)完善,AlphaGo Zero創(chuàng)建。AlphaGo通過觀察業(yè)余比賽和專業(yè)比賽學(xué)會(huì)了圍棋,而AlphaGo Zero能通過簡單地與自己對(duì)戰(zhàn)來掌握游戲。然后,DeepMind創(chuàng)建了AlphaZero,該AlphaZero可以使用單一算法玩圍棋、國際象棋和將棋。

這些AI的共同特點(diǎn)是,它們必須掌握游戲規(guī)則然后再進(jìn)行培訓(xùn)。DeepMind的最新AI MuZero不需要游戲的規(guī)則即可掌握游戲。與DeepMind之前的AI算法一樣,MuZero具有相同甚至更好的能力。

MuZero沒有嘗試對(duì)所有模型進(jìn)行建模,而只是嘗試考慮那些對(duì)決策至關(guān)重要的因素。正如DeepMind所指出的,這是作為人類所做的事情。當(dāng)大多數(shù)人看著窗外,看到地平線上形成烏云時(shí),他們通常不會(huì)陷入烏云是如何形成之類的問題。相反,它們思考的是如果出門應(yīng)該穿什么以防止被淋濕。MuZero就是做類似這樣的事情。

MuZero在做決定時(shí)會(huì)考慮三件事。首先,它會(huì)考慮上一次行動(dòng)的結(jié)果、當(dāng)前所處的位置以及下一次行動(dòng)的最佳方案。這種看似簡單的方法使MuZero成為迄今為止DeepMind最有效的算法。在測(cè)試中DeepMind發(fā)現(xiàn),MuZero與之前的AI算法表現(xiàn)都一樣好。而且,給它的時(shí)間越多,它提供的解決方案就越好。即使加入了時(shí)間限制,比如在行動(dòng)前限制吃豆人女士的模擬次數(shù),MuZero也取得了不錯(cuò)的效果。

該公司表示,MuZero的學(xué)習(xí)能力有一天可以幫助解決沒有簡單規(guī)則領(lǐng)域的復(fù)雜問題。(釘科技根據(jù)《engadget》消息編譯)

原創(chuàng)文章

趙明離職，榮耀兩大看點(diǎn)：IPO與份額止跌

折疊屏與AI，誰會(huì)是2025智能手機(jī)市場(chǎng)最大亮點(diǎn)？

追覓、石頭掃機(jī)器加裝機(jī)械臂，國產(chǎn)清潔電器越來越像“機(jī)器人”了

力推全棧聯(lián)動(dòng)式大規(guī)模創(chuàng)新，亞馬遜云科技加速生成式AI價(jià)值釋放

CES觀察：空調(diào)新年出海第一站，“中國風(fēng)”如何席卷全球？

空調(diào)2025迎重大利好，這三個(gè)品牌值得重點(diǎn)關(guān)注

頭部品牌海外集體發(fā)新，投影成2025家電出海生力軍？

CES觀察：同樣聚焦畫質(zhì)+AI，彩電巨頭們?nèi)绾瓮娉鰝€(gè)性？

最新文章

趙明離職，榮耀兩大看點(diǎn)：IPO與份額止跌