讓AI玩轉斗地主 快手實踐課題獲Deecamp2019最佳團隊獎
DeeCamp2019人工智能訓練營在北京中國科學院大學雁棲湖校區(qū)舉辦全國成果展示暨結營儀式。快手發(fā)起的實踐課題“挑戰(zhàn)快手小游戲AI”、“端上AI助你走進名畫”分別獲得DeeCamp2019最佳團隊獎、最佳技術獎。DeeCamp人工智能訓練營由教育部、創(chuàng)新工場、北京大學聯(lián)合主辦,今年有超過1萬人次報名,最終600名學生入選。4周的時間內,學員接受了頂級 AI 大牛導師的「學術+產業(yè)」課程培訓,共計
2019-08-21 13:30:29
來源:釘科技??

DeeCamp2019人工智能訓練營在北京中國科學院大學雁棲湖校區(qū)舉辦全國成果展示暨結營儀式??焓职l(fā)起的實踐課題“挑戰(zhàn)快手小游戲AI”、“端上AI助你走進名畫”分別獲得DeeCamp2019最佳團隊獎、最佳技術獎。

DeeCamp人工智能訓練營由教育部、創(chuàng)新工場、北京大學聯(lián)合主辦,今年有超過1萬人次報名,最終600名學生入選。4周的時間內,學員接受了頂級 AI 大牛導師的「學術+產業(yè)」課程培訓,共計完成了 50 個 AI 實踐課題。

image.png

“挑戰(zhàn)快手小游戲AI”獲最佳團隊獎

4周時間,學員們完成了由 22 家企業(yè)發(fā)起的 50 個 AI 相關課題,接受了總計 115 位來自企業(yè)的技術負責人和工程師的課題輔導。實踐課題全部基于真實世界場景精心設計,力求貼近產業(yè)一線需求、提高學生動手能力。其中4個課題為快手發(fā)起,包括挑戰(zhàn)快手小游戲AI、端上AI助你走進名畫、多模態(tài)AI音樂生成、質量感知的媒體傳輸優(yōu)化。結營儀式當天,“挑戰(zhàn)快手小游戲AI”獲得最佳團隊獎,“端上AI助你走進名畫”獲得最佳技術獎。

斗地主要解決的是不完美信息下博弈問題,是要在無法看見其他玩家手牌的前提下,對游戲中的14種合法牌型、13551種合法出牌、10的30次方的狀態(tài)空間和10的85次方的游戲樹進行全面考慮,整體難度較高。從技術角度看,該項目將游戲領域內的領先核心算法應用到斗地主中;其次,結合RankSVM思路,設計了新的斗地主監(jiān)督學習模型;小組還設計了多個強化學習模型,使用強化學習進行多模型融合。

項目團隊沒有一味追求勝率,通過調試做到一個和人類玩家相似的勝率結果,更加擬人化。當人類與人類對戰(zhàn)時,人類作為地主的勝率為52.4%、作為農民的勝率為47.8%;而該項目小組研發(fā)的AI在與人類進行對戰(zhàn)時,AI作為地主的勝率為58.6%、作為農民的勝率為41%。

快手導師:學員們的探索性方法帶來驚喜

快手游戲聯(lián)合實驗室提供了此次挑戰(zhàn)快手小游戲AI”的課題,并指導學員完成此次實踐課題。該課題學員提供了一個設計游戲AI從0到1的完整歷程,學員能體驗跟自己設計的AI共同成長的默契。快手游戲聯(lián)合實驗室,致力于利用人工智能技術全面賦能游戲,使用戶獲得更佳的游戲體驗,同時進行前沿的人工智能技術研究及應用。

image.png

不完美信息博弈是非常挑戰(zhàn)的AI難題,學員們產出的探索性結果和方法也給我們帶來了驚喜,我們會加大投入探索不完美信息博弈的游戲”。 快手游戲聯(lián)合實驗室劉霽介紹說,不完美信息博弈是非常挑戰(zhàn)的AI難題,斗地主AI的難題在于它是一個3人游戲;兩人組隊合作跟另外一個人博弈,如何組隊,以及隊內信息又是不共享的,這使得斗地主的博弈問題更加復雜既需要算法的精巧設計,又需要高效得利用算力。

快手導師迅速幫助學員們抓住課題重點,從叫牌階段策略,出牌過程策略,預測對方牌型等側重點進行指導。利用游戲AI的經驗,初步提供了不同的AI模型在游戲中的基本能力和實現(xiàn)效果,強調了非全信息下的博弈難度,便于學員們進行理解和選擇,學員在2天的時間內快速確定了最終的開發(fā)框架。

因為斗地主是不完美信息博弈沒有成功的經驗可以借鑒,快手導師指導團隊制定一個套多模型融合的策略,把基于規(guī)則的AI,基于強化學習的AI,基于蒙特卡洛搜索的AI(Alphago的思路),基于CFR的AI(德州撲克的思路),以及基于模仿學習的AI通過一個整體的強化學習AI融合一起。時間緊任務又有挑戰(zhàn)的情況下,快手導師提供了對每一種AI設計方案方向性的指導并且參與細節(jié)的討論,最終學員圓滿完成課題。

快手游戲聯(lián)合實驗室于明澤介紹說,這次的課題在學術上存在挑戰(zhàn),有助于推動產學研結合??焓钟螒蚵?lián)合實驗室提供了豐富的AI應用場景,比如驗證游戲核心玩法、文字音頻圖形的AI處理、數(shù)據(jù)分析、個性化決策、自動推薦等。游戲環(huán)境是全數(shù)字環(huán)境,便于訓練數(shù)據(jù)的采集,利于技術的落地。此外,游戲本身是強商業(yè)化的方向,更容易創(chuàng)造出兼具學術意義和商業(yè)價值的產品。

最新文章
1
SUSE推出一站式可觀測性平臺SUSE Cloud Observability,助力Rancher社區(qū)用戶告別多工具監(jiān)控
2
史上最薄iPhone 17 Air 背后秘密?
3
華為Mate 70 Pro推出鴻蒙NEXT先鋒版,出廠即享純血鴻蒙
4
一加 Ace 5系列首次同時登場,“驍龍雙旗艦”下月見!
5
信通院:10月國內手機市場出貨量2967.4萬部,5G手機占比90.1%
6
算法至上時代,該如何掙破“信息繭房”?
7
全球半導體市場高速反彈?新紫光陳杰的話“真相”了
8
三季度電視出貨量同比下降6.6%,75英寸及以上同比提升5.9%
9
中興通訊、華大北斗戰(zhàn)略合作:汽車用上5G+北斗導航
10
華為Mate 70系列采用側面指紋識別,友商旗艦會不會跟?
11
撕掉“傳統(tǒng)”標簽,家電企業(yè)都講了哪些新“故事”?
12
Forter發(fā)布針對跨境電商的消費者身份安全技術革新
13
iPhone 17系列迎來“重大設計變更”,同時采用鋁和玻璃兩種材料
14
華為只打高端局,和蘋果、奔馳硬碰硬
15
五成英美受訪者表示,今年黑五消費可能持平或高于往年
16
5G“揚帆”再升級!2027年我國5G網絡接入流量占比將超75%
17
2024三季度全球電視出貨量同比增長11%,中國市場面臨下滑
18
兩家家電企業(yè)突發(fā)高層變動,白電行業(yè)迎新變數(shù)?
19
REDMI K80系列今日發(fā)布 關鍵配置提前看:性能、屏幕、影像史上最強
20
斷供7nm芯片!臺積電:在中美半導體之間保持中立不現(xiàn)實
關于我們

微信掃一掃,加關注

商務合作
  • QQ:61149512