Facebook參加星際AI大賽,結(jié)果......被完虐觀點(diǎn)
第八屆星際爭(zhēng)霸AI大賽(StarCraft AI Competition)終于落下帷幕。
第八屆星際爭(zhēng)霸AI大賽(StarCraft AI Competition)終于落下帷幕。
這次大賽選用的版本是《星際爭(zhēng)霸:母巢之戰(zhàn)》,所有參賽的AI在16臺(tái)虛擬機(jī)上,1v1捉對(duì)廝殺,為期兩周共進(jìn)行41580場(chǎng)大戰(zhàn)。按照最終的勝率來(lái)給參賽方進(jìn)行排名。
每局比賽60分鐘,未分高下時(shí)得分多者勝出。作弊或者計(jì)算超時(shí)都會(huì)被判出局。這次星際爭(zhēng)霸AI大賽共有28支隊(duì)伍參賽,其中有15支屬于獨(dú)立戰(zhàn)隊(duì)(Independent),其他基本來(lái)自大學(xué):
美國(guó)哈佛大學(xué)、荷蘭代爾夫特理工大學(xué)、瑞典皇家理工學(xué)院、荷蘭馬斯特里赫特大學(xué)、巴西米納斯聯(lián)邦大學(xué)、日本筑波大學(xué)、加拿大紐芬蘭紀(jì)念大學(xué)、法國(guó)南特大學(xué)、法國(guó)高等信息工程師學(xué)院、日本立命館大學(xué)、韓國(guó)世宗大學(xué)。
另外,還有三個(gè)隊(duì)伍是量子位格外關(guān)注的。
比方說(shuō)中國(guó)團(tuán)隊(duì)。
其中以獨(dú)立戰(zhàn)隊(duì)身份參賽的“CPAC”,背后是由Junge Zhang領(lǐng)銜的13人研發(fā)團(tuán)隊(duì),來(lái)自中科院自動(dòng)化研究所;這個(gè)星際AI基于Steamhammer bot,然后增加了一些新的策略,并通過(guò)機(jī)器學(xué)習(xí)的方式訓(xùn)練了一個(gè)多層感知網(wǎng)絡(luò)來(lái)生產(chǎn)戰(zhàn)斗部隊(duì)。
還有一個(gè)中國(guó)團(tuán)隊(duì)由Tang Zhentao領(lǐng)銜,代號(hào)“KillAll”。據(jù)推測(cè)應(yīng)該是來(lái)自中科院自動(dòng)化研究所復(fù)雜系統(tǒng)管理與控制國(guó)家重點(diǎn)實(shí)驗(yàn)室。
另一個(gè)值得關(guān)注的隊(duì)伍是“CherryPi”(櫻桃派),背后是來(lái)自Facebook人工智能研究實(shí)驗(yàn)室的八人團(tuán)隊(duì)。
有趣的是這場(chǎng)比賽的最終結(jié)果,不隸屬于任何機(jī)構(gòu)的獨(dú)立戰(zhàn)隊(duì)們包攬前三名。
“CPAC”以71%的勝率排名第四;“CherryPi”以69.08%的勝率排名第六;“KillAll”以43%的勝率排名第十八。第一名“ZZZKBot”勝率83.11%,平均用時(shí)8分鐘。
值得一提的是,這幾位AI在星際爭(zhēng)霸AI大賽中用的都是蟲(chóng)族。
Facebook的團(tuán)隊(duì),在這個(gè)大賽中顯得有些異類,畢竟這是唯一有企業(yè)背景的選手,而且是一個(gè)押注AI已久的科技巨頭。
科技巨頭的AI殺入《星際爭(zhēng)霸》并不稀奇。今年8月,Google旗下的DeepMind宣布進(jìn)軍星際,不過(guò)他們選擇的方向是《星際爭(zhēng)霸2》。
看起來(lái),這款游戲已經(jīng)成為AI巨頭爭(zhēng)霸的下一個(gè)戰(zhàn)場(chǎng)。
Facebook的人工智能團(tuán)隊(duì)至少已有80余人,帶領(lǐng)這個(gè)團(tuán)隊(duì)的是大名鼎鼎的Yann LeCun,他們已經(jīng)發(fā)表了很多研究和論文(其中三篇與《星際爭(zhēng)霸》有關(guān))。但目前Facebook在人工智能領(lǐng)域還沒(méi)有取得AlphaGo那樣的成就。
而這次參賽成績(jī)也表明,F(xiàn)acebook還有很長(zhǎng)的一段路要走。Facebook研究科學(xué)家Gabriel Synnaeve表示,他們把CherryPi當(dāng)做一個(gè)基線,以及未來(lái)繼續(xù)在星際領(lǐng)域進(jìn)行研究的基礎(chǔ)。“我們想看看它與現(xiàn)有bot相較如何,特別是測(cè)試一下是否有需要糾正的缺陷。”Gabriel Synnaeve說(shuō)道。
人工智能對(duì)于科技公司的重要性已經(jīng)不言而喻,而《星際爭(zhēng)霸》對(duì)于AI研究的重要性和挑戰(zhàn),不僅僅是指揮戰(zhàn)斗這么簡(jiǎn)單。與下圍棋這件事相比,《星際爭(zhēng)霸》的復(fù)雜性要大得多也要困難得多。
即便DeepMind現(xiàn)在也沒(méi)有突破性的進(jìn)展。《星際爭(zhēng)霸2》是個(gè)實(shí)用的基礎(chǔ)AI研究環(huán)境,因?yàn)橛螒虮旧韽?fù)雜多變,且勝利方式不固定。玩家想要取勝需要同時(shí)做多手準(zhǔn)備,比如管理并創(chuàng)造資源、指揮軍事單位和部署防御結(jié)構(gòu)等操作需要同時(shí)進(jìn)行,逐步完成。此外,玩家還需預(yù)測(cè)對(duì)手的策略。
這項(xiàng)任務(wù)確實(shí)不容易,但并不是無(wú)解。DeepMind和暴雪嘗試將游戲分為多個(gè)“迷你游戲”,將不同任務(wù)分解成“可管理的組塊”,比如建立特定單元、收集資源或在地圖上移動(dòng)等。
細(xì)分是為了方便研究人員進(jìn)行不同任務(wù)的測(cè)試比較及細(xì)化,最終在智能體中組合,從而教會(huì)智能體通關(guān)整個(gè)游戲。
至于這次大賽為什么沒(méi)用《星際爭(zhēng)霸2》,原因可能在于,主辦方還沒(méi)跟暴雪爸爸談好。
說(shuō)回這次的星際爭(zhēng)霸AI大賽。獨(dú)立參賽的隊(duì)伍,通常bot背后是程序員制定的規(guī)則和策略。比如摘得冠軍的ZZZKBot,背后是澳大利亞的程序員Chris Coxe。他獨(dú)自創(chuàng)建了這個(gè)AI,但其中只有一些簡(jiǎn)單的學(xué)習(xí)功能,背后更多是各種預(yù)先編輯好的策略。
而對(duì)于科技巨頭來(lái)說(shuō),他們更多的是依靠機(jī)器學(xué)習(xí),通過(guò)積累大量的游戲數(shù)據(jù),讓AI自己制定相應(yīng)的游戲策略,據(jù)說(shuō)這次Facebook也沒(méi)有把全部研究都注入CherryPi之中。盡管如此,CherryPi還是獲得了對(duì)手的肯定,獲得第二名的PurpleWave作者就表示,CherryPi對(duì)時(shí)機(jī)的把握讓他印象深刻。
那么獲勝的隊(duì)伍都依靠了什么策略和技術(shù)?這里做個(gè)簡(jiǎn)單介紹:
第一名:ZZZKBot
蟲(chóng)族,單基地Rush布局:4-Pool,Speedling,Hydra,Muta。使用手工編碼的邏輯,來(lái)進(jìn)行策略選擇。
這個(gè)bot其實(shí)只能執(zhí)行一種單基地Rush戰(zhàn)術(shù),但它的對(duì)手現(xiàn)在比較吃這一套。另外,這個(gè)bot能在游戲中學(xué)習(xí)一些策略,以判斷哪種Rush是最有效的。以及,這個(gè)bot幾乎沒(méi)有掌握任何戰(zhàn)斗中的微操作。
程序員Chris Coxe也評(píng)價(jià)道:“這原本只是想證明一個(gè)概念,源代碼并不是那么好。”
第二名:PurpleWave
這個(gè)bot主要是用Scala語(yǔ)言寫(xiě)出來(lái)的,作者是美國(guó)軟件工程師Dan Gant,他今年一月開(kāi)始啟動(dòng)這個(gè)項(xiàng)目。
PurpleWave看起來(lái)比第一名更為“AI”一點(diǎn),會(huì)微操作,有多種不同的策略。PurpleWave的高級(jí)決策被構(gòu)建為一個(gè)任務(wù)網(wǎng)絡(luò),它能根據(jù)對(duì)手以往的比賽情況,選擇不同的對(duì)抗策略。
第三名:Iron
這是去年的冠軍,作者是法國(guó)程序員Igor Dimitrijevic。Iron于2016年開(kāi)始研發(fā),前身是2015年參賽的Stone。
Iron是一個(gè)多智能體系統(tǒng),每個(gè)智能體控制一個(gè)單位。整體行為的魯棒性是其主要目標(biāo),每個(gè)智能體都是高度自主的,可以在25種行為之間切換。每場(chǎng)對(duì)決,Iron都采用相同的開(kāi)局,但對(duì)根據(jù)對(duì)手的情況進(jìn)行反應(yīng)和修改策略。
第四名:CPAC
團(tuán)隊(duì)名單:Junge Zhang,Xun Zhang,Qiyue Yin,Dong Zhan,Shihong Deng,Huikai Wu,Peixi Peng,Wenzhen Huang,Jing Kong,Debang Li,Yange Fang,Tairan Zhang,Junliang Xing。
來(lái)自中國(guó)的CPAC是首次參賽,整個(gè)研發(fā)耗時(shí)數(shù)月。
最后說(shuō)一下這個(gè)大賽的情況。
星際爭(zhēng)霸AI大賽,是加拿大紐芬蘭紀(jì)念大學(xué)David Churchill組織的年度活動(dòng)。這個(gè)比賽的目的是促進(jìn)和評(píng)估即時(shí)戰(zhàn)略游戲(RTS)對(duì)人工智能的意義。
整個(gè)比賽使用BWAPI,這是一種可以讓AI程序控制《星際爭(zhēng)霸:母巢之戰(zhàn)》的軟件庫(kù)。
另外還有一些基本數(shù)據(jù)分享一下。比如歷屆選手的種族分布,2017堪稱蟲(chóng)族大崛起:
如果你想?yún)⑴c這個(gè)競(jìng)賽,主辦方還提供了一個(gè)開(kāi)源項(xiàng)目UAlbertaBot,其中包含完整的文檔。不過(guò)這只是一個(gè)入門(mén)指導(dǎo),如果你想基于這個(gè)開(kāi)源代碼參賽,必須對(duì)其進(jìn)行重大修改。主辦方也不想一個(gè)bot在多個(gè)副本里展開(kāi)競(jìng)爭(zhēng)。
1.TMT觀察網(wǎng)遵循行業(yè)規(guī)范,任何轉(zhuǎn)載的稿件都會(huì)明確標(biāo)注作者和來(lái)源;
2.TMT觀察網(wǎng)的原創(chuàng)文章,請(qǐng)轉(zhuǎn)載時(shí)務(wù)必注明文章作者和"來(lái)源:TMT觀察網(wǎng)",不尊重原創(chuàng)的行為T(mén)MT觀察網(wǎng)或?qū)⒆肪控?zé)任;
3.作者投稿可能會(huì)經(jīng)TMT觀察網(wǎng)編輯修改或補(bǔ)充。