打敗DOTA2頂級玩家的機(jī)器人到底強(qiáng)在哪?

2017-08-21 來源:網(wǎng)絡(luò)采編 編輯:蘇輕衣 分類:DOTA2

  最近AI圈發(fā)生了兩件大事。第一件是DeepMind、Facebook等AI巨頭對《星際爭霸》研究興趣濃厚,公開發(fā)布研究工具和數(shù)據(jù);第二件是Open AI的機(jī)器人在dota2比賽中戰(zhàn)勝了人類頂級職業(yè)玩家。Q1j中國電競網(wǎng)

  至此,繼橫掃人類國際象棋大師和圍棋大師后,人工智能如今又將風(fēng)靡全球的電子競技游戲Dota2攻陷?梢灶A(yù)見,在很短的將來,萬眾矚目的《王者榮耀》頂級玩家,也會被人工智能打敗。Q1j中國電競網(wǎng)

  DeepMind等公司已經(jīng)在《星際爭霸》上研究了一段時間,但目前為止,根據(jù)前不久剛剛發(fā)布的最新進(jìn)展,相關(guān)研究還沒有取得重大突破。Q1j中國電競網(wǎng)

  倒是OpenAI公司打敗DOTA人類頂級職業(yè)玩家,率先取得令人興奮的成就,一躍成為AI圈中的熱點(diǎn)。Q1j中國電競網(wǎng)

  回顧賽事,OpenAI公司的機(jī)器人表現(xiàn)可以說是非常“強(qiáng)悍”,出手“快”、“準(zhǔn)”、“狠”,手法嫻熟,不僅會卡兵、補(bǔ)刀,還會取消掉技能抬手,而且具有強(qiáng)烈的攻擊性,連續(xù)兩局狂虐Dendi。Q1j中國電競網(wǎng)

  OpenAI的工程師表示,他們對機(jī)器人訓(xùn)練了2周,就獲得了足以擊敗全球最佳Dota 2專業(yè)玩家的能力。Q1j中國電競網(wǎng)

  伊隆·馬斯克看了戰(zhàn)況之后,抑制不住內(nèi)心激動,在推特上公開宣稱:OpenAI搞出了史上首個擊敗電子競技頂級玩家的人工智能。這比搞國際象棋和圍棋什么的復(fù)雜多了。Q1j中國電競網(wǎng)

        

  這次打敗DOTA人類選手比賽的難度究竟有多大?Q1j中國電競網(wǎng)

  雖然OpenAI公司沒有公布更多細(xì)節(jié),不過,我們可以根據(jù)已有的信息進(jìn)行客觀評價。Q1j中國電競網(wǎng)

  1、屬于多人在線戰(zhàn)術(shù)競技游戲(MOBA)中的單人模式。這次是在中路進(jìn)行影魔的SOLO對決,屬于1V1遭遇戰(zhàn)模式,需要戰(zhàn)爭迷霧隱藏的信息較少,與5V5模式在難度上還有較大差距。Q1j中國電競網(wǎng)

  正常的DOTA 2游戲中,2支對抗隊伍各由5名玩家組成,游戲過程中需要隨時調(diào)整作戰(zhàn)策略、需要大量的團(tuán)隊溝通和協(xié)調(diào),任意一名玩家都可以隨時根據(jù)戰(zhàn)況,召喚其他隊友組織支援、抓捕或埋伏,突發(fā)情況多、對抗較為激烈,相互配合和節(jié)奏的把握非常重要,比賽時長通常要45分鐘。Q1j中國電競網(wǎng)

  在1v1模式中,擊敗對手主要靠機(jī)械技能和短期策略,并不涉及長期規(guī)劃和協(xié)調(diào),而后者才是對當(dāng)前AI技術(shù)來說最具挑戰(zhàn)性的部分。因此,OpenAI計劃在明年推出可以進(jìn)行5V5協(xié)同作戰(zhàn)的更高智能的機(jī)器人。Q1j中國電競網(wǎng)

  2、相比圍棋,DOTA對戰(zhàn)中機(jī)器人的反應(yīng)時間占據(jù)優(yōu)勢。AlphaGo和柯潔對戰(zhàn)時,雙方時間都是3小時,時間的增加,有利于人類棋手發(fā)揮。Q1j中國電競網(wǎng)

  實(shí)際上,時間長短對于AlphaGo來說并不重要,因?yàn)樗恳徊狡宓臎Q策時間最多只需10秒。這次DOTA對戰(zhàn)則不同,人類選手直面機(jī)器人,需要幾乎在一瞬間大致估計出與對手之間的距離,是否進(jìn)行攻擊、是否值得背水一戰(zhàn),再通過神經(jīng)系統(tǒng)發(fā)出信號控制雙手操縱鼠標(biāo)和鍵盤,這一連串的動作需要耗費(fèi)大量時間。Q1j中國電競網(wǎng)

  OpenAI機(jī)器人可以獲得精準(zhǔn)的對手位置、技能冷卻時間信息,并迅速計算出準(zhǔn)確的攻擊時間節(jié)點(diǎn),確保將對手一擊致命。仔細(xì)觀察對戰(zhàn)過程,你可以看到,機(jī)器人有幾次攻擊都是在最大距離上展開,最后在短短10分鐘贏得對戰(zhàn)。Q1j中國電競網(wǎng)

    為何馬斯克對機(jī)器人的這次成功這么看重?    

  為何馬斯克對機(jī)器人的這次成功這么看重?Q1j中國電競網(wǎng)

  “自我對局”(Self-play)的理念是OpenAI研發(fā)的關(guān)鍵。OpenAI的機(jī)器人整個學(xué)習(xí)過程隨機(jī)開始,并且通過和自己對抗進(jìn)行學(xué)習(xí)。OpenAI的CTO Greg Brockman介紹,技術(shù)人員通過神經(jīng)網(wǎng)絡(luò)對機(jī)器人進(jìn)行了數(shù)千次的自我對局進(jìn)行訓(xùn)練。自我對局的參與人選擇針對其對手的平均行為的最佳反應(yīng)。Q1j中國電競網(wǎng)

  因此,OpenAI研發(fā)的機(jī)器人,可以從完全的隨機(jī)狀態(tài)一步步發(fā)展到如今的世界頂級水平。雖然這并不是最新最前沿的理論,但令人的震驚的是,機(jī)器人學(xué)會了人類玩家已經(jīng)在使用的技術(shù),并吸收為自己所用,并用來打敗人類玩家。Q1j中國電競網(wǎng)

  谷歌公司開發(fā)的AlphaGo在打敗了人類頂級選手李世石、柯潔之后,宣布永久退出圍棋比賽。同樣,OpenAI公司開發(fā)這樣一個機(jī)器人,并不是為了打敗DOTA人類職業(yè)玩家這么簡單。Q1j中國電競網(wǎng)

  自主學(xué)習(xí)游戲規(guī)則,通過自我對局進(jìn)行訓(xùn)練,能夠掌握復(fù)雜***游戲的機(jī)器人可以有其他更廣闊的用途。最直接的例子是,圍棋選手已經(jīng)開始學(xué)習(xí)AlphaGo機(jī)器人的下棋方式。Q1j中國電競網(wǎng)

  同樣,一些DOTA游戲玩家開始利用OpenAI公司機(jī)器人進(jìn)行日常訓(xùn)練。智能機(jī)器人可以為游戲娛樂產(chǎn)業(yè)提供更多價值,游戲娛樂也會助推人工智能技術(shù)快速發(fā)展。Q1j中國電競網(wǎng)

  AI公司的目標(biāo):建立更加通用的智能系統(tǒng)Q1j中國電競網(wǎng)

  顯然,OpenAI公司的雄心不止于此,“我們所建立的是一個普遍的學(xué)習(xí)系統(tǒng),盡管它在很多方面仍然受到限制,但它仍然能擊敗最優(yōu)秀的人類專家,”Brockman說,“這是朝著向建立更通用的系統(tǒng)邁出的關(guān)鍵一步,它可以學(xué)習(xí)真正復(fù)雜的、重要的現(xiàn)實(shí)世界里的任務(wù),比如做一名外科醫(yī)生。”Q1j中國電競網(wǎng)

  不僅在電子競技、醫(yī)療領(lǐng)域,OpenAI公司的這項技術(shù)在家政服務(wù)機(jī)器人領(lǐng)域和軍用機(jī)器人領(lǐng)域可能會發(fā)揮更大的價值。Q1j中國電競網(wǎng)

  最近人民網(wǎng)報道,有網(wǎng)友買掃地機(jī)器人后淚崩,仿佛買了一個智障,肆意展示各種蠢萌技能:掃地2年了,每天都會在在盥洗室地毯上被卡住,在沙發(fā)拐角上被卡住,在各種意想不到的角度上被卡住,和各種桌子腿過不去。Q1j中國電競網(wǎng)

  目前在售的這類掃地機(jī)器人有一個救命技能,被卡住了就發(fā)求救信號,讓人把它搬出來,感覺它的主業(yè)不是打掃衛(wèi)生,而是負(fù)責(zé)搞笑賣萌。Q1j中國電競網(wǎng)

  可以預(yù)見,采用“自我對局”(Self-play)理念來提升掃地機(jī)器人的學(xué)習(xí)能力,可以在隨機(jī)探索整個室內(nèi)環(huán)境的過程中,通過和自己、和家庭環(huán)境進(jìn)行對抗學(xué)習(xí),不斷提升對整體環(huán)境的感知應(yīng)對能力,最終達(dá)到人類保潔水平。Q1j中國電競網(wǎng)

  進(jìn)行更大強(qiáng)度的訓(xùn)練,甚至可以成為一個頂級的家庭衛(wèi)生保潔員,避免因?yàn)楸豢ㄗ☆l頻向人類求助的窘迫,成為真正意義上的智能家居產(chǎn)品。Q1j中國電競網(wǎng)

  在軍用領(lǐng)域,“自我對局”(Self-play)的設(shè)計理念同樣大有可為。2015年9月,美國海軍陸戰(zhàn)隊開始測試谷歌旗下機(jī)器人公司波士頓動力開發(fā)出的新一代機(jī)械狗Spot,而這款機(jī)械狗的“前輩”BigDog早就在2014年在夏威夷投入使用了。Q1j中國電競網(wǎng)

  這只機(jī)器狗只是被看成是可以執(zhí)行偵察和搜索任務(wù)軍犬的替代品。準(zhǔn)確來說,這不僅僅是一條軍犬,進(jìn)行深度改造后,可以變?yōu)橐粋可以在戰(zhàn)區(qū)和災(zāi)區(qū)提供導(dǎo)航,執(zhí)行搜索任務(wù),排查建筑物危險,裝備上武器就可以作戰(zhàn)的超級士兵。Q1j中國電競網(wǎng)

  同樣是激烈的對戰(zhàn)環(huán)境,在DOTA2中可以迅速準(zhǔn)確評估戰(zhàn)況、動作靈活、攻擊性強(qiáng)的OpenAI公司機(jī)器人給我們展示了其強(qiáng)大的學(xué)習(xí)、超越能力,借鑒和改進(jìn)機(jī)器人背后的通用學(xué)習(xí)系統(tǒng),用來提升軍用機(jī)器人的學(xué)習(xí)能力、偵查作戰(zhàn)能力,對于保存軍隊有生力量具有重要意義。Q1j中國電競網(wǎng)

  創(chuàng)辦特斯拉公司大獲成功的硅谷奇才伊隆·馬斯克,可能正是看中了這項技術(shù)蘊(yùn)含的潛在巨大商業(yè)價值而興奮不已。Q1j中國電競網(wǎng)

聲明:中國電競網(wǎng)(5asj.com)登載此文出于傳遞更多信息之目的,并不代表本站立場

圖文廣告位招租:800X100 QQ聯(lián)系:6476128

關(guān)于我們  |  商務(wù)洽談  |  聯(lián)系我們  |  友情鏈接  |  版權(quán)聲明  |  站務(wù)聯(lián)系QQ:8896 - 0575
Copyright © 2015-2018 中國電競網(wǎng) sdoldhj.cn V2.0 打造最專業(yè)的電競游戲門戶網(wǎng)站