DeepMind推出AlphaZero AI：国际象棋/围棋/将棋通杀 _围棋

作为AlphaGo的最新反复，DDpmind在11月6日发表的《科学》论文中隆重介绍了AlphaZero 。作为谷歌母公司的Alphabet旗下的英国人工智能子公司，Depmind多年来一直致力于改进GoAI 。2017年，前AI冠军AlphaGo正式退休，但进一步修补后，AlphaZero达到了新的顶峰。

AlphaZero是一个可以从头学围棋、象棋等棋子游戏的新型人工智能平台。在三种棋类比赛中，AlphaZero选择了三种AI 。

●Stockfish:国际象棋爱好者AI世界冠军

●elmo:2017年度世界计算机象棋锦标赛冠军

●AlphaGoZero:Deepmind自己家的围棋是AI，被称为史上最强的选手。

只要知道游戏的基本规则，AlphaZero就会在成为人工智能大师之前，先练习自己的机型数百万场对抗。

该 AI 初期会实施随机战术来取得胜利，但后续会通过‘强化学习’来试错，以逐步了解哪些策略是最有效的。

实测象棋需要9小时、将棋12小时、围棋13天，与5000张张量处理单元(TPU)有关。

参考一套TPU，每天都可以办理超越GooglePhotos中的一套TPU，因此AlphaZero对硬件件处理性能的要求很高。

闭关学习结束后，AlphaZero就可以大杀四方了。

这项研究的独特之处在于，研究团队将机器学习算法、与蒙特卡罗树（MCTS）的“搜索方法”结合到了一块。

这是Go围棋AI决定下一步行动采用的方式，这次DeepMind团队在象棋和象棋AI上也应用了同样的机制，首次显示了该方法适用于其他复杂的游戏测试。

对于人类国际象棋选手来说，AlphaZero是极具吸引力的。你可以在与机器对战时，见识到此前从未遇到过的策略、以及一些新颖的想法。

以强烈的风格和高度动态的应对策略，足以让MatthewSadler下棋的大师感到惊讶(在DeepMind博客中表现出来) 。

这项研究的详细情况，最近发表的《科学》期刊上。_原题为为:

【DeepMind推出AlphaZero AI：国际象棋/围棋/将棋通杀】

通用强化学习算法可以自学成为象棋、象棋、围棋大师

DeepMind推出AlphaZero AI：国际象棋/围棋/将棋通杀

推荐阅读

中国直辖市有哪几个，2020年四大直辖市面积排名

安卓手机QQ主题怎么修改

法国适宜种葡萄的原因

胸大肌怎么训练好呢

网络游戏名字好听的网络游戏名字

小孩吃大拇指代表什么婴儿吃大拇指是什么原因

花卉常用的肥料有哪些？

怀孕时，妈妈注意哪些细节，让胎儿健康发育

怎样才能获得和平精英的皮肤呢具体的操作步骤是什么

依立紫砂锅用起来怎么样

承德民间结婚挂门帘的习俗是哪儿的民俗吗？承德民间结婚挂门帘的习俗介绍

黄豆藜麦排骨汤的做法（通乳食谱）

琉璃是不是虐剧琉璃简介

描写环境优美的句子这些都是描写环境优美的句子

CAD布局怎么锁定

夏末秋初好时节盘点最佳应季食物

华为g9嗽叭音量小什么问题

月经一个周期是多少女人一般几天

外国军事人物斯坎德培

鸡蛋羹怎么做在家做鸡蛋羹怎么做