DeepMind推出AlphaZero AI:国际象棋/围棋/将棋通杀
AlphaZero是一个可以从头学围棋、象棋等棋子游戏的新型人工智能平台 。在三种棋类比赛中,AlphaZero选择了三种AI 。
●Stockfish:国际象棋爱好者AI世界冠军
●elmo:2017年度世界计算机象棋锦标赛冠军
●AlphaGoZero:Deepmind自己家的围棋是AI,被称为史上最强的选手 。
只要知道游戏的基本规则,AlphaZero就会在成为人工智能大师之前,先练习自己的机型数百万场对抗 。
该 AI 初期会实施随机战术来取得胜利,但后续会通过‘强化学习’来试错,以逐步了解哪些策略是最有效的 。
实测象棋需要9小时、将棋12小时、围棋13天,与5000张张量处理单元(TPU)有关 。
参考一套TPU,每天都可以办理超越GooglePhotos中的一套TPU,因此AlphaZero对硬件件处理性能的要求很高 。
闭关学习结束后,AlphaZero就可以大杀四方了 。
这项研究的独特之处在于,研究团队将机器学习算法、与蒙特卡罗树(MCTS)的“搜索方法”结合到了一块 。
这是Go围棋AI决定下一步行动采用的方式,这次DeepMind团队在象棋和象棋AI上也应用了同样的机制,首次显示了该方法适用于其他复杂的游戏测试 。
对于人类国际象棋选手来说,AlphaZero是极具吸引力的 。你可以在与机器对战时,见识到此前从未遇到过的策略、以及一些新颖的想法 。
以强烈的风格和高度动态的应对策略,足以让MatthewSadler下棋的大师感到惊讶(在DeepMind博客中表现出来) 。
这项研究的详细情况,最近发表的《科学》期刊上 。_原题为为:
【DeepMind推出AlphaZero AI:国际象棋/围棋/将棋通杀】
通用强化学习算法可以自学成为象棋、象棋、围棋大师
推荐阅读
- 婴幼儿产品再度创新,大宇推出便携调奶器,扬言改变中国育儿观?
- qq影像
- 意大利一酒店推出24K黄金编制而成的床品 世界上最贵的床品
- NVIDIA推出深度学习专用主机DIGITS DevBox
- 保龄球教程 要认真练习哦
- 快的将推出“一号校车”,服务小学生
- 华为推出企业级PCI
- 外媒:辽宁丹东赴朝游回暖 有线路推出1小时被订空
- 手机版推出临近,Windows 10 版 Office 更新
- Intel推出DC S3510系列企业级SSD