正在阅读：AlphaZero问世：完爆围棋国际象棋日本将棋AlphaZero问世：完爆围棋国际象棋日本将棋

2017-12-08 17:16 出处：其他作者：PConline 责任编辑：wuyiying1

　　【PConline资讯】12月7日消息日前，DeepMind团队发表了最新论文，提出了全新的强化学习算法AlphaZero，它是一种可以从零开始，通过自我对弈强化学习在多种任务上达到超越人类水平的新算法，堪称“通用棋类AI”。

通用AI问世！AlphaZero强化学习算法8小时完爆人类

　　据了解，AlphaZero算法可以再8个小时训练击败李世石版本AlphaGo；12小时训练击败世界顶级的国际象棋程序Stockfish；14小时训练击败世界顶级将棋程序Elmo。这是DeepMind团队继AlphaGo Zero的研究问世之后，带给我们的又一全新算法，它是“更通用的版本”。

　　此外，我们看到这次的AlphaZero与AlphaGo Zero有几点不同，首先AlphaGo Zero是在假设结果为赢/输二元的情况下，对获胜概率进行估计和优化。而 AlphaZero会将平局或其他潜在结果纳入考虑，对结果进行估计和优化。其次， AlphaGo和AlphaGo Zero会转变棋盘位置进行数据增强，而AlphaZero不会。第三， AlphaZero只维护单一的一个神经网络，这个神经网络不断更新，而不是等待迭代，四， AlphaZero中，所有对弈都重复使用相同的超参数，因此无需进行针对特定某种游戏的调整。

相关文章

ChinaJoy线上展开幕！PConline邀你体验MetaCJ元宇宙数字世界 QQ没人用了吗？活跃用户只有微信的44％微信月活12.991亿视频号使用时长逼近朋友圈腾讯称微信支付手续费让利约30亿 2024年到期拯救强迫症：Edge右键菜单终于支持黑夜模式微信macOS版获更新：聊天记录迁移功能终于来了腾讯截至6月底超11万员工：平均月薪达8.54万元腾讯二季度营收1340亿元微信月活用户12.99亿充值腾讯业务的用户：视频和音乐会员合计超2亿腾讯：公司股价被严重低估有大量弹药继续回购

聚超值·精选

关注我们

聚超值

热门排行

热门软件

PC软件 安卓应用 iOS应用 手游电脑版

游戏专区

资讯|曝《上古卷轴6》2025-26年发售背景在落锤省

资讯|塞班经典国产手游《七夜》高清重制版实机演示

资讯|《守望先锋2》加入计分板功能玩家：不能划水了

IT百科 热门专题

ETC免费办？当心猫腻

当心这种微信诈骗！

细思极恐！这些微信清粉软件可能暗含大阴谋

库克又对你的iPhone下手了，比让手机变卡更狠

除了反向绕行80公里，网约车还有哪些坑爹操作？

让你看得怀疑人生的支付宝账单，是怎么算出来的？

PPT制作软件

抢票软件大全

牛市炒股利器合集

看美剧软件大全

看日漫软件排行榜

安卓模拟器电脑版下载合集

汽车资讯

正在加载中...

成都车展宏光MINI EV 普拉多欧拉黑猫途达起亚嘉华玛奇朵皇冠陆放奔驰C级哈弗神兽坦克600 奥迪Q5 思域卡罗拉双擎E+ 轩逸太平洋汽车网app 新能源车

最新资讯离线随时看 聊天吐槽赢奖品