我们已经更新我们的隐私政策使它更加清晰我们如何使用您的个人资料。

我们使用cookie来提供更好的体验。你可以阅读我们的饼干的政策在这里。

广告

DeepMind AlphaGo零:从头学习没有任何人工输入

DeepMind AlphaGo零:从头开始学习,没有任何人工输入内容块的形象

希望这篇文章的一个免费的PDF版本吗?

完成下面的表格,我们将电子邮件您的PDF版本“DeepMind AlphaGo零:从头学习没有任何人类输入”

听与
喋喋不休地说
0:00
注册免费听这篇文章
谢谢你!听这篇文章使用上面的球员。
阅读时间:

黛米斯。”谷歌人工智能(AI)的公司DeepMind开发了一种自我训练人工智能程序AlphaGo零超过前面的“世界上最好的球员”,另一个DeepMind AI称为AlphaGo主人。

而之前的版本从大师预测比赛结果和改善他们的表现。AlphaGO零从头开始学会了玩游戏,没有人工交互。



在他们的发表在自然,研究人员把一个神经网络和开发算法,导致快速改善和稳定的学习。早期版本使用了两个神经网络,“政策网络”来选择下一个移动和“价值网”来预测比赛的赢家从每个位置。结合这些AlphaGo 0中极大地提高效率,需要40 x更少的能量的早期版本相比,克服了欧洲冠军粉丝2015年回族。

AI从头学习

首席执行官黛米斯DeepMind,大卫银,研究科学家和作者,解释他们的博客”,它能够做到这一点通过小说的形式强化学习,AlphaGo零成为自己的老师。“添加”,系统开始的神经网络围棋一无所知。然后做游戏本身,通过结合神经网络与一个强大的搜索算法。中,神经网络调整和更新预测走势,以及最终的赢家的游戏。”


每个迭代过程系统改善,这意味着游戏它本身变得更加困难,从而提高了神经网络的准确性,因此整个系统。


这样,AlphaGo零开始作为一个白纸和学习本身。学习白板,AlphaGo零能够超越之前的冠军,赢得了100年奥运会为零。

未来:自学成才的AI可以解决我们的难题

人工智能教育本身的能力可以促进目前的一些问题的答案超出了科学认识。作者强调,“类似的技术可以应用到其他结构化问题,如蛋白质折叠、降低能耗或寻找革命性的新材料,由此产生的突破有可能积极影响的社会。”


尽管处理速度增加的速度和计算能力的进步被依赖摩尔定律,不难想象一个人工智能的未来,使用系统,例如那些由DeepMind,将扮演一个角色在我们的日常生活。

参考:

银,D。Schrittwieser, J。Simonyan, K。Antonoglou,我。黄,。Guez,。,。哈萨比斯,d . (2017)。没有人类知识掌握围棋。自然,550 (7676),354 - 359。


满足作者
亚当·泽博士
亚当·泽博士
科学作家
广告
Baidu