“AlphaGo之父”获最新一届ACM计算奖

来源 :海外星云 | 被引量 : 0次 | 上传用户:sunfeaml
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  近日,2019年ACM(国际计算机学会)计算奖颁出,由于在计算机游戏领域取得突破性进展,“AlphaGo之父”、DeepMind首席科学家、伦敦大学学院教授大卫·席尔瓦获得最新一届的ACM计算奖。
大衛.席尔瓦

  大卫,席尔瓦是深度学习领域的先驱人物,他在人工智能领域的一系列成绩中,又以他带领打造的AlphaGo最为人所知。大卫‘席尔瓦通过巧妙地结合深度学习、强化学习、蒙特卡洛搜索树和大规模计算的思想,开发了AlphaGo算法,AlphaGo由此战胜了顶尖的人类棋手,更是被公认为人工智能(AI)研究的一个里程碑。
  根据ACM官方报道,最初,AlphaGo会经过来自人类专业棋手经验的小范围训练,然后,它会通过强化学习来不断改善性能。AlphaGo之后,大卫·席尔瓦和他的团队创造了更新颖的方法,来实现更高的性能和通用性,AlphaZero就此诞生。与AlphaGo不同,AlphaZero完全通过与自己玩游戏来进行学习,不需要任何人类数据或先验知识(游戏规则除外)。而且,AlphaZero同时在国际象棋、将棋和围棋游戏中有超过人类的表现,证明了其AI算法的通用性。
  早在大卫·席尔瓦于艾伯塔大学(Universitvof Alberta)攻读博士学位时,他就开始探索开发一种可以掌握围棋智慧的计算机程序,这也成为了他后续一直在专注的研究兴趣。在2013年的NemIPS会议上,席尔瓦展示了一种算法,它可以在雅达利游戏中展现达到人类水平的技巧。这个程序学会了在游戏过程中仅仅通过观察像素和分数来玩游戏。
  2015年,大卫,席尔瓦和他的同事发布开创性论文
  “Human Level C.ontrol Through DeepReinforcement Learn/ng”,在这个研究中,他们将强化学习与人工神经网络相结合,论文发表在《自然》杂志上,且至今被引用近1万次,对该领域产生了巨大影响。随后,席尔瓦和他的同事继续用新技术改进这些深度强化学习算法,这些算法仍然是机器学习中应用最广泛的工具之一。
  2016年3月,团队开发的AlphaGo击败世界围棋冠军李世石,这被誉为AI里程碑式的时刻。同年,解析AlphaGo背后技术的论文“Mastering the Game of Go with Deep NeuralNetworks and Tree Search”公开发布在《自然》杂志上。
  AlphaGo和AlphaZero之后,DeepMind的游戒AI探索的另一个重点是征服《星际争霸Ⅱ》。就在去年,由席尔瓦领导的DeepMind团队开发了AlphaStar,它掌握了多人即时战略游戏《星际争霸ID,这类游戏被认为是游戏AI需要攀登的高峰。
  现在,在DeepMind-这家谷歌旗下最星光熠熠的AI公司,大卫,席尔瓦和他的同事仍在寻求将机器学习和神经科学方面的进展进行技术融合,以构建功能强大的通用学习算法。大卫,席尔瓦在深度强化学习上的诸多工作也已被应用于提高英国电网效率、帮助谷歌数据中心降低功耗、为欧洲航天局策划太空探测器轨迹等领域。DeepMind团队还将继续推进这些技术,并为其找到更多的应用场景。口(摘自美《深科技》)(编辑/莱西)
其他文献
非法移民和难民是现在美国和德国都面临的一大难题。美国总统特朗普严厉驱逐、拦截偷渡客的政策引发激烈争议,但他坚定不移,还用德国为例自我辩护。  他说:“我们不希望欧洲发生的移民问题也出现在这里!”  三年前爆发的欧洲难民危机余波不息,处于危机核心的德国,因总理默克尔在难民问题上的立场导致执政联盟内部分歧凸显,政坛地震正在酝酿中。  那么,美国和德国的非法移民、难民问题有什么异同?非法难民是什么人?为
对于女人来说,有两件事是真理:第一,我们善变,喜新厌旧,会变来变去的小玩意儿最讨人喜欢。第二,我们永远缺一件衣服,不管衣橱是不是已经堆到扑出来,你还是会觉得自己没有衣服穿(和第一条好像是一样的)。  该道理同样适用于鞋子、包包、首饰、口红......于是今天要给你们安利的,是可以变来变去的手镯!  一直都很喜歡宽手环,懒的时候,觉得这是最简单的一件statement accessory。心情好,想
第一次世界大战期间,英国“战争部”的女职员每 天早晚散步15分钟呼吸新鲜空气  1918年“西班牙流感”大流行,至今仍有人称之为“史上最惨烈的病毒大屠杀”,全球死亡人数5000万。  拿那场瘟疫和眼下的新冠疫情对比,非要找出太多共性,或许并不明智。新冠病毒(Covid-19)和“西班牙流感”是完全不同的两种疾病。新冠受害者主要是老年人,“西班牙流感”的受害者主要是20岁~30岁、免疫力很强的青壮年
夏威夷果  夏威夷果  富含单元不饱和脂肪酸  夏威夷果含有大量不饱和脂肪酸、丰富维生素B群、维生素E,可预防动脉硬化及保护血管。  热量:720卡/百克  粗蛋白:9.4克  粗脂肪:76.3克  总碳水化合物:12.0克  膳食纤维:5.4克南瓜子  南瓜子  富含镁、锌  南瓜子具有高浓度的锌及木酚素,有助于摄护腺组织的保护作用。  热量:564卡/百克  粗蛋白:25.9克  粗脂肪:47
你会和你的狗聊天,和你养的仓鼠表示埋怨,也会向你的长尾小鹦鹉讲述你绝不会告诉他人的秘密。而且,虽然你一方面怀疑这些行为可能毫无意义,但你内心却暗怀希望你心爱的宠物或许真能理解你的倾述。  但是,对于人类的交流,动物到底能否理解或能理解多少?  例如,你知道动物能够感受快乐,但它们是否也有幽默感?你毛茸茸的宠物是否能够懂得开玩笑?比如你把一件很重的东西砸到你的脚趾头时,它是否会拼命忍住不要大笑?狗、
备受关注的朝鲜与美国领导人峰会2月底在越南河内拉开序幕,然而,与2018年6月在新加坡的见面达成了若干共识所不同的是,这一次金正恩与特朗普的会面却未能达成任何共识,出乎媒体意料地仓促收场。朝美峰会之后,两国关系的走向也引发了各方关注。因为此次会面的不甚成功,朝鲜半岛的无核化进程将会如何演变,也是未来焦点所在。“金特”在越南河内二会  2018年6月,备受瞩目的朝美两国领导人峰会在新加坡上演,朝鲜最
如何让青少年放下手中的手机和你谈心?杰米·克拉克到蒙古寻找答案。  探险家克拉克骑着摩托车穿梭在蒙古的一个偏僻山谷,发动机的嗡嗡声和他的思绪在脑海回荡。  几个小时后他停下来,脱下头盔看看地图。  这就是他喜欢冒险的原因:独处、亮丽的风景和掌控自己命运的感觉。  但当他18岁的儿子骑着摩托车在他身后停下时,他对刚刚结束的长途旅行有了不同的看法。  对他来说,一个人待着虽然新颖但令人不安。“我的天,
2007年纺织交易行会为女王举办午宴。女王是该行会无需上班的领导伦敦金融城市长通常是一位行会成员  伦敦贸易行会可以追溯到1000年前,它们拥有数十亿英镑的资产。但它们是否忘记了初衷之一:把钱花在公益事业上?  伦敦的金融城也是个古老的中心。在玻璃摩天大楼之间,有一些看上去非常宏伟的低层建筑大厅,它为找到这座城市的一部分不为人知的财富宝藏提供了一个线索。  伦敦金融城的同业公会曾经一度是个大杂烩,
2020年3月,面对新冠肺炎疫情下美国医院呼吸机紧缺的形势,特斯拉首席执行官埃隆,马斯克表示,特斯拉有能力快速制造呼吸机。这一次,埃隆.马斯克依然没有让我们失望。特斯拉工程师团队通过YouTube对外展示了呼吸机的原型机设计。  值得注意的是,该原型机设计使用了特斯拉汽车的多个零部件,其中就包括Model 3的娱乐信息系统以及Model s汽车悬挂系统的零部件等。“我们希望使用我们认为真正优秀、真
桑德·范·圖尔根博士  许多节食人士都知道要想保持身材苗条,要少吃富含碳水化合物的食品。因此各种低碳食谱应运而生,而且已经有一段时间了。  其实,很多人并不清楚碳水化合物其实也分不同颜色和种类,它们的作用和功能可大不相同。有些是“好碳水”, 有些则是“坏碳水”。图尔根博士说,关键在于你所吃进去的碳水化合物的颜色,你要尤其注意那些米色的碳水化合物,因为它是人们平时消费最多的一种碳水化合物。面包、米饭