人工智能指数2018 年度报告

来源 :中国计算机报 | 被引量 : 0次 | 上传用户:zhaotong125555
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  产业定义和范畴
  由斯坦福大学、麻省理工学院与 OpenAI联合发布的人工智能指数 2018 年度报告相比 2017 年报告有以下两方面的改进:一是基于对人工智能领域相关活动的持续跟踪,更新了最新指标;二是站在全球化视角进行了解析。2017 年的指数报告涉及较多北美区域的活动,主要是因为当时全球只有为数不多的几个经济体就人工智能项目建立了合作关系。
  然而,当前人工智能已经在全球多个国家快速发展,主要体现在:一是人工智能论文呈现多极化趋势。如 2017 年 Scopus 数据库中有 83%的人工智能论文来自美国以外的地区,其中,28%来自欧洲地区。二是人工智能教育呈现泛化趋势。如全球注册人工智能(AI)和机器学习(ML)课程的人数在不断增加,尤其是在中国清华大学,其相关注册人数比 2010 年注册人数增加了 16 倍之多。三是多个国家或地区的人工智能相关专利快速增长。除美国、中国和欧洲外,其他经济体也取得了进展。2014 年,韩国和日本分别是第二和第三大人工智能专利申报国,仅次于美国。
  指标说明
  核心指标。2018 年人工智能指数有两个核心指标:活动量指标和技术性能指标。活动量指标主要用于衡量学者、企业、企业家以及公众在人工智能领域的参与度,具体数据包括学习人工智能的本科生人数、申请人工智能工作的女性人数占比以及创办人工智能企业所需风投资金的增长率等。技术性能指标主要用于衡量人工智能细分领域的技术性能变化情况。新版的人工智能指数新增了国家或地区型指标,如国家层面的机器人研发管理机构、人工智能会议参会者等指标。总体而言,上期报告所体现的主要趋势仍在延续,即人工智能活动正在向世界各地普及,且技术性能正在全面提升。
  其他指标。本期报告在“衍生指标”章节重点分析了发展趋势之间的关系,探索出一项新的指标即人工智能活力指数。该指数通过综合学术界和行业界的趋势,从而量化人工智能领域的活力情况。本期报告还引入一个新的定性指标,即政府近期计划。该指标可用于体现政府近期对人工智能的投资计划。本期报告重点对美国、中国和欧洲的近期计划进行了研究,未来将通过与其他机构合作,对更多的国家和地区人工智能政府计划进行分析。
  核心指标
  发表论文。从论文发表数量看,以斯高帕斯数据库中论文为例,人工智能论文数比 1996 年增加了 8 倍,计算机科学论文数比 1996 年增加了 6 倍。从发表区域看,2017 年,斯高帕斯数据库中有 28%的人工智能论文来自欧洲地区,其次是中国(25%)和美国(17%)。
  从发表主题看,2017 年,机器学习与概率推理类的论文数占比为56%,而2010年仅为28%。2014—2017 年间,大多数类别论文的发表速度高于 2010—2014 年。尤其值得注意的是,2010—2014 年,神经网络论文的年复合增长率(CAGR)仅为 3%,而2014—2017 年的年复合增长率为 37%。从各地区相对活动指数(RAI)看,中国的人工智能论文主要集中在工程技术和农业科学领域,而美国和欧洲的人工智能论文则主要集中在人文以及医疗与卫生科学领域。2017 年数据显示,与 2000 年相比,上述三个地区对人工智能研究的重视程度均有所提高,且中国正转向农业领域的人工智能研究。
  从论文发表主体看,2017 年中国政府机构人工智能论文发表量是企业发表量的 4 倍。自 2007 年以来,中国政府机构发表的人工智能论文的数量增加了 400%,而企业论文发表量仅增加了73%。在美国,企业发表的人工智能论文占比相对较大。2017 年,美国企业人工智能论文发表量占本国所有人工智能论文发表量的比例比中国高出 6.6 倍,比欧洲高出 4.1 倍。此外,美国企业人工智能论文发表量增幅最大,其 2017 年企业人工智能论文发 表量是 2009 年的 1.7 倍。从论文引用影响力看,虽然欧洲每年发布的人工智能论文数量最多,但其重新设定的领域加权引用影响力仍保持相对平稳,与世界平均水平相当。相比之下,中国重新设定的领域加权引用影响力大幅提升。2016 年,中国人工智能作者的被引用次数比 2000 年高出 44%。然而,在总引用次数方面,美国仍优于其他地区。美国作者的被引用次数比全球平均水平高出 83%。
  课程注册。以美国人工智能课程为例,美国几所领先的计算机科学大学的人工智能和机器学习课程的注册人数正在不断增长。2017 年,入门级人工智能课程的注册人数比 2012 年增加了 3.4 倍,而入门级机器学习课程的注册人数则比 2012 年增加了 5 倍。
  参与度。参与度指标主要包括参加人工智能会议和注册各种人工智能相关的机构。数据显示,2017 年参与大型(人数超过 2000 人)人工智能会议的人数增长迅速,其中,神经信息处理系统会议和国际机器学习会议的与会人数增长速度最快,分别是 2012 年与会人数的 4.8 倍和 6.8 倍。参与小型(人数不足 2000 人)人工智能会议的人数也有显著增长,特别是国际学习表征会议(ICLR),2018 年的与会人数比 2012 年增加了 20 倍。注册女性机器学习研 讨会和 AI4ALL等机构的人数均有所增加,女性机器学习研讨会的与會人数比 2014 年增加了 6 倍,AI4ALL 的毕业人数比 2015年增加了 9 倍。这些增长表明,当今社会一直在为提高女性和非代表性群体在人工智能领域的参与度而努力。
  机器人软件下载。机器人操作系统是一种广泛使用的机器人开源软件栈,许多商业制造商和学术研究人员都使用机器人操作系统。自 2014 年以来,总下载量和唯一 IP 地址下载量分别增长了 352%和 567%。这就表明,当今社会对机器人技术以及机器人系统的应用越来越感兴趣。目前,唯一 IP 地址下载量的增长速度高于总下载量,由此可以推断,机器人操作系统用户也有所增加,而不仅仅是使用频率的增加。从地区上来看,美国和欧洲的 ROS.org 页面浏览量最多,中国紧随其后,且中国是增长率最高的地区。   创业/投资。从人工智能初创企业来看,到2018年1月,美国由风险资本支持且正常经营的私营初创企业超过了10000家,比 2015 年 1月增加了2.1 倍,呈现指数级增长态势。从风险投资资金来看,2017 年,美国风投资金总额比2013年增加了2.08倍,其中人工智能领域的风投资金比 2013年增加了4.5倍。
  就业。就业方面则呈现两大突出问题,一是技能岗位空缺,二是申请人性别差异较大。从岗位来看,机器学习技能的需求量最大,深度学习技能需求量的增长速度最快。2017 年,需要深度学习技能的岗位空缺数量比 2015 年增加了 35 倍。从申请人性别差异来看,平均而言,美国人工智能岗位申请人中男性占比 71%。由于机器学习岗位的申请人数最多,因此,该类岗位申请人中的性别差异是导致这一平均水平的主要原因。此外,相对于其他类别的人工智能技术,深度学习和机器人技术岗位的申请人也存在较大的性别差异。
  专利。从各发明地区人工智能专利的数量和增长情况来看,2014 年,大约 30%的人工智能专利集中在美国,其次是韩国和日本,占比均为 16%。在发明量最多的地区中,韩国和中国台湾增长最快,其 2014 年人工智能专利数量几乎是2004年的5倍。
  人工智能采用。根据麦肯锡咨询公司对 2135 名不同机构受访对象展开的调查,至少已在其一个功能或业务部门引入人工智能能力的受访对象占比情况。分地区来看,虽然有些地区某种能力的采用程度远高于其他地区,但在人工智能能力方面,各地区的采用程度大致相等。分领域来看,各行业纷纷引入人工智能能力以获得最大行业价值。例如,金融服务业在风险功能中大量引入人工智能,汽车行业在制造功能中大量引入人工智能,而零售业则在营销/销售功能中大量引入人工智能。这就意味着,特定应用(如制造)的人工智能的发展速度可能与特别强调专业化的行业有关。
  财报电话会议中的提及次数。各行业的企业财报电话会议中人工智能和机器学习的提及次数整体呈现增长态势,其中,IT 企业提及的次数最多。2015 年,IT 行业提及人工智能和机器学习的次数开始大幅增加,而对其他大多数行业而言,2016 年才开始出现此类增长。IT、非必需消费品、金融和医疗行业在财报电话会议中提及人工智能的次数最多。
  机器人机构 。从各地区工业机器人机构的年度数量来看,自 2012 年以来,中国机器人机构年度数量已增加了 500%,其他地区也有显著增长,如韩国和欧洲,分别增加了 105%和 122%。目前,在数量较少的地区中,中国台湾的年度机构数量最大,且在 2012—2017年间增长最快,机器人机构总数已超 10000 家。
  开源软件。开源软件有两个最新趋势,一是大型企业支持的框架,如谷歌的 Tensorflow、脸书的 Pytorch、亚马逊的 mxnet 等,正在日益普及;二是相对于其他编程语言,TensorFlow 最为普及。
  媒体态度。从媒体对人工智能的评判态度来看,中性评判人工智能类文章越来越少,正面评判人工智能类文章越来越多。自 2016 年初期以来,2016 年 1 月至 7 月,正面文章占比从 12%增至 30%,此后,正面文章占比一直在 30%左右。
  政府提及率。自 2016 年以来,美国、加拿大和英国三国政府对人工智能和机器学习相关词汇的提及率不断攀升。在此之前,这三个国家鲜少提及机器学习。以美国为例,美国国会对人工智能和机器学习的提及率在 2018 年有了显著增长,美国数据中的每项计数代表至少提及过一次机器学习或人工智能的特定事件或对话。
  技术性能
  对象检测。ImageNet 挑战赛是全球计算机对象检测领域的重要竞赛,能够反映该领域的进展。从准确度方面看,根据 2012—2018 年ImageNet2012 数据集的测试和验证结果,对象检测领域的性能不断提升,测试集和验证集准确度都已达到 95%以上。从训练时间看,2017 年 6 月至 2018 年 11 月间,训练对象检测人工神经网络所需的时间已从 1 小时缩短至 4 分钟左右,训练速度提高了约 16 倍。其中,算法创新、基础设施投资是训练时间缩短的主要原因。
  实例对象分割。由于对象检测与图像分类领域已经实现了较高性能,ImageNet 挑战赛已宣告结束。自 2017 年来,研究者开始将研究重点转向需要更复杂推理的视觉任务,如定位像素级精度的对象(实例对象分割)、将场景划分为具有像素级精度的区域(语义分割)等。COCO 挑战赛是全球实例对象分割的重要竞赛,其宗旨是构建一种可精确定位各对象并描绘其边界的算法。自2015 年以来,COCO 挑战赛中达到的最高平均精度提高了0.2 个百分点。
  句法分析。句法分析往往是进行某些自然语言处理任务的第一个步骤。目前几乎普遍使用深度学习技术进行句法分析。2003 至 2018年 间,句法分析的性能提高了约 10%。
  机器翻译。目前,机器翻译的性能有大幅提升。2018 年,BLEU 模型在英语译德语方面的得分比 2008 年提高 3.5 倍,而在德语译英语方面的得分比 2008 年提高 2.5 倍。
  AI2 推理挑战(ARC)。AI2 推理挑战数据集包含 7787 个小学水平(美国 3—9 年级)的多项选择题,这些问题可分为挑战题集(2590 个问题)和简易题集(5197 个问题)。2018 年 4 月至11 月期间,AI2 推理挑战赛中的简易题集性能得分由63%提升至69%,挑战题集得分由 27%提升至 42%。
  通用语言理解评估(GLUE)。通用语言理解评估基准是一项新基准,旨在通过一系列任务测试自然语言理解(NLU)系统,并促进非特定任务系统的开发。该基准由九项子任务组成:两项单句任务(衡量语言可接受性和情绪),三项相似性与释义任务,以及四项自然语言推理任务。语料库大小从 1000 到 40万 不等。 评估标准主要有準确度/F1和 Matthews 相关性系数。尽管评估基准于2018年5月发布,但到 2018 年 10 月,性能已经由最初公布基线(约 70%)提高至约 80%。
  衍生指标。第一项衍生指标是学术界-行业界动态,该指标可体现所选学术指标以及行业界动态的增长情况。第二项衍生指标是人工智能活力指数,该指标是学术指标和行业指标的综合体现。
  学术界-行业界动态。为探索学术界与行业界人工智能相关活动之间的关系,本报告首先从上述章节中选取了一些有代表性的衡量指标,其中包括斯高帕斯数据库中人工智能论文的发表量、美国几所大学入门级人工智能和机器学习课程的综合注册人数以及对人工智能初创企业的风险投资。这些指标体现的表征量无法直接进行对比。为分析各趋势之间的关系,本报告规范了从 2010年开始使用的衡 量指标,并显示了各指标的增长情况,而非绝对数量。
其他文献
本报讯 HR SaaS 服务商易路软件宣布已于近日完成2亿元C1轮融资,由SIG(海纳亚洲创投基金)领投,前轮投资方高瓴资本等追加投资。  易路軟件CEO王天扬表示,本轮融资将主要用于研发及市场营销,为客户提供更好的薪社税福一体化解决方案。
近日,小米发布了一款全新的大家电产品——米家互联网直驱洗烘一体机。新洗烘一体机主打最低50dB安静洗涤、银离子抗菌、微蒸空气洗、深度除螨洗等功能。  另外,米家互联网直驱洗烘一体机能够实现小于90度轻柔洗,让用户放心洗涤衣物。  作为小米生态链的一环,米家互联网直驱洗烘一体机支持米家App操控和小爱同学语音遥控,也可以进行OTA在线升级,持续更新。新款洗烘一体机将所有功能都集成在操作面板上,不需要
本报讯 COMPUTEX 2017将于今年5月30日至6月3日在台北市盛大召开,今年的COMPUTEX延续去年“建构全球科技生态系”的会展整体定位。此外,随着国内外创新创业浪潮的不断高涨,“大众创业、万众创新”政策的推出更引领了国内的创新风潮。顺着这股初创趋势,该会展为全球初创企业打造InnoVEX創新展区,为创新和初创企业提供国际化平台。
作为新一代信息技术创新发展的突出代表,区块链技术在比特币等各类数字货币的快速发展中逐渐被各方认识和应用。虽然区块链技术在数字货币领域取得了极大的成功,相关区块链企业和科技巨头亦高度重视区块链核心技术和爆款产品的研发,但从整体上来看,区块链技术应用仍重在探索和尝试,成熟的解决方案和行业应用案例仍然较少。  中国区块链生态联盟 、青岛市崂山区人民政府 、赛迪(青岛)区块链研究院  我国区块链行业应用现
本报讯 9月12日,合肥本源量子计算科技有限责任公司自主研发的超导量子计算云平台正式上线,本源量子公司董事长孔伟成表示,基于本源量子自主研发的超导量子计算机——悟源将面向全球用户提供真实的量子计算服务。  据介绍,悟源是一台能够脱离实验室环境稳定运行的超导量子计算系统,也是国内率先实现工程化的量子计算机。本源量子此次发布的超导量子计算云平台搭载6比特超导量子处理器夸父KF C6-130,保真度、相
本报讯 近日,工业和信息化部发布《关于开展2019年IPv6网络就绪专项行动的通知》,2019年末主要目标:获得IPv6地址的LTE终端比例达到90%,获得IPv6地址的固定宽带终端比例达到40%。LTE网络IPv6活跃连接数达到8亿。其中,中国电信集团有限公司达到1.6亿,中国移动通信集团有限公司达到4.8亿,中国联合网络通信集团有限公司达到1.6亿。完成全部13个互联网骨干直聯点IPv6改造。
本报讯 近日,在中国道路交通安全论坛上,公安部交管局、公安部交通管理科学研究所相关负责人介绍,全国正推进集成指挥平台建设,现已联网交通技术设备80万套,今年年底将实现交通监控视频“全国联网”。据介绍,通过车辆行驶轨迹、人员信息、车辆信息等数据,平台可以对“人脸”“车脸”进行确认,筛选出套牌嫌疑车。2018年,平台通过车辆轨迹信息,筛选出12.6万辆套牌嫌疑车,其中11.02万辆出现频次较高。在將数
本报讯 近日,京东物流上線了全球首套机器视觉批量入库系统——秒收。  据悉,秒收系统由京东物流自主研发,应用于物流作业中的进货环节。据称,该系统解决了大批量条码扫描、信息采集、自主纠错等问题,相比传统的人工操作方式,秒收系统的作业效率提升了10倍以上。
据报道,仅今年2月,广西南宁交管部门就利用无人机查处了438起违停,引起不少当地车主的注意。而检索公开资料发现,包括济南、宝鸡在内的全国多地,已陆续将无人机应用到了城市交通管理当中,对开车玩手机、违停等行为进行抓拍执法。  有人担心,无人机拍摄会不会不够清晰造成误判?其实大可不必担心。不夸张地说,现在的摄像清晰度,早已超越人类的肉眼辨识力。举个例子,肉眼只能看见车身,手机拍摄的照片经放大后就可以清
本报讯 5月12日,在西安市投资环境推介暨重点项目签约仪式上,百度公司与西安市人民政府签署数据中心落地协议,百度云计算(西安)中心项目将落户西安航天基地。这将是百度在西部布局的首个单体规模超过10万台的超大规模自建数据中心。百度方面介绍,百度云计算(西安)中心项目将建成中国西部核心集群,作为百度全国傳输骨干网中的重要节点,辐射整个西部地区。