浅谈AI何时拥有智能

来源 :科学导报·学术 | 被引量 : 0次 | 上传用户:ysksy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘  要:本文论述AI目前的智能水平,及AI智能的正确研究思路和方向。
  关键词:AI智能;智能感知;智能认知;智能决策
  近几年AI圈热闹非凡,各种新闻令人眼花缭乱。但冷静下来想想,图像识别是个黑盒子,自动驾驶常出事故,重大灾难发生时机器人救援效果不佳,万众期待的AI智能迟迟不撩开面纱。那么AI什么时候能拥有智能,并且这种智能是我们人类可以理解,可以相信的呢?
  在此描述一下AI智能的正确打开方式,首先从计算机视觉开始讨论。实验心理学家赤瑞特拉做过心理实验证实:人类获取的信息83%来自视觉,11%来自听觉,这两个加起来就有94%。其它途径是嗅觉、触觉和味觉。在人工智能领域,计算机视觉的重要性不言而喻。
  现在主流的卷积神经网络,从AlexNet,GoogLeNet,ResNet,到DenseNet,不停变化的神经网络结构,不管有多复杂,整体来看其实只有两层:各个神经元之间的回归函数层,及最后的分类层。回归函数层起到的作用是提取不同层次的特征,最后由分类函数进行相似度计算,得出分类结果。由于提取特征的过程不透明,不可解释,与人类的思考方式不一致,自然就不容易相信。
  我们人类观察一个物体或一張图片,历史的经验会起到很重要的参考作用,而对于没有见过的物体通过想象来推理其用处。这是一种学习和推理能力,是智能的一部分,而神经网络显然不是这样的工作方式。
  例如看到一张从未见过的猫的图片,我们是从有皮毛的动物,有四肢,有尾巴,脸部形状等来推测。那么AI能不能用类似的方法呢?答案是可以的,已经有团队在尝试。具体请参考[1802.00121] Interpreting CNNs via Decision Trees。
  智能的整体架构
  对于AI智能,仅仅拥有可解释的观察能力是不够的。整体的AI智能架构包括七层,分别是初始任务、知识和常识、感知和认知、学习人类的价值函数、决策机制、头脑和语言。我们一层一层来解释。
  初始任务
  初始任务就是AI智能努力的目标。以自然界的一只小松鼠为例,首先要解决的是活下来,要有食物,不要被其它天敌吃掉,长大成熟后找到配偶,抚育下一代,这些就是小松鼠的初始任务。那么一个智能机器人的初始任务可以是家务机器人,可以是运动陪伴机器人,可以是溺水救援机器人等等。这是智能的起点。
  知识和常识
  常识就是我们在这个世界和社会生存的最基本的知识。它使用频率最高,并且它可以举一反三,推导出并且帮助获取其它知识。包括社会常识和物理常识/视觉常识,例如房间内的物体可以是被地板支撑,可以挂在墙上,可以吊在顶棚等。
  感知和认知
  在AI智能领域,研究最多的就是智能识别和感知。与当前CV领域三大基本能力不同,智能感知并不是从目标识别、目标定位和目标分割三方面去努力,而是选择了完全不同的道路。
  AI智能要做的第一步是二维图像的三维重建,而且是基于单张二维图像的三维重建。这在数学上很难做到,因为三维重建需要双视角的信息输入。但是我们人类有这种能力,看到一张照片就能在脑海里进行三维还原,基本原理就是我们知道每件物品在现实社会里的大小。例如门高80英寸,椅子和小腿高度一样,约16英寸等。
  3D重建完成后,对于每一个物品的识别,并不是依赖大量标注好的图片训练,而是从人类视角,推测这个物品我们如何使用。如果可以存放物品,并且高度是人眼的高度,形状是立方体,那就是壁橱。如果从力学角度人坐上去会感觉舒服,那就是椅子,以此类推,而不是简单贴上标签。
  识别物体之后,还要理解物体的摆放是否合理和安全。这会影响之后的动作决策。
  对于各种容器内的物体或液体,要根据人类的动作和容器的状态进行推理。如果在倒水,那壶里一定是有水的。这里渐渐能看到智能的影子。
  对于各种可见不可见的物体识别完之后,如果图像里有人或动物,就可以观察他/她/它在关注什么,知道什么,喜欢什么,猜测之后可能的动作是什么。
  上面是对单张图片的感知内容。如果是视频,可以了解更多的信息。
  学习人类的价值函数
  在一定时间的观察之后,可以得到被观察者做事方式的价值函数,例如喜欢喝啤酒还是饮料?喜欢多互动还是少打扰?喜欢每天扫地一次还是只要有脏东西就要清理?等等。
  决策机制
  了解了各种物体,了解了被观察者的喜好,为了达成初始任务,AI智能体就能决定自己的具体任务链,例如去开门,去拿啤酒,去打开电视等等。随着仿生机器人的快速发展,已经可以完美写成这些动作。
  头脑
  为了更好地完成任务,AI智能体需要理解被观察者知道什么,正在做什么,打算做什么等等。还要清楚对方知道什么,对方知道自己知道什么,双方共同知道什么,这是沟通和决定下一步行动的基础。在这个过程中,需要进行沟通,而语言是沟通的一种主要方式。
  语言
  人类用语言沟通的基础是要完成共同的任务,所以语言是任务驱动的。通过观察和认知,了解这个世界,并且知道自己能做什么,就可以对具体任务进行沟通。这是基于理解的语言,而不是为了说而说。现在自然语言处理领域基本上是从语言开始,到语言结束,与现实社会脱节,成为无源之水。
  总结
  上面说明的智能,并不是纸上谈兵,已经有很多国际团队在2010年之在致力于AI智能体的实现。电影中描绘的强人工智能离我们还很遥远,但是通用人工智能(Artificial General Intelligence,AGI)时代已经来临!
  在通用人工智能时代,计算机视觉、自然语言处理、机器学习都是融为一体的,这个融合剂就是感知(Recognition)和认知(Congnition),或者叫做理解和推理。
  让我们拥抱这个时代!
  参考文献
  [1]  M. S. Arulampalam,S. Maskell,N. Gordon,and T. Clapp. A tutorial on particle filters for online nonlinear/non-gaussian bayesian tracking. IEEE TSP,50(2):174–188,2002.
  [2]  A. Belardinelli,O. Herbort,and M. V. Butz. Goal-oriented gaze strategies afforded by object interaction. Vision Re-search,106:47–57,2015.
  [3]  A. Borji,D. N.Sihite,and L. Itti. Probabilistic learning of task-specific visual attention. In CVPR,pages 470–477,2012.
  [4]  A. Borji,D. N. Sihite,and L. Itti. What/where to look next? modeling top-down visual attention in complex interactive environments. IEEE TSMCS.,44(5):523–538,2014.
  作者简介:王悦林(1973.2—),男,汉族,黑龙江人,本科生,现任职于联想数据智能事务部,研究方向是人工智能。
其他文献
摘 要:在新时代背景下,我国经济水平逐步提高,教育工作得到了人们普遍的关注。班主任在进行班级管理的时候,理应注重思想政治方面的培养,促使其具备较强的知识基础之外,还能拥有较高的综合素质。本篇文章主要描述了班主任在进行班级管理中做好思想政治教育工作的具体方法,并對于其中的细节方面发表一些个人的观点和看法。  关键词:班级管理;思想政治教育;工作;学生;班主任  引言:  班级是学校管理的基础单位,同
期刊
慢性萎缩性胃炎(CAG)是一种常见的消化内科疾病,多由慢性非萎缩性胃炎发展而成,其病理表现为胃载膜萎缩、固有腺体减少,常伴有不同程度的幽门腺化生、肠腺化生或不典型增生。CAG作为难治性消化系统疾病,因与胃癌的发生关系密切,故被世界卫生组织列为胃癌的高危因素。  一、病因病机  CAG属于中医“胃肮痛”“痞满”“嘈杂”“纳呆”“暖气”等范畴,饮食不节、情志失调、感受外邪、劳倦过度、素体虚弱是其主要病
期刊
关键词:素质教育;生活语言;数学语言;书面语言;综合思维能力  在小学数学教学中,如何最大限度地开发学生的潜能,使学生尽快掌握学习方法,即学生具备学习能力是小学数学教师如今急需解决的迫切任务,而培养学生的数学语言表达能力是一个重要的方面,现代心理学、教育学认为,语言的准确性体现着思维的周密性,语言的层次连贯性体现着思维的逻辑性,语言的多样性体现着思维的丰富性。能力和思维相辅相成,而思维的发展同语言
期刊
摘 要:中国生物质资源丰富,但利用效果不好。本文主要论述了生物质耦合发电技术路线,希望通过实施生物质耦合发电技术,推动生物质资源的有效利用,为老百姓和企业带来一定的经济收入。  关键词:生物质;耦合发电  引言  中国是一个农业大国,生物质资源十分丰富,各种农作物每年产生秸秆6亿吨,其中可以作为能源使用的约4亿多吨。全国林木总生物量约190亿吨,可获得量为9亿吨,可作为能源利用的总量约为3亿吨。 
期刊
摘 要:随着时代的不断发展,我国经济呈现出高速发展的态势,各行各业面临着激烈的市场竞争,一个企业想要在激烈的市场竞争中得到快速的发展,首先要不断提高自身企业的综合实力,其次就是要重视企业内部员工的思想变化。对企业职工的思想进行正确的引导,不断激发员工的工作积极性,从而才能促进企业得到更好的发展。  关键词:以人为本;主人翁;思想政治;工作经验  企业的政治思想对于员工有着十分重要的影响,如果企业在
期刊
摘 要:越障机器人是机器人领域的一个重要分支,主要凭借传感器等设备在非结构化环境里进行自主决策及动作执行,多运用于地形检测,灾害搜救等方面。本文将对越障机器人背景进行简单介绍,并将对其组成原理和市场应用进行进行分析  關键词:巡游航行器:图像识别:组成原理和市场应用  1背景  随着智能控制和传感器的发展,水下机器人在完成水下作业方面扮演着越来越重要的角色。尤其是在未知的水下环境,机器人的承受能力
期刊
摘 要:近些年来快递业发展迅速。短短几年,快递服务已经实现了部分省市乡镇快递网点全覆盖。随着快递合同的大量缔结,快递纠纷也频繁发生,如快递延误、短少、丢失、损坏以及个人信息泄露等问题。法律虽然具有滞后性,但法律对已经出现的新兴行业应当及时作出回应。在民法典编撰的大背景下,考虑到快递合同的典型性,有必要在合同编对快递合同加以规定。  关键词:快递合同;民法典编撰;典型化  前言  随着电子商务的蓬勃
期刊
摘 要:通过研究平行等价引力理论(TEGR)的卡鲁扎-克莱恩(KK)降维方法,将引力和电磁场统一在五维空间中。我们重新定义了电磁场在余标架场上,那么我们就能得到与卡鲁扎-克莱恩(KK)理论一样的结论,电磁场和引力完美统一在五维空间中。和传统定义在标架场上的电磁场的不同,它将有一个电势和绕率的耦合项,我们观测到的电磁场将受绕率影响。  关键词:宇宙学;暗能量;卡鲁扎-克莱恩(KK)理论;平行等价引力
期刊
摘 要:进入21世纪,随着网络技术迅猛发展,网民人数不断增多,互联网的应用领域不断扩展,大学生创业迎来了更多的机会和挑战。本文阐述了“互联网+”时代背景下,大学生利用网络技术进行创业,开拓新的创业模式。  关键词:创业模式;互联网+;大学生  近年来,由于国内实体经济投资趋缓,经济下行压力增大,再加上今年高校毕业生人数将再创新高,以市场带动毕业生就业率的效果不明显,如何促进大学生的就业依然是我国政
期刊
摘 要:复杂的地质条件下矿区水文工作为矿石设计开采工作打下夯实基础,对资源方面的开发利用有着至关重要的作用,为了更好有效的进行矿区水文地质的开采工作,本文将从多角度进行探讨复杂地质条件下的矿区水文地质工作,分析复杂地质条件下的矿区水文地质的主要因素,结合各地实际情况,分析复杂地质矿区水文地质特性,只有针对性了解性质,才能更好地服务矿山事业的开发。  关键词:复杂地质条件;矿区水文地质;类型划分  
期刊