培养合格人工智能编辑分几步

来源 :发明与创新·大科技 | 被引量 : 0次 | 上传用户:xiaopirate
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  前段时间,微软宣布拟裁撤近80名外包编辑,由人工智能编辑负责接下来的MSN网站的新闻抓取、排版和配图等工作。但没想到,刚到岗没多久,人工智能编辑就“翻车”了。人工智能编辑在寻找配图时,把非裔歌手Leigh与阿拉伯裔歌手Jade弄混了。为何一向以高识别率著称的人工智能,这次却“翻车”了?
  解决脸盲问题需不断扩大学习范围
  人脸识别技术是目前人工智能领域公认的比较成熟的技术,圈内人士也熱衷像刷分一样把人脸识别准确率屡屡刷出新高,最高的号称准确率可达99.9%。人脸识别技术有如此辉煌的战绩,为何此次人工智能编辑还会脸盲?
  “人脸识别技术的工作原理,主要是比对五官比例以及面部特征。”天津大学智能与计算学部教授韩亚洪解释,简单说,就是基于人脸图像的大数据,先对看到的人脸图像进行预处理,提取面部各个方面的特征,并通过分层多次提取,寻找对于识别个体人脸最有效的特征表达。
  人脸识别技术这些年已经发生了重大变化,传统的人脸识别方法已被基于卷积神经网络的深度学习方法替代。深度学习方法的主要优势是它们可通过大规模数据集进行训练,从而学习到这些数据的最佳特征。
  “虽然可以使用大规模数据集进行训练,但是目前99.9%的准确率基本上是在一些基准的数据集上测试的结果。这个数据集肯定是有范围的,如果收集的数据是在数据集分布的范围内,便可获得比较高的准确率。”韩亚洪说。
  据了解,目前号称人脸识别准确率达99%以上的,很多指的都是和全世界最权威的人脸数据库LFW(Labeled Faces in the Wild)进行比对测试的成绩。LFW可以被认作一个考查深度学习系统人脸识别能力的题库,它从互联网上提取6000张不同朝向、表情和光照环境的人脸照片作为考题,可以让任何系统在里面“跑分”。“跑分”过程是LFW给出一对照片,询问测试系统两张照片是不是同一个人,系统给出Yes或No的答案。
  “解决特定的脸盲问题并不难,其实就是重新针对任务,收集这项任务领域内的人脸图像,在原有算法模型上训练,或重新设计新的算法模型进行训练,都会提高人脸识别率,以满足实际应用的需求。”韩亚洪说,但是超出了特定任务,人工智能的“脸盲症”就会复发。目前并没有哪个通用的模型算法可以解决所有的任务,但是人工智能可以通过不断地调整及大量的学习,从而提高人脸识别的准确性。
  “目前针对新闻文档的分析和处理任务,人工智能编辑做起来相对得心应手。”韩亚洪介绍,具体地说,比如在一篇很长的报道中,让人工智能编辑把重点摘出来,这是没有问题的。当下,大量的新闻报道会涉及图片和视频,人工智能编辑可以将图片或者视频自动提取出来,再从大篇幅的文字报道中,选取与之相匹配的文字说明,这个工作人工智能是可以比较准确地做到的。
  “解决特定领域的问题,人工智能大多时候还是没问题的,但是要实现通用,就比较难了。”韩亚洪强调,实现这些功能需要用到自然语言处理、模式识别、图像视频理解等领域的技术。
  要培养一名人工智能编辑,首先需要收集大量的新闻报道和图片视频,再根据收集到的数据设计一个针对这个任务的深度神经网络模型,网络模型里会有很多参数,然后通过数据把参数训练出来,它就具备了最初设定的各种编辑能力。在使用过程中,人工智能编辑会学习更多的新闻,它的业务能力和性能也将不断提升。
  “不过目前的新闻生产对于人工智能编辑来说还很困难。”韩亚洪说,要让人工智能学会写新闻,必须要针对某个特定新闻主题,进行大量资料搜集和模型训练。目前人工智能技术只能在风格相对固定、词汇量使用范围较小的领域完成文本生成,比如天气预报等内容,人工智能编辑可以很好地输出相关报道和消息。但要生成有创新要求、情感描述丰富的文章,人工智能编辑的能力仍有待提升。
  “有趣的是,人工智能犯的错误大多是我们意想不到的低级错误,但在某些方面又强悍到让人类望尘莫及。”韩亚洪举例说,像给文章分类这种工作,人类编辑要进行大量阅读,重复性劳动耗时耗力,速度非常慢。但这项工作人工智能编辑做起来就非常简单。另外,对于可以使用模板的短新闻,比如天气预报、证券信息等,人工智能编辑可以准确迅速地将各种数字或者专有名词嵌套到模板中,从而完成一定的文档生成任务。
  美联社曾使用人工智能系统自动编发企业财报。人工智能系统对数据进行自动抓取,将其嵌套在美联社预先设定的新闻模板中,几秒钟就能完成一篇150字至300字的短消息,该系统每季度能产出约4000篇新闻,与之相比,美联社的人工编辑们每季度只能完成400篇。
  做这些特定的工作,人工智能编辑比人类厉害的地方不仅在于速度,准确率也可圈可点。“像分类或者是嵌套模板写短消息这类的工作,因为任务明确,人工智能的准确率还是非常高的,很少出现错别字或者数据错误。”韩亚洪介绍。
  在运用大数据分析预测爆款方面,人工智能编辑可能比人类单纯从经验出发显得更“科学”。2015年,《纽约时报》使用人工智能机器人对社交平台中的文章进行筛选和分析,预测哪部分内容适合推广。凡是由它自动推荐的文章的点击量都大大增加,甚至达到了普通文章的38倍。
  “但在人工智能编辑的世界中,只有知道和不知道两种状态,因此处理的内容一旦超纲,它们就会犯很多低级到可笑的错误。”韩亚洪说,像这次人工智能编辑就把非裔歌手Leigh与阿拉伯裔歌手Jade弄混了。
  “目前阶段的编辑工作完全依赖人工智能是不现实的,让人工智能成为人类编辑的帮手似乎更切实可行。”韩亚洪说。美联社预测,人工智能介入媒体行业能帮助新闻工作者释放20%左右的时间,让后者可以将这部分时间更多地投入到内容创作方面,简单的事实核查与调研方面的工作交给人工智能,有利于提高新闻质量。
  “未来,人类应该把人工智能编辑当作合作伙伴,双方协同起来,使工作更加高效高质。”韩亚洪说,人类不应该觉得人工智能是来“抢饭碗”的,而应该为有人工智能这样的合作伙伴而感到幸运。(据《科技日报》)
其他文献
“科学辟谣平台”是由中国科协、国家卫生健康委、应急管理部和国家市场监管总局等单位主办,中央网信办指导,全国学会、权威媒体、社会机构和科技工作者共同打造的面向大众进
“绿色奥运之核心是为奥运会提供一个优美清洁的环境,2008年北京奥运会、奥运村和比赛场地将最大限度使用太阳能等清洁能源,奥运场馆周围80%~90%的路灯将利用太阳能光伏发电技
为抑制青光眼术后滤过泡的瘀痕化倾向,提高手术成功率,获得较好的远期效果,我们采用小梁切除联合术后应用a-IF知一干扰素),对20例(对眼)闭角型青光眼患者进行了临床观察,结果报告如下
新闻事件:最近,北京地坛医院采取中西医结合治疗的方式,建立了中医药第一时间介入新冠肺炎治疗的工作机制,中医医生直接到一线参与临床救治工作。对于重症、危重症患者,实行
新闻事件:在电信行业,骚扰电话一直不能得到根治。而近年来随着新兴技术的不断涌现与迭代,推销公司的骚扰电话也一同升级,已经演变为今天的AI机器人骚扰电话,使用户不堪其扰。  智能电话客服具有高效率、费用低、全天候等优势,受到众多企业的欢迎,也正在快速替代传统人工电话客服,成为时下流行的客服模式。与此同时,AI骚扰电话也随之兴起,不知疲倦、没有情绪波动的机器人每天拨打数千通电话,涉及装修、买房、培训、
目的:探讨肺门肿块的X线特征,并鉴别其良性与恶性。材料与方法:100例肺门肿块患者,男性68例,女性32例,年龄2~81岁,均经X线胸部平片分析,并结合临床资料诸如发病年龄、肿块的病
(1)智能建筑建设应更趋于技术性
康宁光缆系统大中华区商务部2005年度销售会议于12月10-11日在庐山天沐温泉渡假村顺利举行。来自康宁光缆系统公共网络和用户网络的分销商、物流中心、重要集成商,以及康宁光
国家火炬特色产业基地是指在一定地域范围内,针对国家鼓励发展的细分产业领域,通过政府组织引导、各方优势资源汇聚、营造良好创新创业环境,形成的具有区域特色和产业特色、
1病例介绍例1,女性,41岁.左侧面部萎缩8年,头痛2个月来诊.8年前左侧下唇开始萎缩,然后逐渐发展到面颊部、头顶皮肤.左侧下唇面颊部皮肤色深,头顶部呈沟状、簇状秃发,顶部有白