视觉问答技术研究

来源 :计算机研究与发展 | 被引量 : 1次 | 上传用户:biuesnow
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着深度学习在计算机视觉、自然语言处理领域取得的长足进展,现有方法已经能准确理解视觉对象和自然语言的语义,并在此基础上开展跨媒体数据表达与交互研究.近年来,视觉问答(visual question answering,VQA)是跨媒体表达与交互方向上的研究热点问题.视觉问答旨在让计算机理解图像内容后根据自然语言输入的查询进行自动回答.围绕视觉问答问题,从概念、模型、数据集等方面对近年来的研究进展进行综述,同时探讨现有工作存在的不足;最后从方法论、应用和平台等多方面对视觉问答未来的研究方向进行了展望.
其他文献
摘要:本文首先简要介绍了内部控制的基本内涵以及医院强化内部控制建设的巨大意义,然后重点论述了当前我国医院在内部控制建设方面存在的主要问题,最后就如何进一步提升医院内部
恶意域名在网络非法攻击活动中承担重要的角色.恶意域名检测能够有效地减少攻击活动所带来的经济损失.提出CoDetector恶意域名检测模型,通过挖掘域名请求之间潜在的时空伴随
歇后语是一种独具特色的语言形式,是汉语习语最重要的组成部分之一,其内涵意义总是隐晦的,具有隐喻性的本质。因此,歇后语的翻译一直以来都绝非易事。美国语言学家莱考夫(Geo
在基于模型诊断(model-based diagnosis,MBD)中,因为所有极小冲突集的极小碰集就是待诊断系统的诊断结果,所以利用所有极小冲突集构造极小冲突集合簇,并基于极小冲突集合簇计
Word conversion means to change the original syntactical functions and morphological features of a word that help to determine a part of speech.In translation i
国务院印发的《中医药发展战略规划纲要(2016-2030年)》中明确指出把“积极推动中医药海外发展,扩大中医药国际贸易”作为我国中医药发展方向和工作重点之一。从“促进中西医
随着世界全球化趋势加强,不同国家、民族间的联系也越来越紧密,语言翻译被放在一个日益重要的位置。而在全球气候生态化的大趋势下,胡庚申教授依托中国翻译理论的发展,提出生