基于机器阅读理解的开放域问答技术研究

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:lovetheme1988
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现如今,伴随着互联网、物联网和云计算等信息技术的不断变革,数据呈现出爆炸性增长。如何高效准确地获取信息逐渐成为学术界和工业界所关注的热点问题。最初的信息检索和分析任务是由搜索引擎完成的。然而,搜索引擎只能够返回大量相关网页,用户很难快速从中找到准确的答案。因此,如何高效地从互联网获取精确答案,是当前亟待解决的一个关键问题。通过基于阅读理解的开放域问答技术能够在海量数据中针对用户所提出的问题生成答案。为了提高问答系统的鲁棒性,基于阅读理解的开放域问答技术大多采用检索-阅读交互式框架。检索-阅读交互式框架包含交互式检索算法和阅读理解算法两部分,通过检索算法获取相关文档,基于阅读理解算法理解相关文档,并根据阅读理解算法的结果调整检索方向,直至获得最终答案。现有阅读理解算法多为监督场景而设计,而忽略了实际场景中大量未标注数据。此外,现有交互式检索算法固定了检索与阅读的交互轮数,在找到正确答案之后仍引入噪音文档,降低了问答的效率和准确率。本文设计并实现了基于阅读理解技术的开放域问答新系统,分别在交互式检索算法和阅读理解算法中基于上述问题进行了改进。针对阅读理解算法,本文提出了基于多任务学习和生成对抗训练的多文档机器阅读理解算法。在该算法中,为了保证生成对抗训练的过程能够端到端的训练,提出了混合式答案抽取方法同时生成候选答案的精确边界和向量化表示;为了利用原始文档验证候选答案的准确性,提出了全局-局部记忆增强网络编码超长距离文档集合。在公开数据集进行实验测试表明,本文所提出的多文档阅读理解算法在多个数据集上达到了最优效果,验证了所提算法的优越性。针对交互式检索算法,本文提出了基于强化学习的交互式检索算法。在该算法中,为了动态控制交互轮数,提出了基于强化学习的动态交互轮数控制模块;为了提高检索文档集合的整体质量,提出了基于策略梯度的文档集合全局优化函数。在真实数据集进行实验测试的结果表明,本文所提出的交互式检索算法与现有工作相比,显著提高了问答的效率和准确率,验证了所提算法的优越性。
其他文献
为提高城市轨道交通列车自动驾驶(automatic train operation,ATO)系统跟踪给定运行曲线的精度,基于子空间辨识方法,利用列车运行的历史数据,建立与实际运行状态相吻合的非线性子空间预测控制模型,设计子空间预测控制器,实现模型辨识数据和参数在线更新.运用MATLAB软件对比分析传统动力学模型与子空间预测控制模型的跟踪能力.结果 表明:子空间预测控制模型在速度、位移、加速度的跟踪精度上有明显优势,牵引/制动特性更加缓和.子空间预测控制模型可以保证列车运行安全、准时,并提高乘客乘坐舒适性.
为研究钢丝绳聚氨酯水泥复合材料加固损伤空心板梁的力学性能,进行加固条件下损伤空心板梁抗弯性能模型试验,分析板梁挠度、裂缝宽度和承载能力变化规律,研究复合材料加固损伤空心板梁的破坏机理.试验结果表明:采用钢丝绳聚氨酯水泥复合材料加固经过预压的损伤空心板梁,其破坏过程分为钢丝绳断裂、复合材料开裂和整体结构受弯破坏3个阶段,属于适筋梁破坏;此板梁的实测屈服荷载和极限承载力比未加固空心板梁分别提高28.60%、40.00%,相同荷载作用下的挠度降低22.81%,最大裂缝的宽度减小52.73%,梁体延性提高57.1
为完善城市轨道交通线网规划,指导城市轨道交通建设与运营,引领城市发展,优化城市空间结构,实现交通与用地协调发展的作用,提出一种基于节点备选集合的城市轨道交通线网规划模型.考虑影响轨道交通线网规划的主要因素,以直达客流、线路数量、建设成本、线路长度等作为线网布局的特质因子,建立轨道交通线网规划的数学优化模型;根据模型多决策变量的特点,采用免疫克隆算法进行求解.以某市的实际案例进行实证分析,结果证明模型算法合理、实用,可为制定城市轨道交通线网规划方案提供良好的定量支撑.
为解决现浇梁跨度大、荷载大、内箱模板高、难以保证内模支撑稳定的问题,采用槽钢桁架内模支撑方案,工前利用Midas优化支撑结构设计,确定3种设计方案,合理布置槽钢支撑,减少材料用量,满足内模支撑稳定性要求.结果 表明:3种现浇梁内模支撑结构方案均满足安全技术要求,通过经济性对比,确定了占用箱内空间少,用材最节省的最优方案.
随着信息技术不断发展,探测天线在更多的领域中发挥着重要作用,然而常规频段的探测天线已经难以满足更高的性能要求,探测天线趋向于在毫米波频段和低频频段发展以寻求解决方案。毫米波探测天线具有物理尺寸小、工作带宽大、波束窄以及抵抗环境干扰能力强等优点,低频探测天线具有超远的探测距离、优异的穿透性能、良好的衍射能力以及大气衰减小等优点。根据以上优点,本文设计了两款探测天线,一款是用于地表地形探测的毫米波微带
口令是人们使用非常频繁的认证方式,然而近几年口令数据泄露事件频频在国内外发生,引发了各界对口令安全的担忧。当前学术界在口令安全研究方面主要关注口令猜测攻击算法,这些算法通常基于已公开的泄露口令数据集进行研究,并未考虑到用户可能根据自身所处的网络环境进行口令设置的情况。本文站在攻击者角度,基于主动收集信息的思想,提出定向口令猜测攻击方法和口令强度评价体系,设计并实现通用框架下可自主配置的口令强度评价
以北京地铁6号线苹果园站密贴斜穿既有地铁1号线苹果园站主体结构为研究对象,采用三维有限元数值分析软件GTS-NX建立地铁车站-既有车站的三维有限元模型,计算分析桩梁拱(pile beam are,PBA)工法动态施工时地表沉降变形发展规律,并对比实测沉降与数值模拟沉降.模拟研究结果表明:采用PBA工法修建地铁车站整个施工阶段,导洞开挖引起的地表沉降为-12.25 mm,占地表总沉降的48.2%,扣拱施工引起的地表沉降为-6.94 mm,占地表总沉降的27.3%,说明导洞开挖、二衬扣拱阶段是控制地表沉降的关
以新景煤矿8128工作面为研究背景,通过理论分析的方法,确定工作面破碎顶板的破坏特征,提出采用注浆加固的方式提高围岩裂隙的接触面积,增强围岩的整体承载能力.实施注浆加固后,工作面日平均进尺较未注浆前提高约1.1 m/d,提高效率达31.43%,工作面冒顶现象明显减少.
针对新郑煤电公司赵家寨煤矿14采区开拓工程首次揭露“三软”(煤层软、顶、底板软)不稳定煤层的工程实际,采用施工导硐法石门揭煤,为防止揭煤期间发生冒顶事故,采用注水泥浆煤体充填和固化、远距离爆破等综合实用技术,有效避免了因石门揭煤爆破引发大面积冒顶堵塞巷道及瓦斯事故,取得了很好的揭煤效果.
2603工作面回采过程中挡矸支架受采空区垮落带岩层推挤严重,多次发生支架倾倒,给工作面挡矸支架的回收带来困难.通过制定挡矸支架回收技术方案,采用自移方式对挡矸支架进行回收,确保回收过程的安全性,缩短了工作周期,减少了作业人员,保证了挡矸支架的高效回收.