【摘 要】
:
集成学习是一种联合多个学习器进行协同决策的机器学习方法,应用在机器翻译任务的推断过程中可以有效整合多个模型预测的概率分布,达到提升翻译系统的准确性的目的.虽然该方法有效性已在机器翻译评测得到了广泛验证,但关于子模型的选择与融合的策略仍鲜有研究.该文主要针对机器翻译任务中的参数平均与模型融合两种集成学习方法进行了大量的实验,分别从模型与数据层面、多样性与模型数量层面对集成学习的策略进行了深入探索.最
【机 构】
:
东北大学自然语言处理实验室,辽宁沈阳110819
【出 处】
:
第十七届全国计算语言学学术会议暨第六届基于自然标注大数据的自然语言处理国际学术研讨会(CCL 2018)
论文部分内容阅读
集成学习是一种联合多个学习器进行协同决策的机器学习方法,应用在机器翻译任务的推断过程中可以有效整合多个模型预测的概率分布,达到提升翻译系统的准确性的目的.虽然该方法有效性已在机器翻译评测得到了广泛验证,但关于子模型的选择与融合的策略仍鲜有研究.该文主要针对机器翻译任务中的参数平均与模型融合两种集成学习方法进行了大量的实验,分别从模型与数据层面、多样性与模型数量层面对集成学习的策略进行了深入探索.最终实验结果在WMT中英新闻任务上,相比Transformer单模型有3.2个BLEU值的提升.
其他文献
简要介绍了神华宁煤集团煤化工产业的发展历程、面临的挑战与应对策略、智能制造“两智一数”,即智慧园区、智能工厂、数字车间的规划和百万吨烯烃智能制造新模式应用项目.
本文阐述的罐区控制系统技改项目,因原有控制系统不符合国家对于重大危险源安全设施设计的要求,本次技改的主要内容是提升危险化学品储存设施安全仪表系统安全功能[1],执行功能安全相关标准要求,设计符合要求的安全仪表系统.通过本次技改一方面满足国家现行法律发规对于罐区安全设施设计要求,另一方面也提升成品罐区原有控制系统的安全性、易用性、可维护性,间接提高罐区控制的安全等级.
模糊控制最适用于一些大惯性、大滞后、非线性、数学模型难以获得的系统.模糊控制系统的鲁棒性强,干扰和参数变化对控制效果的影响被大大减弱,MTO系统是一个多变量、强耦合的反应控制系统,本文尝试从工程应用的角度对反应系统变量做了相关性分析,并且对该系统提供了一种先进的模糊PID控制策略.
煤化工产业是中国重要的经济行业之一,与中国经济增长和人民生活水平的提高都有密切关系,伴随着科学技术的发展,各行业都已经普遍应用了先进设备.本文围绕煤化工生产自动化控制仪表进行探讨,对自动化仪表在煤化工行业中的应用提供参考和借鉴.
对某厂的DEH进行简单的介绍以及一些现场问题的探讨,并给出解决方案以供交流.某厂热电站汽轮机采用哈尔滨汽轮机控制工程有限公司生产的高压、冲动、单抽、凝汽式汽轮机。额定功率为50MW,型号为CKZ50-8.83/4.1,主蒸汽压力为8.83MPa,抽汽压力为4.1MPa。机组控制系统采用高压抗燃油纯电调控制,电液转换器采用MOOG公司生产的MOOG761伺服阀等组成。DEH系统的硬件采用ABB公司S
文章对于化工装置的检测仪表的选型、DCS优化控制、参数整定以及安全分析进行了详细的论述.化工装置行业装置的特点是:气体循环量大;温度压力较高;反应器多;分析仪较多;SIS系统复杂;装置安全性要求高.检测仪表及分析仪选型、DCS优化控制以及参数整定三个方面对于能否实现装置的连续平稳操作,起到至关重要的作用.检测仪表及分析仪是装置的眼睛,是为装置运行出现波动时需要准确判断波动原因提供依据;优化控制的目
Modbus通讯因其投资少、通讯距离长、稳定可靠的优点广泛应用于工业控制网络,为工厂信息网提供工业生产数据,能够在新的产业革命中起到重要作用.本文重点对Modbus通讯协议的几个基本概念进行重点介绍,对实现Modbus通讯的硬件传输协议RS485进行简单工作原理分析.简单的列举了工程实践应用中,实现Modbus通讯必须具备的条件.特别对霍尼韦尔PKS300(霍尼韦尔公司的一款集散控制系统产品)系统
煤气化现场四条煤线速度计原为美国热电生产的煤粉速度计,由于使用寿命接近上限,各条煤线速度计相继出现跳变、无测量数据等状况,小幅度的波动会导致煤气化氧煤比控制不稳定,长期下来对煤烧嘴烧嘴头及烧嘴罩产生极大的损伤,而大幅度的波动将直接导致烧嘴跳停,单烧嘴跳停后重新投用需要一段时间,影响工艺调整及合成气产量,进而影响甲醇产量,而多个烧嘴跳停可能会导致气化炉停车,我厂届时正处于多条煤线速度计频繁出现波动,
煤化工行业SCADA系统已经成为国家关键基础设施的重要组成部分,但由于控制系统所使用的设备、协议以及系统构建时未充分考虑信息安全等问题,存在较多的安全隐患,无法抵御来自网络的攻击,急需有效的解决方案.针对这一需求,对控制系统中网络安全防御提出了由“安全运维”提升到“安全运维”的理念,并对其实践进行了探讨,文中所提出的方法不仅可用于对现有系统进行安全运营,也可作为新建系统的安全运营参考.
文本自动撰写在自然语言处理中是一个重要的研究领域,可通过人工智能的方法来提升文本的生成结果.目前主流的生成方法是基于深度学习法,而该文中提出了一种基于注意力的端到端模型生成藏文律诗法.该方法构建在端到端的基础上,并无需任何人为的特征设置工作.基本框架是一个双向LSTM的编码-解码模型,在此基础上逐渐引入了藏文字嵌入、注意力机制和多任务学习法.实验结果表明,该文提出的方法在藏文律诗生成结果中其BLE