【摘 要】
:
现有最先进的神经机器翻译模型大都依赖于多层神经网络结构,针对多层网络结构易导致信息退化的问题,提出通过融合层与层之间的输出信息来改善各个层之间的残差连接关系的方法
【基金项目】
:
国家重点研发计划(2016YFE0132100);国家自然科学基金(61673289)
论文部分内容阅读
现有最先进的神经机器翻译模型大都依赖于多层神经网络结构,针对多层网络结构易导致信息退化的问题,提出通过融合层与层之间的输出信息来改善各个层之间的残差连接关系的方法,从而使得层与层之间联系更紧密.相比于原来的残差网络连接,进一步优化了深层网络的信息流动结构,使得整个结构有效信息流动更充分.在Transformer模型和序列到序列的卷积(convolutional sequence to sequence,Conv S2S)模型上进行相关实验,大规模中-英翻译任务的实验结果表明,该方法提高了Transform
其他文献
在江宁的绿水青山间,坐落着网红民宿、设计师手工作坊、乡村野味餐厅等多个“好去处”。600多名大学生扎根农村创业,助力乡村振兴,把绿水青山变成了金山银山。大学生纷纷“下
近年来,随着生活方式的不断改变和经济条件的不断改善,我国脑卒中发病率呈逐年增高、发病年龄不断提前的趋势[1]。在我国,脑卒中的发生主要为缺血性病变,约33%~50%的卒中和50%
利用介质阻挡放电原理产生等离子体射流的状态会受到施加电压的影响,射流长度和发光强度都会随着施加电压的增加而增强。DBD放电装置中气体的流量,电源频率,施加电压都会引起
华北平原地区由于无节制的开采地下水以及无限增长的工农业开采井,导致深层承压水长期持续超采,地下水位持续降低,引发了地面沉降等一系列次生灾害。东光县则是其中最为典型的地区,为了满足国家综合治理要求,对该地区地面沉降进行分析及模拟该地区的地下水流变化规律已成为目前的首要任务。本论文通过分层标监测数据分析得出研究区的深层含水层对该区域地面沉降的贡献率大,且沉降速率受季节影响较大并与地下水位明显相关。针对
<正>"特殊"的工作让他对生命有了更多感悟,他说,能让逝者安详地离去,对我们火化师来说也是一种幸福。中国人讲究"死者为大",有人甚至说,中国人是举世公认的最为死者操心的民
为了解科技期刊更名对其影响力的影响,文章采用文献计量学方法,分析《国外医学(卫生学分册)》更名为《环境卫生学杂志》后各指标的变化情况;学科的发展是期刊更名的主要原因,
职业高中的学生,学习成绩较羞,学习习惯、学习动机都存在着一些欠缺,普遍缺乏学习兴趣,尤其是对于数学学科而言,因为数学的逻辑性较强,初中阶段他们的底子没打好,到了高中自然就不容
目的:本研究目的是观察白细胞介素-6,白细胞介素-12,C反应蛋白(CRP),血管内皮细胞生长因子(VEGF)和β-防御素-1基因多态性和与中国牙周炎患者易感性的关系。方法:提取532名健
荷花(Nelumbo nucifera),莲科莲属植物,多年生水生草本花卉,是中国十大名花之一,有着巨大的经济、生态、观赏以及药食价值。荷花的花瓣香味独特,或浓郁或淡雅,品种间香味各有
气体介质阻挡放电(GBD)从结构上来说是用气体介质代替传统固体介质的阻挡放电(DBD)。本文在现有GBD的研究成果之上,设计了同轴供气的气体结构。其中氦气为工作气体,氩气或者