【摘 要】
:
形态丰富语言由于其复杂的形态变化,会导致大词汇量和数据稀疏问题,这给统计机器翻译带来了巨大挑战。该文通过将这类语言表示为不同的粒度,然后分别进行翻译;由于不同的粒度
【机 构】
:
中国科学院计算技术研究所,中国科学院研究生院
【基金项目】
:
国家自然科学基金重点资助项目(60736014) 国家自然科学基金资助项目(60873167),致谢 感谢内蒙古大学和新疆大学提供的语料,感谢新疆大学的麦热哈巴·艾力老师在维吾尔语知识层面的帮助.
论文部分内容阅读
形态丰富语言由于其复杂的形态变化,会导致大词汇量和数据稀疏问题,这给统计机器翻译带来了巨大挑战。该文通过将这类语言表示为不同的粒度,然后分别进行翻译;由于不同的粒度能表征语言不同层面的特点,通过对不同粒度的翻译结果进行词级系统融合,便可生成更好的译文。维吾尔语、蒙古语到汉语的两组翻译实验表明,这种多粒度系统融合方法改善了翻译效果,BLEU值比最好的单系统分别提高了+1.41%和+2.03%。
其他文献
目的:观察中药外敷在治疗急性重症胰腺炎中的作用,方法:33例急性重症胰腺炎患者随机分为两组,对照组采用内科综合疗法,治疗组在此基础上加用中药外敷。结果:治疗组腹痛,腹胀的缓解比
目的应用耳内窥镜指导中耳腔置管术治疗分泌性中耳炎疗效分析.方法对45例分泌性中耳炎患者于全麻或鼓膜表麻下行中耳腔置硅胶管术,时间约6个月至1年.术前如有可能引起分泌性
从宁夏患从根病甜菜的病根中分离到一种球伏病毒粒子,直径约为28nm。提纯病毒的紫外扫描呈典型的核蛋白曲线,最大吸收为260nm,最小吸收为24nm,A260/A280=1.30。寄主范围广,能侵染茄科,豆科,藜科,葫芦科,番杏科等17种
应用生物素与抗生物素系统酶联免疫吸附试验建立了检测乙型病毒性肝炎患者血清中抗HBc的ABC-ELISA方法并与普通ELISA法进行了比较。结果表明:本法敏感性较普通ELISA法高4倍,
该文提出了一种基于自定义知识库强化获取规则集,以及规则与统计模型相结合的日语时间表达式识别方法。在按照Timex2标准对时间表达进行细化分类的基础上,我们结合日语时间词的特点,渐进地扩展重构日语时间表达式知识库,实现基于知识库获取的规则集的优化更新,旨在不断提高时间表达式的识别精准度。同时,融合CRF统计模型提高日语时间表达式识别的泛化能力。实验结果显示开放测试F1值达0.898 7。
本文应用15株分别抗肾综合征出血热(HFRS)病毒糖蛋白(Glycoprotein Ⅱ G2),核蛋白(Nuclcocapsid,NP)及血凝素(Hemagglutinin,HA)抗原的单克隆抗体免疫细胞化学方法对19例HFRS
作者设计并合成了一对用于PCR技术的突变引物HIV-1 Pr1和HIV-1Pr2,分别在两引物中设计了两个突变点,使突变后基因含有EcoRI、HindⅢ和TAA序列,便于HIV-1 Pr基因的定向克隆和
本文采用DNA-DNA分子杂交技术对病理组织学确诊的87例慢性宫颈炎患者和25例健康宫颈的宫颈活检组织DNA进行了HPV 6、11、16、18型DNA及HCMV HindⅢE片段检测。结果表明,对照
要控制人声这件“乐器”其实是很难的,因为它既看不见,也摸不到,非常的抽象。所以对歌唱器官肌肉运动的支配,并不随意、须要用心理活动的抽象感觉来调整。心理活动,呈现实世