【摘 要】
:
维吾尔语形态较为复杂,构形词缀在维吾尔语中占有重要地位,其语法与汉语有较大差别。针对维吾尔语的形态特点,分析汉语端到维吾尔语端在统计机器翻译中维吾尔语词缀的作用,搭
【机 构】
:
中国科学院新疆理化技术研究所,中国科学院大学,新疆民族语音语言信息处理实验室
【基金项目】
:
国家自然科学基金(U1703133),中科院西部之光人才培养引进计划(2017-XBQNXZ-A-005),中国科学院青年创新促进会项目(2017472),新疆维吾尔自治区重大科技专项(2016A03007-3),新疆维吾尔自治区高层次人才引进工程(Y839031201)
论文部分内容阅读
维吾尔语形态较为复杂,构形词缀在维吾尔语中占有重要地位,其语法与汉语有较大差别。针对维吾尔语的形态特点,分析汉语端到维吾尔语端在统计机器翻译中维吾尔语词缀的作用,搭建基于短语的汉维统计机器翻译系统,对词级粒度、词干级粒度、最大词干级粒度、词干-词缀级粒度、词干-词尾级粒度的汉维平行语料库进行对比实验,研究不同粒度的维吾尔语对汉维机器翻译中的词语对齐质量和语言模型质量的影响。实验结果表明,在上述5种粒度的维吾尔语语料中,基于词干的维吾尔语和基于词干-词尾的维吾尔语目标端语料的翻译质量明显提高。
其他文献
牙痛是指与实际或潜在的牙体组织损伤相关的一种不愉快感觉和情绪体验,它是口腔科疾病最常见的症状。其产生包括了伤害性刺激的传入、各级中间神经元的传递及中枢神经系统对传
为了探究不同植被覆盖下的土壤水分动态变化和团聚体稳定性的关系,选取桂花地、油菜地、杉树地3种植被下的土壤为研究对象,就团聚体和土壤水分之间的年变化关系、短期变化关系(在短期降雨前后)进行了研究。结果表明:在1年时间内、3种植被下的土壤中,杉树地土壤团聚体稳定性显著高于桂花地和油菜地,并以0.25~2mm的水稳团聚体为主。土壤团聚体稳定性的年变化趋势和土壤水分呈显著负相关关系,在土壤水分含量降低的时
磷酸酯抗燃油作为汽轮机调速系统介质,当前存在油质酸值、体积电阻率因油质劣化而超标的情况。通过4个发电企业磷酸酯抗燃油的运行状况,分析了引起抗燃油酸值、体积电阻率超
垂钓记“野芳发而幽香,嘉木秀而繁荫……”在碧溪,两岸的蓑衣随潮涨又随潮落,鱼儿既肥又美.而湖面
<正> 我院电路中心实验室,自1986年成立以后,针对实践教学环节这一紧迫问题,做了一些开放尝试与探索,取得一些成果,也遇到一些问题,但坚持开放式教学,我们认为是一条加强实践
结合老旧小区改造背景及存在问题,以某老旧小区雨污分流改造项目为例,探讨落实海绵城市建设理念。通过对建筑与小区领域常用低影响开发措施进行比选,提出在建设投资平衡情况
为有效地检测脑电图(EEG)中的癫痫信号,设计一维局部三值模式(1D-LTP)算子提取信号特征,并结合主成分分析(PCA)和极限学习机(ELM)对特征进行分类。通过1D-LTP算子计算信号点
利用建筑垃圾制成的再生集料作为透水混凝土基层骨料,为了研究再生集料透水混凝土基层的路用性能,文章在最佳配合比的基础上,优化选择适用于试验的基准配合比,探究不同水泥用