【摘 要】
:
机器翻译系统是人类使用计算机来处理自然语言的一个工具,为了能实现机器翻译,其涉及的领域包括数学,语言学,计算机科学,甚至延伸到艺术,其它科学乃至工业领域.对于开发者和
论文部分内容阅读
机器翻译系统是人类使用计算机来处理自然语言的一个工具,为了能实现机器翻译,其涉及的领域包括数学,语言学,计算机科学,甚至延伸到艺术,其它科学乃至工业领域.对于开发者和研究工作者来说,都始终梦想能有一个完美的机器翻译系统,一旦一个完美的机器翻译系统公布于世,那将是人类文明史上的一个里程碑.从机器翻译的诞生到现在,人们已经提出了多种机器翻译的方法,基于实例的方法是基于语料库的第三代机器翻译方法中的一种,该方法最先由日本科学家提出来,并成功的运用到机器翻译的实际工程项目中去.其他国家也有相关研究的报道,在国内,有关学者在该方法领域做了许多基础理论研究工作,但是至今没有人完成一个完整的面向应用的基于实例的机器翻译系统.该文探讨了把中文翻译成英文,基于知网的实例机器翻译系统的构建,其主要贡献是:1)改进了原来基于知网的词汇相似度计算的数学模型,解决了在加权平均的过程中,其中某些义原类不存在而带来计算结果偏小的问题.2)提出了基于某特定上下文的词汇相似度的校正公式,对该公式,从理论上做了严格的推导,分析说明了该公式是符合实际的一个近似公式.3)提出了计算两个句子相似的数学模型,并从统计学的角度,对该模型的数学计算公式给出了解释.4)设计完成了整个系统,给出了系统构建中主要流程的一些算法.主要包括实例库的构建,入库算法,词汇相似计算算法和翻译算法.
其他文献
随着网络用户的急剧增长以及流媒体技术的快速发展,访问延迟已经成为网络发展的桎梏,内容分发网(CDN)的出现正好解决了该问题.它提高了用户访问网站的响应速度,优化现有网络
现今社会开始逐渐步入老龄化,人们对老年人身体健康问题关注度越来越高。子女往往因社会激烈的竞争、工作压力等因素不能时常陪伴老人造成空巢家庭数量剧增。在这样一个全球
网格计算是近年来新出现的一种计算机技术,它可以把分布在不同地方的计算机连接起来以实现对cpu、数据、仪器、软件等资源的共享,它是继互联网之后计算机技术又一次新的发展.
随着Internet的发展,计算机软件的信息处理规模也呈增长的趋势.然而,由于传统分布计算技术的固有缺陷,软件系统却变得更庞大、缓慢和脆弱.在这种情况下,分布式对象技术应运而
随着整个计算机行业的不断发展,面向对象的程序设计语言和软件开发平台己经成为系统构建的主要工具.UML统一建模语言已发展成为业界标准,Rational统一过程(RUP)提供了如何在
随着地理信息系统(GIS)的发展,安全问题在GIS中的重要性越来越突出.目前GIS主要是将空间数据存放于数据库中,依靠数据库系统的安全访问控制来实现的.但是这种方式在管理具有
该论文主要针对于三维CAD中的变形体造型方法进行了深入的理论研究,并且结合服装模型,将基于物理模型的变形体细分技术成功地应用于三维服装功能性CAD中.该论文首先对计算机
在二十一世纪,随着生命科学和计算机信息技术的发展,一门崭新的、拥有巨大发展潜力的新学科-生物信息学已悄然兴起.基于RNA的研究已成为当前生物信息学界最重要的研究课题之
计算机技术和通信技术的飞速发展开辟了分布式多媒体信息系统这一崭新的研究领域.多媒体同步是分布式多媒体系统的关键技术和基础,多媒体同步关系存在于多媒体的整个生命周期
随着Internet网络与通讯的飞速发展,网络用户数量的急剧增长,用户对网络的需求也有着显著的变化.Internet网络上承载的业务也由原来单一的数据类型变成多种类型的流量,如:语