不记集汉语字(词)Markov语言模型的建立

来源 :哈尔滨工业大学学报 | 被引量 : 0次 | 上传用户:syfounder
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
给出了一种基于快速排序和归并排序的高阶汉语大标记集Markov统计语言模型的统计算法,并对算法的时间复杂性和空间复杂性进行了分析,依据这种统计算法,设计实现了一个汉语字(词)统计统计系统,通过对上千万字的汉语语料的统计,建立起了汉了(词)一元,二元和三元Markov模型,并对统计结果进行了分析。
其他文献
目的探讨2型糖尿病患者血小板功能改变与血管病变的关系.方法同时测定69例2型糖尿病患者和14例正常人(K组)血小板ADP聚集率和血小板表面颗粒膜蛋白(CD62P和CD63)表达的变化,
提出利用高精度测角仪测量齿轮副在啮合过程中不同啮合位置时轮齿受载综合变形的新方法。利用该方法要以精确测得齿轮多对齿啮合和单对齿啮合情况下受载综合变形,实验装置简单
从目前数学分析的教学改革和课堂教学出发,对课堂教学内容与方法进行研究,致力于提高课堂教学效率,培养学生的创新思维.我们结合零点定理的一个简单应用,启发学生应用所学知
在CCD像感器主动位置测量中,光信号是可以人为设计的,其形状大小乃至光谱是可以选择的,因此在位置测量时,可利用上述条件来提高精度,本文就这一问题进行了探讨,提出了光信号设计理论并
我国高校在如何加强大学生思想政治理论课教学上采取了一系列改革措施,虽然取得了一定的效果,但实效性仍比较低。学生、任课教师以及高校管理者对思想政治理论课教学还存在着一
提出了有限元分析抽象模型的概念,并给出了建立抽象模型的自动分割算法,“特殊内环”的引入使网络单元边与属性边的“交叉”现象得以避免,完全实现了基于抽象模型的二维有限元网
Calpain-10基因的第43单核苷酸的GG基因型频率,119例2型糖尿病组为91%,121例空腹血糖正常组为86%,二组间差异无统计学意义.
为促进信息与计算科学专业应用型人才、复合型人才和拔尖创新人才的培养,探索深入开展实践教学改革的有效措施。在保持湘潭大学信息与计算科学专业传统优势和特色的基础上,依托
农业院校青年教师基本技能是指其完成教学活动任务必须包含的专业知识与能力,是其教育和教学综合能力的体现。重视青年教师的基本技能是高校发展的保障,在实践中提高青年教师
目的筛查肥胖人群IRS-2 G1057D多态性并探讨其意义. 方法选取辽宁汉族肥胖者225例,其中2型糖尿病(T2DM)组112例,健康对照组113例.用PCR-RFLP方法检测IRS-2 G1057D多态性,结合