论文部分内容阅读
给出了一种基于快速排序和归并排序的高阶汉语大标记集Markov统计语言模型的统计算法,并对算法的时间复杂性和空间复杂性进行了分析,依据这种统计算法,设计实现了一个汉语字(词)统计统计系统,通过对上千万字的汉语语料的统计,建立起了汉了(词)一元,二元和三元Markov模型,并对统计结果进行了分析。