论文部分内容阅读
发现 out-of-vocabulary 词是在中国词分割的一项迫切、困难的任务。避免由在传统的方法的离线的训练引起的缺点,报纸 ptoposes 由基于提取本地上下文信息为中国词分割算法的质点火柴( PPM )的改进预言,它增加严峻的文章的上下文信息进本地 PPM 统计模型以便指导新词的察觉。算法集中于联机分割和在靠近或洞的测试完成好效果的新词察觉的进程,并且超过某著名中国分割系统到某个程度。