论文部分内容阅读
该文介绍了对中文校对系统所侦测出来的错误字串提供修改建议的算法。这个算法已应用在IBM中国研究中心研究的中文校对系统CEC中。它首先根据字形、字音、字义或输入编码相近的原则整理出一个替换字表,然后结合主词典和二元语法的统计模型,通过加字或换字对侦测出来的错误字串提供若干修改建议并予以评价。这个算法能对80℅以上的错误字串提出正确的修改建议,并已经集成在Lotus WordPro’97这个字处理软件之中。