论文部分内容阅读
本文介绍了在构建动态邮件语料库时所必须解决的问题-邮件语料的添加.由于待添加的邮件预先都己标好类别,根据其类别是否属于原有的类别体系,分两种情况进行处理:1)属于原有类别的新邮件,将这类邮件细分为Ⅰ、Ⅱ和Ⅲ类,最后只将属于Ⅲ类的新邮件添加到原语料库中:2)不属于原有类别的新邮件,将此类邮件进行去重后全部添加到语料库中.模拟的邮件语料添加实验表明了待添加语料裁剪的必要性及添加算法的有效性.