论文部分内容阅读
针对目前电子邮件安全网关不能很好地支持敏感信息检测问题,深入研究了Winnow算法和Markov模型,在N-Gram语言模型的基础上,提出了一种邮件特征选择方法--Markov-Gram,该方法以句子为单位进行特征项的选取,不仅保留了更多的语义信息,而且可以有效地减少特征项的数目,解决“维度灾难”问题;提出一种Winnow算法训练过程中初始权重生成方法,该方法融入了电子邮件结构特点以及