论文部分内容阅读
随着Internet技术的发展,各种网络应用服务越来越多。其中,网络中广泛使用的电子邮件正成为一种快捷而经济的通信手段,如何面对每天各种各样、种类繁多的邮件,就成为一个迫切要解决的问题。虽然当前垃圾邮件过滤方法众多,但是还有许多垃圾邮件过滤效果不是很理想。所以,研究一种更加新型高效的,快速的邮件过滤系统仍具有特别的现实意义。本文提出了一种基于贝叶斯算法的双层邮件过滤方法,将其应用于邮件服务智能代理的网络安全方面,对提高邮件的分类准确度及垃圾邮件的过滤有着重要的意义。本文主要工作如下:1)对目前国内外邮件分类相关技术进行分析,并提出了本课题要研究的主要内容。介绍了邮件服务器的工作原理及其功能。对邮件服务智能代理的实现进行了总体设计,制定出各功能模块及其主要功能。提出了基于邮件长度特征的过滤,以便能更好的提高分类的准确性。2)介绍了电子邮件系统的工作原理、Java Mail API,以及对邮件内容进行结构化解析的主要技术。分析了多种中文分词实现方法,提出了运用最大匹配法实现分词。比较了多种特征选取算法,用文档频度和词条频度相结合的方法作为本课题的特征选取算法。分析多种分类器的优缺点,运用贝叶斯机器学习的方法,并对其用于邮件分类的原理进行了剖析,详细介绍了贝叶斯分类器的算法实现。3)邮件服务智能代理的实现及其性能分析,并对本课题的研究进行总结,展望了今后的发展方向。