一种基于支持向量机的抗噪声邮件分类方法

来源 :第二十一届中国数据库学术会议 | 被引量 : 0次 | 上传用户:liming10060651088
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文通过分析支持向量机对于邮件分类的优缺点,提出了一种新颖的抗噪声邮件分类器口其基本特点有。1)通过选取最优的特征属性作为向量的维,来确定分类的参考空间.2)使用高维空间离群点的发现技术,对样本进行缔选,从而达到去除噪声的目的。通过“干净”的样本训练出基于支持向量机的邮件分类器。这样的分类充分考虑了大多数的情况,而忽略了极少数出现情况对分类器的千扰。试验表明,经过优化后的分类器比基于Bayes方法有更高的分类精度。
其他文献
本文主要对数据网格环境下海量数据的连接操作算法进行了研究,针对网格中各结点之间网络带宽异构的特点,采取关系缩减算法、行分块传输技术和流水线并行机制来减少查询的响应
泛逻辑学是描述连续变化过程的柔性逻辑学,它里面的广义相关理论细致地刻画了逻辑变量间的各种关系,为柔性逻辑的运算奠定了基础。本文应用广义相关理论提出了一种新的关联规则
本文提出了一种相关性分析算法--PairAnalysis,它衍生于传统的关联规则算法,用于发现数据集两个属性值之间的相关性。与其他的关联规则算法相比,该算法可以使用固定容量的内存进
实现了集中化的系统的本质是除去了空间性。就是说不存在信息处理(或控制)中心与各终端的空间因素。这种空间因素只在通讯阶段前起作用,而通讯过程的目的就在于消除这一因素
本文讨论了使用频繁自由项集作为浓缩的频繁项集基的若干问题。提出了最短强规则的概念,通过最短强规则及偏差,本文可以给出一部分频繁非自由项集的准确的支持度,并能提高其它频
序列模式挖掘是数据挖掘的一个重要分支,在序列事务及有关信息处理中有着广泛的应用。本文主要介绍了分支模式的定义和分类,以及并发分支模式的挖掘方法.并发分支模式挖掘在工
本文通过扩展传统的关联规则模型,为每一数据项赋给不同的最小支持度,成功地解决了用单一的最小支持度挖掘关联规则不能完全反应在数据库中不同的数据项出现的颇度与性质的问题
本文开发了Miner_Motorun系统。该系统具有如下特点:1.集成并实现了数据挖掘领域的最新研究成果,如分类分析、自动预测、关联分析等各种相关的算法和技术。2.能够有效地处理大
会议
本文旨在分析序列模式挖掘的相关概念,研究GSP和PrefixSpan两种序列模式挖掘算法的基本思想和实现方法,并结合实例阐述这两种算法的具体应用。
中医学源远流长,是我们的祖先与疾病作斗争的经验结晶.几千年来,针对不同的病症积累了无数方剂,留下了众多中医学巨著.这些方剂和巨著构成了指导今天的中医工作者如何对症下
会议