通过弱化朴素贝叶斯假设提高朴素贝叶斯文本分类器的性能

来源 :第十九届全国数据库学术会议 | 被引量 : 0次 | 上传用户:skyboy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文中,我们用CO特征定义来表述单词间的相互依存关系,并给出了基于 CO特征定义的文档表示法,特征筛选算法和朴素贝叶斯文本分类算法。从实验结果中可以明显地看出,使用CO特征定义,可以提高朴素贝叶斯文本分类器的分类性能。其根本原因在于:采用CO特征定义,可以将特征fi,fj间的相互依赖关系在某种程度上体现到分类器中,弱化了朴素贝叶斯假设的强度。
其他文献
本文着眼于数据库设计提出了一种从DTD图到E-R图的转换方法来完成DTD与E-R模型的转换,将XML数据的模式(即DTD)转换回信息世界中的概念模型.因为我们可以根据得到的概念模型进
随着互联网技术的飞速发展,作为新一代Web信息表示和交换标准的XML受到业界的广泛关注.XML产生的最初原动力是为了解决HTML作为Web数据交换标准而带来的混乱局面.对于Web应用
会议
目前,基于异构信息源的网络信息集成应用发展迅猛,而在网络信息的集成与传递过程中,XML起到了举足轻重的作用.使用XML来描述中间(Mediator)层,使得数据异构问题可以轻易地被
本文讨论了一种在Na-tive XML数据库系统中利用模式、索引、聚簇等信息,进行查询优化的方法,其关键的思想是:先用最小简单分解的方法处理复杂路径,再利用系统信息进一步分解子申,以
XML作为一种数据交换和表示的标准,受到了越来越多的关注.Internet上以XML作为表现形式的数据也飞速增长.目前已经提出的XML查询语言都将路径表达式作为重要的组成部分.为了
会议
XML(eXtensibleMarkupLanguage)技术自出现以来,发展非常迅速,在许多领域内得到广泛的支持而成为互联网上一种标准的数据交换格式.XML最大的优点是它对数据描述和传送的能力.
会议
随着XML(eXtensibleMarkupLanguage)在过去几年中的发展,XML被作为在线文档的语义保持标记语言,它现在已经成为一种异构系统间数据交换的格式.在现实生活中,XML被广泛应用于
会议
为了提高网络空间复用度,最大化全网吞吐量,提出了一种基于物理冲突模型的功率分配和链路调度算法-PPLA.PPLA首先对整个网络进行六边形三色着色,从而选出可用并行链路集.在此
Internet上的信息量(拍卖物品,股市行情,新闻报道,以及广告发布等)急剧增长,为了不让如此庞杂的信息淹没用户,由此催生了大规模的数据分发应用.在这类应用中,特定的数据被分
会议
网络技术的发展使得Web成为最方便、最丰富的数据源.Web就是数据库,网络存储也成为新的服务模式和经济增长点.XML(eXtensibleMarkupLanguage)在表达查询、查询结果、结构和半
会议