【摘 要】
:
互联网的迅速发展和日益普及,使其蕴含了海量的信息资源,已成为人们获取信息的重要途径之一。然而,与此同时网络广告日益泛滥,产生了许多负面影响。一方面,网络广告会干扰网民浏览
论文部分内容阅读
互联网的迅速发展和日益普及,使其蕴含了海量的信息资源,已成为人们获取信息的重要途径之一。然而,与此同时网络广告日益泛滥,产生了许多负面影响。一方面,网络广告会干扰网民浏览或杳找网络信息,网民对网络广告的反感逐年上升;另一方面,网络广告会淹没网页中的有用信息,严重损害了Web挖掘的质量。在这种背景下,对网络广告进行过滤显得尤为必要,特别是由于品牌图片广告占据了整个网络广告市场的半壁江山,所以针对网络图片广告过滤的研究很有实际意义。
本文将网络图片广告过滤问题转化为文本分类问题,这种文本分类问题是可以通过粗糙集模型来处理的。已有研究存在着各种各样的不足之处,本文针对这些不足,根据网络图片数据集的特点,在一般粗糙集模型的基础上,提出了一种针对网络图片广告过滤的“粗糙集分组约简模型”,采用分组约简的方法对文本数据集进行特征选择,能够提高算法时间效率。设计了对比实验,利用UCI机器学习数据库中的Internet Advertisements数据集,分别用粗糙集分组约简模型和一般粗糙集模型进行了对比分类实验。
本文的主要工作和贡献体现在以下几点。首先,较全面地总结了国内外基于数据挖掘的网络图片广告过滤领域的研究成果;其次,率先将粗糙集理论应用于网络图片广告过滤领域,实证研究表明粗糙集理论能很好地处理网络图片广告过滤问题,分类准确率达到甚至超过了以往的研究结果;第三,根据网络图片数据的特点,改进了一般粗糙集模型,提出了新的粗糙集分组约简模型:最后,设计了对比实验,用实际数据对两个模型进行了实证分析,表明粗糙集分组约简模型能进一步提高分类质量。
本文提出的粗糙集分组约简模型具有较好通用性,可以类比应用于那些可以将特征项分为若干组的数据集,这种数据集在义本分类领域是比较多见的,例如垃圾邮件过滤问题。
其他文献
开封市农科所培育成功的“开8034-5”最近通过河南省品种审定委员会审定,被命名为“予花三号”花生新品种。付研究员王一均等同志辛勤耕耘十年培育成功的“予花三号”花生新
故事是深受受幼儿喜欢的文字形式,其优美的景色,典型的人物形象塑造,生动的故事讲述,让幼儿深深为之吸引,使他们增长了知识发展了智力,在具体讲授的过程中,我们要认识到它的
棉花进入开花结铃期,正是上海伏旱季节。这时棉花需要大量水分,以保证棉株体内各项生理活动的正常进行。适时抗旱,就能使棉花多结铃,结大铃,产量高,品质好。然而,由于对“三
一 每一个新来者,都会有一种遗失感。 没有一张熟悉的面孔,没有一个熟悉的地方。街道溜达一天,公园闲逛一天,都听不到有人喊你的名字。 这种遗失感,在某天骑着共享单车去一片绿地闲逛时,十分强烈地向我袭来。天气太热,汗流浃背,我索性脱了身上的短袖衫,光着背骑车在街上穿行——这样赤裸着上身,在大街上骑行,在我所居住的城市是不可能的,不仅因为那座城市没有酷暑,而且即使有时天气太热,也不会有人赤裸着上身
随着农业生产的发展,当前化肥生产,特别是氮肥生产,仍然满足不了农业生产的需要。尤其应该指出:施于土壤中的氮肥,有相当大的一部分氮素并未被作物吸收利用而白白的损失了。
本文通过探讨中学历史课堂,提出在新课程标准下,让课堂成为师生互动的课堂,将历史、文学、音乐、艺术等综合在课堂之中,培养学生主动参与的精神,具有好奇心、求知欲和各种良
云南日报为了坚决貫彻中共云南省委关于大力提高报紙质量的指示,貫彻全党办报的方針,进一步密切报紙和群众的联系,及时充分地支持新生事物。决定于五月份分片分批召开全省通
设备维修外包是中小企业降低设备维修成本,提高设备管理水平,进而增强竞争力的有效途径。在业务外包迅猛发展的背景之下,作为业务流程外包的一种具体形式,设备维修外包已经获得了
请下载后查看,本文暂不支持在线获取查看简介。
Please download to view, this article does not support online access to view profile.
不同的用笔留下不同的笔触,笔触能加强主题的气氛、意境,能抒发作者的激情,还可产生画面的韵律美。一幅水粉习作在构图、色调以及物象的形体结构都合理的前提条件下,如何使用