【摘 要】
:
作为从浩瀚的 Web信息资源中发现潜在的、有价值知识的一种有效技术 ,Web挖掘正悄然兴起 ,倍受关注 .目前 ,Web挖掘的研究正处于发展阶段 ,尚无统一的结论 ,需要国内外学者在
【机 构】
:
南京大学计算机科学与技术系!南京210093,南京大学软件新技术国家重点实验室!南京210093
论文部分内容阅读
作为从浩瀚的 Web信息资源中发现潜在的、有价值知识的一种有效技术 ,Web挖掘正悄然兴起 ,倍受关注 .目前 ,Web挖掘的研究正处于发展阶段 ,尚无统一的结论 ,需要国内外学者在理论上开展更多的讨论 .同时 ,Web挖掘系统的开发对其研究也将起到很大推进作用 .首先探讨了 Web挖掘的有关理论 ,从 Web挖掘的定义、Web挖掘与 Web信息检索的关系、Web挖掘任务的分类与功能等方面加以阐述 .然后重点分析了 Web文本挖掘的方法 ,包括 :文本的特征表示、文本分类与文本聚类 .在此基础上简单介绍了一个 Web文本挖掘系统原型Web Miner.Web Miner采用了多 agent体系结构 ,将多维文本分析与文本挖掘这两种技术有机地结合起来 ,以帮助用户快速、有效地挖掘 Web上的 HTML 文档 .
其他文献
电子不停车收费系统是一种用于公路、桥梁和隧道等的电子自动收费系统,而射频识别技术是一种非接触式的自动识别技术.基于射频识别技术的电子不停车收费系统,无需用户停车缴
“三农”问题是当前我国社会的一个热点、难点问题,具有举足轻重的作用。“三农”问题能否解决以及解决的程度,直接影响我国经济社会的发展活力、社会的公平以及国家的稳定。“
化学是一门以实验为基础的自然科学,化学实验是化学教学的重要内容,是化学教师常用的教学手段,也是学生学好化学的有效途径。化学实验设计是指学生在实施化学实验之前,根据一定的
水体富营养化的产生原因和控制是一个世界性的深受关注的热点研究课题。本文以富营养化水体中最具代表性的铜绿微囊藻(Microcystis aeruginosa)作为研究对象,以某饮用水源水库的
基于滑动窗口的连续查询处理是数据流研究领域的一个热点问题 已有的研究工作均假设滑动窗口内的数据能够全部保存在主存中 ,若滑动窗口内的数据量超过了可用主存空间 ,已有
沥青路面使用性能受环境影响很大。西藏地区气候条件特殊,沥青路面混合料的性能要求与一般地区有所不同。而以往该地区关于沥青路面的研究都是针对二级及二级以下公路,高等级沥
美学经济在本质上是体验经济、创意经济。人们在美学经济中生产/消费的不只是物品的使用价值,更多的是美的精神价值。人们通过生产/消费美,获得的是精神的愉悦和提升。从这个
以稻壳为原料,采用K2CO3活化法和H3PO4活化法制备了比表面积为1 312 m2/g和682 m2/g的活性炭,通过扫描电子显微镜(SEM)、X-射线衍射仪(XRD)对样品进行了表征,并将孔隙发达的
宋朝立国,在西南地区的重要举措之一就是放弃对大理国的统一。这与宋朝统治者对唐宋以来西南边疆防御体系的变迁,对自身地缘政治局势的判断,以及恪守"重北轻南"地缘战略不无
国内外如今有众多学者研究“乡规民约”以及“基层社会治理”。国内学者与国外学者在研究“乡规民约”方面有什么异同?国内外学者在研究“基层社会治理”方面有什么异同?本文将