论文部分内容阅读
Web信息资源中蕴含着具有巨大潜在价值的知识。人们迫切需要能够从Web上快速、有效地发现资源和知识的工具,搜索引擎不能完全满足这一要求,为此需要开发比信息检索层次更高的新技术。文中以Web文本为研究对象,着眼于将数据挖掘技术应用于Web挖掘,兼顾中英文文本,提出了一套Web文本的特征表示,特征提取及Web页面的结构化转换方法,并将粗糙集理论应用于转换后的Web文本挖掘。