【摘 要】
:
将deep Web发掘与主题爬行技术有机地结合起来,对deep Web垂直搜索引擎系统的关键技术进行了深入研究.首先设计了deep Web主题爬行框架,它是在传统的主题爬行框架的基础上,加入了
【机 构】
:
吉林大学计算机科学与技术学院 长春 130012
【出 处】
:
NDBC2009第26届中国数据库学术会议
论文部分内容阅读
将deep Web发掘与主题爬行技术有机地结合起来,对deep Web垂直搜索引擎系统的关键技术进行了深入研究.首先设计了deep Web主题爬行框架,它是在传统的主题爬行框架的基础上,加入了前端分类器作为爬行策略的执行机构,并对该分类器做定期的增量更新;然后使用主题爬行技术指导deep Web发掘,并且借助开源组件Lucene将主题爬行器所搜索的信息进行合理的安排,以便为检索接口提供查询服务.当用户向搜索引擎提交查询词后,Lucene缺省按照自己的相关度算法对结果进行排序.通过爬虫、索引器和查询接口的设计,实现了一个面向deepWeb的垂直搜索引擎原型系统.
其他文献
频繁项集挖掘是数据流挖掘中的一个热点问题.提出了一种新的数据流频繁闭项集挖掘算法MFCI-SW.首先设计了两个新的数据结构:频繁闭项集表FCIL和频繁闭合模式树MFCI—SW—Tree,在
法语里,赵无极写作Zao Wouki。这个名字出现在艺术界,代表炉火纯青;出现在艺术品市场上,则意味着稳定保值。在2009年胡润艺术榜上,赵无极以总成交18202万元位于榜单第5位,排
传统item-baseol协同过滤算法根据项目之间的相似性来选取最近邻居.然而,现存的几种相似性度量方法都存在相应的弊端,因此只根据相似性无法找到准确可靠的最近邻.根据对两项目共
[摘要]多媒体作为一种现代化的教学手段,在教学中的优势是不言而喻的,他可以在轻松愉快的气氛中,在不增加学生负担的情况下,起到有意注意不能起到的作用,从而调整学生的学习心理。在教学中,还可以凭借多媒体课件的声像手段创造教学意境,带领学生走进教材,开发思维。多媒体教学有赖于手脑并用,让学生操作使用电脑,可以训练学生的动手能力,让学生自主地进行学习。我们应根据课程特点、教材内容、教学对象有选择性地加以使
在使用句子抽取的方法对多文档的XML文本进行文摘的过程中,必须通过对句子进行重排才能得到一个逻辑合理、内容连贯、可读性好的文摘.提出一种基于随机冲浪模型的方法对XML文摘
[摘要]教师应教授学生解题后进行反思。命题的意图是什么?考核的概念、知识和能力是什么?验证结论是否正确,命题的条件的应用是否完备?求解论证过程是否判断有据,严密完善?一题多解?多题一解?不断地对问题进行观察分析、归纳类比、抽象概括,对所蕴含的数学方法、数学思想进行不断地思考并做出新的判断,体会解题带来的乐趣,享受探究带来的成就感。教师应逐步培养学生独立思考、积极探究的习惯,让学生懂得如何学数学。
[摘要]本文指出了学生升入高中后,能否完成数学思维的转换是导致学习成绩是否理想的关键因素。笔者提出,加强数学概念的学习是进行这一转换的有效方法,并做了简要的论述。 [关键词]加强 数学概念 学习 思维转换 很多学生初中数学成绩一直不错,但升高中后却不能顺利地完成数学思维的转换,导致成绩不理想。一个重要因素是没有正确的认识数学概念对于数学学习的重要性。数学概念是现实世界空间形式和数量关系在
数据流挖掘已在许多领域得到应用,概念漂移检测是数据流挖掘研究中的一个重点.目前关于数据流中的概念检测的研究虽然取得了很多成果,却没有充分考虑到数据流概念“周期性”出
[摘要]英语课堂是语言实践的课堂,也是引领学生自主学习、创新提高的阵地。教师在教学中创设各种语言环境,充分利用课堂这一载体,使学生身临其境,轻松愉快地学会英语。同时把大纲要求掌握的知识学好、学活、学扎实,并建立新的教学策略,努力为学生创设课堂活动情境,诱发学生的好奇心,激发学生学英语的兴趣,鼓励学生大胆尝试,丰富学生的想象,以提高学生的创新能力. [关键词]创设情境 激发兴趣 创新提高 陶
对基于表面属性的三维模型检索进行研究,提出了基于面积颜色分布、基于球面颜色分布、基于颜色球面调和的三维模型检索方法以及基于表面属性的融合方法.通过对模型表面进行按面