基于标记树对象抽取技术的HiddenWeb获取研究

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户：sqs292241644

【摘要】

：

目前标准的搜索引擎能够检索的仅仅是WorldWideWeb提供的小部分称为可索引的Web信息，大量的HiddenWeb信息（估计容量是可索引Web的500倍），对这些搜索引擎是不可见的。这些信息陷藏

【作者】

：

宋晖张岭等

【机构】

：

上海交通大学计算机系

【出处】

：

计算机工程与应用

【发表日期】

：

2002年23期

【关键词】

：

标记树对象抽取 HiddenWeb 互联网搜索引擎信息检索结构化查询数据库 Hidden Web Information Retrieval Obje

【基金项目】

：

国家自然科学基金重大国际合作项目资助(编号:60221120145)

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

目前标准的搜索引擎能够检索的仅仅是WorldWideWeb提供的小部分称为可索引的Web信息，大量的HiddenWeb信息（估计容量是可索引Web的500倍），对这些搜索引擎是不可见的。这些信息陷藏在Web页面的搜索表单后面，保存在大型的动态数据库中，该文提出了一套检索HiddenWe信息的方法，给出了该系统的框架结构，并详细讨论了实现的关键技术，系统采用新的基于标记树的对象抽取（Tag-Tree-based Object Extraction）方法自动地从Web页面中抽取HiddenWe信息，然后在此基

其他文献

不同倍性灯盏花形态学与细胞学研究

对四倍体和二倍体灯盏花的形态学和细胞学进行了观察、测量和比较，鉴定了四倍体与二倍体的染色体。结果表明，四倍体灯盏花植株具有巨大性．花梗粗壮，叶色浓绿、叶片巨大而肥厚．花朵

期刊

灯盏花倍性形态学细胞学Erigeron breviscapus ploidy morphology cytology

贵州省属农业科研机构创新人才队伍建设现状与发展对策

为推动贵州农业科技创新人才队伍建设,通过对贵州省属17个农业科研机构创新人才队伍的现状调查,分析了制约农业科技创新人才队伍建设的因素,提出了加快农业科技创新人才队伍

期刊

农业科研机构创新人才队伍建设贵州省属agricultural scientific research institution innovative t

22%草无影可湿性粉剂防除水稻田杂草试验初探

采用22%草无影可湿性粉剂进行水稻田杂草防除试验,结果表明：25～30g/667m^2剂量处理效果最佳,施药时期为水稻秧苗插秧后7d左右,在试验计量范围内对水稻生长安全.

期刊

草无影水稻防除效果Caowuying rice control effect

警惕：废弃电脑污染

期刊

电脑污染环境污染环境保护

基于概念统计的英文自动文摘研究

文章提出了一种基于概念统计和语义层次分析的自动文摘方法，并以此实现了一个英文自动文摘系统，系统利用WordNet对英文文章进行词语分析，用概念统计的方法选取文章的主题概念，以

期刊

概念统计英文自动文摘主题概念向量空间模型句子重要度计算机ConceptcountingTopic concept Vector space mo

网络安全术语解析（三）

Land攻击:land攻击是一种使用相同的源和目的主机从端口发送数据包到某台机器的攻击。结果通常使存在漏洞的机器崩溃。前缀扫描攻击:黑客和攻击者可以利用军用拨号器(war-dialer)扫描调制解调器线路,这些调制解调器线路绕过网络防火墙,可以作为闯入系统的后

期刊

计算机网络网络安全技术术语

基于HSRM的分布式发言权控制模型与应用研究

研究了组播会话对发言权控制和网络通信的要求。提出了一个满足这种要求的可靠组播通信模型HSRM，然后结合所研制的基于IP组播的协同学习环境WcbLearning＋的应用背景给出了基于H

期刊

HSRM分布式发言权控制模型组播可靠组播通信协议计算机网络Floor ControlMulticastReliable Multicast

现场总线技术在电厂数字化进程中的应用

现场总线技术的快速发展极大地推动了电厂的数字化建设进程,它将厂级监控管理系统、车间级控制系统与现场设备紧密地连接在了一起,实现了电厂各系统有效信息的全面监控及整合

期刊

现场总线数字化电厂

混合语言编程在铁路线路三维景观动态仿真系统中的应用

文章结合在铁路线路三维景观动态仿真系统中的具体应用，介绍了将积累的Fortran成熟代码集成到Visual C++环境下，实现混合语言编程的两种方法，并深入分析了这两种方法的原理、步

期刊

混合语言编程铁路线路三维景观动态仿真系统Mixed-language programmingDynamic simulation3D scene

不同药剂防除小麦地杂草田间试验初报

2007年进行了不同药剂防除小麦地杂草的田间筛选试验，结果表明，以75％苯磺隆WG2g／667m^2＋高效助剂10g／667m^2处理防除小麦地杂草效果最好，10％苯磺隆WP 12g／667m^2处理防效次之，750g（a．i．）／L2

期刊

小麦杂草除草剂田间试验wheat weed weedicide field test

基于标记树对象抽取技术的HiddenWeb获取研究

其他学术论文