基于垂直搜索技术的网络信息查询系统的设计与实现

来源 :中国科学院声学研究所 | 被引量 : 0次 | 上传用户:yijiutaosheng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网络的迅猛发展,促使Web页面的信息资源数量正在以惊人的速度增长,用户越来越迫切地需要一种更加精、准、专的搜索引擎来满足资源搜索的需求。随着搜索引擎技术的不断发展,垂直搜索技术受到了广大用户的欢迎。这种针对于专业领域的搜索引擎,可以快速地让用户获取到合适的结果。专业化的垂直搜索引擎,作为互联网的第三代搜索引擎,将成为今后搜索引擎发展的主流。   本论文依托中科院声学所网络与新媒体技术研究中心的“E游天下”网络新媒体综合业务平台,针对垂直搜索技术、基于模板方式的网页信息抽取技术、以及基于FFT的网页正文提取算法等网络信息处理关键技术展开研究,提出了基于垂直搜索技术的网络信息查询系统设计方案,并融合Ajax、数据库、HTTP协议等相关技术,实现了酒店信息查询系统和机票比价查询系统。   本论文具体研究的内容和成果如下:   (1)提出了酒店信息查询系统的设计框架,对系统结构进行了模块的划分,确定了此系统的技术实现方案。   (2)实现了酒店信息查询系统,包括网页抓取模块、信息抽取模块、结构化处理模块及集成存储模块等。   (3)设计了机票比价查询系统的系统框架,实现了系统的主要功能模块。   (4)提出了一种优化机票比价查询系统网络层的方案,提高系统的搜索效率,并对优化前后的查询系统进行了测试对比。   (5)参与了网页库级信息抽取技术的研究项目。完成了相关的实验研究和结果分析工作。
其他文献
随着信息技术的发展,当今的实验室信息管理系统(简称LIMS)早已经不再局限于传统意义上的数据存储和信息管理等简单的功能,而经常需要引入一些数理统计方法对实验结果进行统计分
针对某系统运输过程中需要实行全程监测的应用需求,设计实现了基于GPS及GIS的远程监测终端和监测中心,利用GPRS无线通信网络成功组建了适用于中低速移动目标的远程监测系统,
语音识别是计算机技术的一个重要发展方向,它是指机器通过学习来实现从语音信号到文字符号的理解过程,也就是让计算机听懂人讲的话,并做出正确反应。语音识别作为一门交叉学科,与
近年来,随着国民经济的迅速发展,人们对水资源的需求越来越高,国家水利部肩负的使命也越来越重。传统的通过人工观察进行水资源监测的方法既费时费力,而且实时性和准确性都很难保
目的:构建人内皮抑素(human Endostatin)原核表达质粒pET28a/hES,并与简化人纤溶酶原饼环区(predigested human PlasminogenKringle5,predhPK-5)在大肠杆菌中实现共表达。 方
摘要:《数学课程标准》在课程实施建议中明确指出:“数学教学是数学活动的教学,是师生之间,学生之间交往互动与共同发展的过程。数学教学要求紧密联系学生的生活实际,从学生的生活经验和已有知识出发,创设各种情境,为学生提供从事数学活动的机会,激发对数学的兴趣,以及学好数学的愿望”。在数学教学中重视创设各种教学情境是提高教学质量的重要一环,同时也是实施新课程标准的重要措施之一。  关键词:小学数学;情境教学
当最小二乘形式矩阵Padé-型逼近(LSMPTA)中Hankel矩阵呈病态时,其逼近解往往很不稳定.通过引入适当的权因子矩阵,将LSMPTA转化为与之等价且稳定性较高的一种新的LSMPTA,即加
随着网络技术的飞速发展,网络应用趋于多样化。在众多网络应用中,即时通信服务是应用最广的技术之一。当前的即时通信技术中,标准通信协议XMPP(可扩展的消息传递和在场协议)因其
数字电视广播是电视广播发展史上的一次历史性飞跃。数字电视地面广播以其能够满足现代信息社会“信息到人”需求的特点,在数字电视体系中占据了非常重要的地位。经过多年研究
本文提出了一种多协议的动态自重构视频解码系统,并在平台式FPGA上进行实现与实验,并对实验结果进行了讨论和分析。 目前世界上主流的数字视频压缩标准有MPEG-1/2、MPEG-4、