论文部分内容阅读
目前互联网技术的发展提高了互联网的业务实现能力,而Deep Web的出现使得互联网更易用且更有价值,用户填写表单、提交请求即可从Deep Web后台数据库中获取结构化的有效信息。但用户的查询需求一般具有多样化和复杂化的特点,目前的Deep Web应用仅提供了单个领域的查询搜索业务,对于用户的多领域查询需求,就必须频繁访问不同领域的Deep Web网站,填写表单并糅合搜索结果。要简化用户繁琐的查询过程就需要有效组合不同领域的Deep Web应用。Mashup技术能够对互联网上的各种Web应用进行融合而形成一种新的服务,因此可以对多领域查询系统的开发提供有力支持。为了简化用户的操作,实现不同Deep Web之间的信息共享和糅合,本文采用了基于Web应用的Mashup集成技术,建立了以用户为中心的组件规范描述模型和组件集成任务模型,实现了一个多领域查询原型系统。本文的主要工作包括:第一,采用基于用户查询接口(User Search Interface, USI)的Deep Web包装技术,完成了Deep Web表单的抽取、包装和注册任务;第二,通过基于USI的Deep Web服务集成技术、数据抽取技术和数据集成技术解决了Deep Web组件的集成建模问题;第三,设计实现了相关算法,完成了Deep Web组件集成工作流程的编译和自动执行工作。本文实现的多领域查询原型系统可以给用户提供一个可视化图形编辑界面,让用户通过鼠标操作和拖拽方式很容易构建自己的Mashup环境,用户只需要一次填写所有查询条件即可完成多领域查询任务。