论文部分内容阅读
随着Web2.0的飞速发展,以Flicker,Youtube,Facebook为代表的社交网站为互联网提供了丰富的多媒体资源。图片,视频,音频等多媒体资源的大量涌现,为信息检索技术提出了新的挑战。单一的基于文本的检索技术不能满足用户对多媒体资源的需求,以融合网络各种多媒体资源为目标的跨媒体检索成为新的研究热点。本文以跨媒体元搜索的融合问题以及多媒体资源在数字图书馆建设中的应用为研究目标,主要进行了以下工作:
第一,本文以跨媒体元搜索为研究对象,针对元搜索引擎结果层的融合问题,提出了一种基于用户反馈的无监督跨媒体融合模型。本模型建立在线性融合模型的基础上,通过设置局部融合窗口,计算交叠文档及用户反馈信息得到最终的跨媒体融合模型。该融合模型在WikipediaMM数据库上进行了实验,并与Borda等算法进行比较,实验结果表明该算法在MAP,P@N等评测指标上均优于其他融合算法。
第二,针对跨媒体元搜索结果层的融合问题,本文又提出了一种基于rankingSVM的跨媒体融合模型。该模型以排序学习理论为基础,首先通过对训练集进行标注,训练,rankingSVM优化等过程得到预测的成员搜索引擎的最优的融合参数,然后通过线性模型进行加权得到最终的跨媒体融合模型。该融合模型是一种基于机器学习的有监督融合算法,通过概率统计、学习等理论训练相关融合参数,从而减少了由于用户的主观性判断而造成的误差。
第三,本文尝试将跨媒体检索技术应用于数字图书馆中,设计并实现了一个基于社区的自动问答系统HandsUP。该系统包含查会员注册登录模块,问答管理模块,会员信息管理模块,查询处理模块,本文检索模块,数据库管理模块等功能模块。该系统通过用户之间的信息交互,不仅能够帮助用户及时解决问题,而且能够充分利用不同用户之间的知识,达到资源共享,使得数字图书馆为广大用户提供更好的服务。