信息检索系统定制日志建模及在推荐系统应用研究

来源 :中国科学院研究生院 中国科学院大学 | 被引量 : 0次 | 上传用户:shingang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文的研究重点是信息检索系统的定制日志数据建模理论和方法。在信息检索系统中记录的日志数据具有及时性和简易性等特点。通过定制日志的方法,捕获信息检索系统用户访问行为,目的是通过一种提高数据质量的方法,运用数据挖掘技术,提升信息检索系统功能和服务能力,包括提高信息检索系统架构管理能力,提升系统用户使用体验,增加服务的多样性,提高预测和决策功能精度,减少数据治理开销。主要包括以下几个方面:   综述部分对当前日志挖掘应用研究,分析日志数据质量的重要性。信息检索系统服务,网页内容丰富性和日志格式的局限性为定制日志建模提供了实现的可能性。推荐系统是一种应用日志挖掘技术为用户提供个性化的典型应用,论文对推荐系统理论和技术进行研究,尝试通过定制日志的方法提供推荐系统的精度,进而提高个性化服务质量。   理论支持研究部分提出了定制日志建模的理论依据和方法。建模依据为定制日志提供指导方法。其中,语言学依据为日志格式的设计提供了具体的解决方法,类似于语言学的语法结构更容易让日志使用者理解和使用;软件工程学从计算机应用软件方面为定制日志建模提供了技术可行性的证明。建模理论和方法为定制日志提供具体的实施步骤。其中,建模理论部分限定了具体信息检索系统可以采集的日志数据对象、日志格式采用的模型类型、建模采用的方法和日志数据用途;建模步骤分为2部分:信息检索系统及用户行为分析是前提,建模过程分为3个步骤,即概念建模、逻辑建模和物理建模。   信息检索系统及用户行为研究部分,重点研究了信息检索系统模型服务类型的划分及其适用范围,用户访问行为和信息检索系统可访问对象及特征,并总结了信息检索系统业务规则和流程。为了能够在实际系统中应用,该部分还研究了推荐系统技术和算法,以分析定制日志建模的适用性。   建模实施部分将这3个步骤进行展开,分别论述了信息检索系统定制日志的概念模型、逻辑模型和物理模型的模型、形式化表示和验证方法。   通过信息检索系统的实例,具体分析了定制日志数据建模方法的实现和性能评价。并通过聚类实验证明定制日志模型在推荐系统应用发现用户共同兴趣的可用性。   本文研究的贡献有3点:(1)本文系统的研究了信息检索系统定制日志数据建模的理论和方法;(2)本文提出的定制日志数据建模理论的方法,为解决日志数据的治理、使用和扩展提供了具体的指导;(3)本文定制日志数据建模在个性化应用中的研究部分,为从根源上提高个性化推荐系统精度方面提供了有益的方法。因此,本文的研究形成了一套完整的理论体系和方法论。
其他文献
期刊
随着信息技术的快速发展和网络化的普及,数字信息资源的使用越来越普及,数字资源总量呈指数级增长,发展数字资源长期保存系统的目的是在较长时间内保存重要的数字资源并为未来所
网络信息浏览行为是人们以半结构化的方式进行信息获取、筛选、吸收的重要途径,也是满足人们学术商务、生活娱乐等需求的重要方式。从认知心理学角度对信息浏览行为进行深入研
摘 要:就现阶段社会的发展与国民日渐提升的用电需求来看,火力发电厂要想从根本上提升自身的经济效益,朝向可持续发展的目标前进,就要将现阶段的工作的着力点放在提升自身包括锅炉等核心设备的检修上,并在实际的工作中善于积累经验与教训,引进先进的科技技术与理论知识,让锅炉的检修工作更加具有高效性与实效性。  关键词:电厂锅炉;检修;注意问题;维护措施  中图分类号:TM621.2 文献标识码:A 文章编号:
期刊
图书馆管理是图书馆生存的依托,是图书馆不断发展的保障,是图书馆学研究领域中一个永恒的话题。近年来,随着知识经济的发展和改革开放的推进,图书馆的工作环境日益得到改善,硬件设
期刊
命名实体识别是中文信息处理中的关键技术,而中文姓名识别则是命名实体识别的重要组成部分,因此对于中文姓名识别的研究具有重要意义。然而目前这方面的研究主要集中在现代汉语
21世纪是信息时代,信息化对大多数企业来说,都不陌生。随着信息化的普及,企业信息化的建设以及管理逐渐走向精细化,如何实现信息化的效益最大化,成为摆在企业面前的一道难题。在不
夯实竹学基础研究 掌握精准发育规律rn“十三五”国家重点研发计划“竹资源高效培育关键技术研究”项目团队国际竹藤中心高健研究员、南京林业大学魏强副教授、福建农林大学
期刊