基于日志挖掘的学术搜索困难度量方法研究

来源 :图书情报工作 | 被引量 : 0次 | 上传用户:a12c3d4e5f6
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
[目的/意义]用户检索中经常面临不同程度的信息搜寻困难,为更好地理解用户需求、改进检索系统,需要一种简洁有效的方法度量信息搜寻的困难程度.[方法/过程]将用户为查询而付出的行为及时间代价作为其信息搜寻困难的体现.按照用户在会话中的行为模式划分会话类型,将查询需求被满足且代价最小的会话类型作为比较基准,用基准会话的代价衡量其他会话类型的困难程度.为优化代价的表达模型,对搜寻代价的行为指标进行相关性检验,用因子分析选择独立性、区分度好的行为特征进行建模.以国家科技图书文献中心(NSTL)日志和搜狗日志为数据集比较学术搜索与通用搜索环境,以及不同会话类型所代表的探索过程中,用户的信息搜寻困难度.[结果/结论]在本文所度量的两种搜索系统中,用户面临的信息搜寻困难度分别为2.30和1.57,学术搜索中的困难高于通用搜索.在两种体现学术探索过程的会话中,困难度分别为2.35和4.13.本文提出的方法可以用简单的数值来概括具有多种影响因素的搜索困难,并能用于不同类型会话和搜索环境,丰富了检索系统的评估手段.
其他文献
高水平论文是在学术交流活动中产生高学术影响力的研究成果,通过对高水平论文特征及影响力分析揭示研究热点与趋势,能更好地服务于科研实践.选取ESI的生命科学领域高水平论文
新中国成立后,中国共产党的地位、中心工作以及所处的国内外环境都发生了根本性变化.在新的历史条件下,为了解决好党内存在的突出问题,更好地服从和服务于党的中心工作,我们
[目的/意义]提供反馈是一项增强用户动机和参与的重要设计.研究反馈信息对公众科学志愿者参与表现的激励效应,为改进公众科学项目的反馈信息设计及提高志愿者参与表现提供指
以中国知网(CNKI)、万方数据知识平台、维普期刊数据库为数据来源,以论文核心作者、核心期刊、高频关键词为分析对象.利用Excel、Ucinet软件,以2015年为分界点,运用社会网络
[目的/意义]快速、准确地从突发网络舆情文本中识别事件.[方法/过程]提出一种融合句法特征和句法相似度的网络舆情突发事件识别方法.结合句法特征提出面向事件的句法特征提取
[目的/意义]立足于电子文件管理与电子证据应用的跨学科视角,提出维护可信电子文件证据效力的技术方案.[方法/过程]系统分析司法认可的各项真实性保障技术的原理、优势与尚待
[目的/意义]为改进当前图书评价体系在反映图书内容质量方面的不足,将图书评论指标纳入评价体系,并应用不同学科图书分析评价体系的适应性,探索中文图书质量评价.[方法/过程]
查收查引是图书馆参考咨询领域的一项重要工作.近年来,查收查引业务需求不断增长,越来越多的图书馆开始关注查收查引系统.梳理了当前系统的研究和应用现状,并就系统的题录信
[目的/意义]识别社交媒体虚假健康信息特征,构建社交媒体虚假健康信息特征清单,以期为社交媒体虚假健康信息特征的测度提供一定理论支撑,也为用户和社交媒体平台判别虚假健康
[目的/意义]与确定泄露的情境相比,个人数据以一定概率泄露的情境更为普遍.由此计量泄露概率情境下的用户个人隐私价值,提出隐私计量的新视角,计量结果对隐私分级保护也具有