论文部分内容阅读
随着网络的普及和深入应用,当今万维网(Web)汇聚了极其丰富的信息资源,在这种信息爆炸的网络环境下,人们不再满足于门户网站、搜索引擎这种主动信息获取方式,更期望通过内容监测,将与自己兴趣相关、来源丰富、主题鲜明的Web资源,以可定制、即时的方式获知。手机报是传统报纸媒体在移动互联网中的延伸,为用户提供了一种信息定制渠道和方便的接收查阅方式。由于手机比电脑普及率高、便于携带、信息时实性强的优点,手机报的发展迅速。但是手机报容量普遍较小、内容同质化且缺少互动性,限制了其进一步发展。
本文依托“面向基层的科技信息服务公共运营平台”项目,针对当前手机报构造方式人力成本高、内容渠道固定、种类受限、个性化程度不高的不足,结合信息定制方式,提出从信息源构造手机报的方法,并对手机报的个性化推送相关问题进行研究。主要工作和贡献如下:
1.提出了基于信息源的手机报定制系统构建方法通过对相关系统和工作的研究,明确手机报定制系统的概念和功能,给出手机报定制系统的原理和框架。通过对于手机报数据特点及相关工作和技术的分析,给出了手机报信息获取模块对于信息的统一封装模型,并提出对于RSS信息源的快照差分算法以检测信息源的更新。明确手机报的规则,并给出形式化定义,并对规则执行的相关技术进行探讨,为规则执行的实现提供支撑。
2.通过对用户兴趣学习相关工作的研究,提出了手机报个性化推送的方法对于用户兴趣的建模和学习,文本采用了基于词频统计和向量空间的方式,针对传统特征项权重计算公式区分度不高的问题,根据手机报信息源的特点,通过关键词位置对算法进行改进。本文根据手机报平台的特点,提出多层次的用户兴趣模型,将用户兴趣逐层细化。上层粗粒度的用户兴趣可以共享和发现相似用户,进行订阅和信息推荐;底层细粒度的向量空间模型体现用户兴趣的个性化。通过将用户个性化的兴趣模型约束到频道内,减小了相似度计算和用户兴趣更新的工作量。并对基于用户兴趣的信息过滤算法进行改进,使其更好地计算信息与用户兴趣之间的相关度。
3.在前面工作的基础上,实现了科技信息手机报平台中的手机报定制系统,并通过应用效果实例及试验分析得到评价。