论文部分内容阅读
自2007年苹果公司发布了iPhone,短短的几年间,智能手机应用(MobileApplication,App)数量的爆发式增长,虽然极大方便了用户的生活、工作,同时也带来了如何从海量应用中寻找、选择合适应用的难题,使得App推荐系统成为当前的研究热点。 以往的工作大多将传统的推荐系统算法应用在App推荐领域,目前主要还面临如下问题:根据应用市场数据集特点,如何有效利用App描述文本数据促进推荐效果;应用市场中新App层出不穷,如何有效的解决推荐系统中的App冷启动推荐问题。 针对以上问题,本文开展了基于文本挖掘的App推荐系统研究。首先通过引入App文本数据,提出了三种相似用户发现算法:利用App文本信息结合时间衰减模型构建用户文档,提出了基于时间敏感的TF-IDF TextRank算法进行用户关键字提取,利用用户关键字进行相似用户发现;基于话题模型抽取App话题特征,根据用户下载记录构建时间加权的用户话题特征,用以相似用户发现;根据用户与App间的下载关系二部图模型,考虑时间因素的影响,构建了用户与App间的时间加权的下载矩阵进行用户相似度计算。为了解决App冷启动问题,受协同话题回归启发,本文将App话题特征与App矩阵分解特征融合,提出了在线计算的协同话题矩阵分解算法,不仅能够解决App冷启动问题,还能够扩展到大数据集情况下。为了保持原有用户、App相似性,本文提出了基于话题模型及近邻约束的矩阵分解算法,设计了近邻用户与近邻App两种约束情况下的矩阵分解算法,在解决App冷启动的前提下保持原有的相似性关系。最后,针对本文提出的算法,在360手机助手应用市场真实数据集上进行了评测,验证了本文算法在App推荐方面的有效性。