论文部分内容阅读
回顾社交网络的发展,从BBS、MSN到QQ、Whats App,再到Facebook、人人网和Twitter、微博等,社交网络的产品和形式日益丰富,覆盖面及人群越来越广,社交网络生态系统日趋完整,格局不断完善,为网民提供了全方位无死角、全天候无间断的网络社交生活。社交网络已从最初的“增量性的娱乐”逐渐变成“常量性的生活”,这样的变化导致了社交网络内容的爆炸式增长,过载问题由此而生,用户对信息的筛选标准也越来越高。怎样才能让有意义的信息在社交网络中更快的传递给他人并获得他们的认可?现今,Twitter已经成为了最重要的信息分享平台之一,@则是Twitter中比较特殊的特征。Twitter用户在发布推文时,可以在推文中@其他用户,但推文发出时,被@用户就会收到通知,并且可以转推推文和再@其他用户,这样就可以使该条推文扩散开来。显然,找到合适的用户进行@,能够增大推文的扩散和用户的影响力。怎样找到合适的用户,是本文研究的主要内容。本文在研究了信息推荐的国内外研究现状和相关理论之后,提出了面向Twitter的融合多种影响因素的@用户推荐模型,主要内容包含以下几点:(1)影响因素分析与验证在对类似Twitter的微博客系统及其用户推荐进行了解和分析之后,选出了四种最有可能影响被@用户转推行为的因素:兴趣相似度、用户转推意愿、用户在线情况和用户地理位置相似度,并通过实验验证了各种因素对@用户推荐的意义与实际影响情况。(2)基于排序学习的多因素融合推荐模型在验证了四种因素对@用户的影响之后,由于因素“用户在线情况”的不可定量测量的特殊性,先只考虑其他三种因素,根据实验数据构建因素的特征值,然后通过排序函数学习得到每个特征的权值,形成初始的融合了兴趣相似度、用户转推意愿和地理位置相似度三个因素的用户推荐模型,并通过实验验证模型的有效性。将一条待发推文和一个待@用户输入模型中,便可以计算出其推荐得分。(3)基于指派问题模型的推荐优化模型由于用户在线状态不可测,因此要想将推文@给在线用户是比较难的。在本文中按小时将一天划分为24个时间窗口,通过用户在每个窗口的历史发推数量估计其在每个窗口的在线概率值,然后与其在多因素融合推荐模型中的得分进行加权求和作为效用值。形成所有@候选用户的效用矩阵后,基于指派模型求解问题,得出的结果就是@用户的方案。通过实验验证优化模型有效的提高了推荐推文的扩散效率。综上所述,本文以聚焦Twitter中的@用户推荐问题,研究了影响@用户选取的影响因素,提出了基于排序学习的多因素融合推荐模型,并通过优化,将用户在线因素加入模型中,形成基于指派模型的推荐优化模型。通过对比实验,验证了所提出模型的有效性。