面向社交媒体的跨网络平台用户建模

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:xiao137wu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
社交媒体时代,网络数据呈爆炸式增长,一方面用户陷入了信息灾难,难以快速发现和获取感兴趣的信息;另一方面,用户逐渐转变成了信息的创造者和传播者,参与到多个社会媒体网络平台,并产生大量以其兴趣为导向的行为数据。这些数据广泛分布在用户所参与的各个社会媒体网络平台,从单一网络平台来看用户数据可能非常稀疏,导致基于单一网络平台用户建模的个性化服务面临着数据稀疏性和用户兴趣变化难以捕捉的挑战。本文利用跨网络平台用户建模应对上述挑战。跨网络平台用户建模旨在利用用户在多个社会媒体网络平台的动态行为数据及静态文档数据之间的互补与协同建立一个完善而准确的用户兴趣模型,并应用于个性化检索与推荐服务。面向社交媒体的跨网络平台用户建模主要包含两个关键问题:  社交媒体网络平台之间的用户关联是隐式的。用户在不同网络平台的账号大多是不一样的,并且一般情况下,他们之间不存在显示关联,也就是无法直接获知不同网络平台间哪些网络账号对应同一个真实用户。正确有效地关联不同网络平台的共同用户是多网络平台用户协同的基本前提。  社交媒体不同网络平台的用户信息是异构、冗余的。不同网络平台上用户的行为对象不尽相同,如文本、图像、视频、音频等。即使对于同一行为对象,用户行为模式也多种多样,如上传、收藏、分享、评论等。此外,在不同平台的这些用户信息之间可能是冗余甚至是彼此对立的。如何融合不同网络平台的用户信息是跨网络平台用户建模的重要内容。  本文针对上述两个关键问题,从用户关联和用户建模两个层次进行了研究与探讨,开展了以下几方面的工作:  1.提出了一种基于时间感知的用户行为匹配的跨网络平台用户关联方法。用户行为分布在不同的网络平台,这些行为往往存在时序关联,并且由网络平台所特有的属性决定,比如用户在文本流媒体网络平台的行为要领先于多媒体应用网络平台,用户在多媒体分享平台上传视频后会分享到社交网络平台。根据这一特点,本文对不同网络平台上用户的时序行为进行匹配,同时还结合用户名之间的相似性,有效地提高了跨网络用户关联的准确度。  2.提出了一种基于用户行为量化的互补式跨网络平台用户建模框架。用户在不同平台对于相同媒体对象具有不同的行为模式,并且之间往往存在一定关联。本文基于这种关联,利用多核学习(Multiple KernelLearning,MKL)模型来学习行为之间的相对权重,从而达到行为量化的目的,为跨平台行为信息互补融合打下基础。另外,社交网络平台侧重用户-用户交互,而多媒体分享平台侧重于用户-媒体交互,本文采用基于社交关系正则化的模糊聚类模型融合这两类信息以建立完善的用户模式。并且不同于传统的全局社交关系正则化,本文提出一种模型迭代策略,能够以局部正则化的方式动态融入主题层面的用户相似性。  3.提出了一种基于网络平台属性的协同式跨网络平台用户建模框架。不同网络平台具有不同的属性,导致出现一些特定的跨网络平台行为模式。如本文发现,无论是全局层面还是用户层面,Twitter网络平台上信息的出现和传播都要快于YouTube网络平台。利用这一特点本文提出了一个跨网络平台协同的框架—检测用户在文本流平台(如Twitter)上所关注的热点事件,然后推荐视频分享平台(如YouTube)上的相关视频给该用户。
其他文献
该文主要介绍了统计信号处理在通信系统中的两上重要应用--信道均衡和多用户检测,其中后者是前者在多用户通信条件下的推广.该文工作的第一个重点是对建模成FIR(有限冲激响应
该文论述了交流伺服系统的发展历史和技术现状,分析了交流永磁同步电动机的数学模型,研究了解耦控制的不同方式及其解耦控制效果,指出电流比例型解耦控制的有效性.针对伺服系
该论文在综述了神经网络及其辨识与控制方法的基础上,针对具有不确定性和时变性的非线性系统,结合自适应控制方案,提出了两种神经网络自适应控制方法,通过计算机仿真,证明了
该文对具有大滞后的工业复杂对象的控制问题,进行了评述,对各种控制方法进行了论述和比较,同时将预测控制、模糊控制的现状与发展趋势作了一些综述.现有的模糊控制方法一般适
预见控制是未来目标值及示来干扰在一定程度上为已知的情况下,充分利用这种未来情报来改善控制系统的性能的方法.预见控制主要应用于对一定程度的未来目标值及干扰已知的控制
应用管理信息系统(MIS)作为企业生产和经营管理的工具已成为企业发展的必然趋势,许多钢铁联合企业都十分迫切地要求开发应用计算机管理信息系统.由于大型钢铁企业业务和管理
统计参数语音合成,特别是其中的基于隐马尔科夫模型(Hidden MarkovModel,HMM)的语音合成,近年来经过了一个快速而蓬勃的发展期,展示出一系列优点,包括输出语音平稳、流畅,可以快速
随着Web2.0技术的迅速发展和GPS手持移动智能设备的广泛应用,人们在使用各种社会媒体的同时以各种各样的形式分享自己的地理位置,产生了大量地理数据。例如用户在Flickr上分享
该文以马钢中板厂管理信息系统的研制课题为背景,结合结构化分析与设计理论,详尽地阐述了马钢中板厂管理信息系统的开发过程.在系统分析部分,该文从生产工艺流程角度详细地分
可视语音合成技术是人机交互领域和语音技术研究中一个重要的方向。人的语音由发音器官产生,因此人在进行语音表达时,必然会伴随着面部和发音器官运动的信息,这些视觉信息在人的