基于GPU的协同过滤推荐算法的设计与实现

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:zhaoyun1111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络信息的爆炸式发展而导致信息过载和搜索引擎系统本身的被动性搜索过程,推荐引擎系统受到了越来越多的关注和研究。推荐系统当前主要的研究方向是冷启动问题,矩阵稀疏问题以及推荐多样性问题等等,总体上是针对推荐结果的优劣进行研究和改进。但是由于推荐系统本身的巨大规模和矩阵稀疏性问题共同影响导致预测推荐结果需要耗费大量时间所带来的推荐系统滞后性问题和推荐结果精度低所带来的非智能性问题上的研究则相对较少。商业上的解决方案是将推荐系统分为线下的计算模块和线上实时推荐模块。线下模块通过提前计算预测推荐结果并存放在数据库供用户使用系统时再进行实时推荐,这样的解决方案能够使用户得到相对实时的推荐服务,但是这样的处理方式仍然不能解决由系统庞大规模带来的海量计算的巨大时间消耗,推荐结果仍然存在滞后性,用户得到的推荐都是系统过去的推荐结果,并不能尽可能地根据用户的行为实时反馈。GPU原本是一种应用于图形图像处理的多核处理器,它专门为可并行化计算密集型的任务而设计的处理器,拥有非常高的计算能力和非常大的数据吞吐量,同样的任务GPU往往以绝对的效率优势超越CPU的运行表现。推荐系统主要的耗时部分是线下计算模块,而线下模块主要的耗时任务是相似度模块的计算任务。相似度模块是可以实现并行化处理的过程,因此该部分进行并行设计并移植到GPU上实现。为了达到更好的时间和空间优化,本文使用CSR数据格式方式组织,GPU上的线程使用基于行并行的稀疏矩阵乘法处理算法。另外一个方面,由于矩阵稀疏性问题,本文提出了基于信息关联传递的用户相似度算法,用户之间的相似度为他们之间的直接相似度再加上他们共同好友之间的传递相似度的规则来衡量。实验表明该实现方案能够带来10倍加速并且新算法能够提高20%的精度。实验结果也显示数据越大,加速比就越显著。
其他文献
动态软件体系结构可以随着应用的不断变化而自动适应,使得基于动态软件体系结构的应用具有高度的可扩展性。OSGi是近年来颇受关注的一个动态体系结构的框架实现,是基于Java虚拟
随着信息技术发展和企业信息化进程的不断推进,企业里分散孤立的应用系统越来越多。这些系统可能涉及不同的技术,使用不同的开发语言以及运行在不同的平台。这种异构情况给企业
Diffie-Hellman(DH)密钥协商协议是一种安全协议,它可以让双方在完全没有对方任何预先信息的条件下通过不安全信道创建公共密钥,该密钥可在后续通讯中作为对称密钥加密通讯内容
WSN (Web Service Notification)是由OASIS组织制定的一套用于发布/订阅系统的标准,定义了通过使用基于主题的发布/订阅模式进行通知的Web服务规范。订阅者向消息生产者发送订
随着Web服务与面向服务的体系架构(Service-Oriented Architecture,SOA)的发展,越来越多的服务提供商致力于开发、提供Web服务,并在服务注册时提供服务定义关键字对服务进行
企业规模的不断变大,市场竞争的不断增强,信息技术的不断发展推动多媒体客户联络中心飞速发展。客户联络中心已经成为企业提高竞争力,为客户提供高效率,高品质服务必不可少武
近年来,随着互联网、云计算等技术的发展,人类社会所产生的数据正以前所未有的速度在不断的增长和累积,我们已经步入大数据时代。研究大数据的意义在于从数据中发掘重要信息,为人
在机器人技术发展的过程中,机器人示教编程技术是衡量一个工业机器人应用的灵活性和智能化程度的重要指标。会话式编程作为一种编程方式,就是在图形界面上通过提示信息的方式来
智能硬件和交互技术的快速发展为图像和视频的观看带来极大的便利。例如人们可以在各种各样不同尺寸屏幕的显示终端上观看图像/视频,也可以通过交互技术任意设定图像/视频的目
无线传感器技术在国防军事、环境监测、电力系统等领域体现出许多的优越性,有着广泛的应用和发展前景。由于无线传感器网络的自组织性、网络拓扑结构和网络环境动态变化、节