【摘 要】
:
微博是近年来发展最快的网络媒体之一,随着其用户规模的不断扩大,其产生的信息量和社会影响力也越来越大。同时,网络信息的泛滥阻碍了用户体验的提升。因此,研究微博信息的规律并
论文部分内容阅读
微博是近年来发展最快的网络媒体之一,随着其用户规模的不断扩大,其产生的信息量和社会影响力也越来越大。同时,网络信息的泛滥阻碍了用户体验的提升。因此,研究微博信息的规律并从海量的网络信息中挖掘发现有用的知识就变得很有意义。 本文以数据挖掘算法为工具,研究网络信息知识发现,在此基础上提出微博热点发现算法和网络信息推荐算法。同时,将微博 SIR模型与多 Agent相结合,试图从宏观和微观的角度解释微博信息的传播规律。 首先,本文设计了一种微博热点话题发现并行模糊 C均值(HTD-PFCM)算法。该算法在充分研究微博特点的基础上,对向量空间模型( VSM)进行了改进,权值的计算更能将热点微博和非热点微博区分开来,并在 MapReduce平台上设计了热点话题发现并行算法。实验表明,HTD-PFCM算法不仅具有良好的加速比,还能更高效的挖掘微博热点话题。 其次,本文提出了一种基于Slope One算法的网络信息推荐并行算法,并借助MapReduce平台设计实现了该算法。该算法通过计算用户项目的偏差矩阵和频度矩阵,为预测用户感兴趣的项目提供了参考,实现了在大数据背景下的,网络信息的个性化推荐。实验表明,该算法在具有较高预测准确率的前提下,还具有较好的加速比,实现了信息的个性化服务。 最后,提出了一种将多 Agent理论与微博 SIR模型相结合的研究微博信息传播规律的方法,该方法根据微博信息传播信息的特点,将微博SIR模型与多Agent系统结合,用多 Agent的智能性来得到系统的演化方程。实验表明,该模型能较好的反映微博信息的传播规律。
其他文献
随着多媒体技术的发展,视频逐渐深入到我们日常生活、工作以及学习中,起到了十分重要的作用,给我们带来了许多便利。与此同时,有关视频的盗版和内容篡改的案例也在增加,因此
无线传感器网络(Wireless Sensor Networks,WSNs)被认为是21世纪最有影响力和最有发展前景的21项技术以及未来改变世界的10大技术之一,它以其体积小、自组织、简单方便的特点被广
数字图像具有数据冗余大、表达信息丰富的特点,传统加密算法并没有针对这些特点进行设计,无法安全高效的完成图像加密任务,因此设计结合图像特点的加密算法是有必要的。另一
粗糙集(Rough Sets)理论是波兰学者Pawlak教授提出的一种处理不精确,不确定数据的有效工具。经过30多年的发展,粗糙集理论已广泛的应用于知识表示、数据挖掘、机器学习、模式识别
随着嵌入式操作系统的广泛应用和不断发展,特别是嵌入式设备与网络结合的应用范围日益广泛,嵌入式系统网络应用程序的安全性问题愈发凸显,已成为目前急需解决的问题。VxWorks操
互联网和Web承载着丰富的跨时空信息,为社会和商务的发展提供了动态、开放和便捷的环境。然而在虚拟化的网络中,与不相识的人进行交易,如何保证交易可靠、安全,以及确保服务质量
数据库作为数据存储和管理的重要手段,在各行各业得到了越来越广泛的应用,数据库取证自然也成为了数字取证领域的研究热点之一,其中恢复已删除的数据更是数据库取证的重要组
当前移动网络的快速发展,尤其是当前的3G和4G网络的快速兴起,移动设备日益成为人们生活工作中必不可少的工具。移动终端的普遍使用带来了一系列的问题,特别是信息安全问题是
椭圆曲线密码体制(Elliptic Curve Cryptology,ECC)由于其安全性能好、存储空间小、带宽要求低等特点,在嵌入式等面积、功耗受限的环境中应用得越来越广泛,近年来已被广泛制定于各
随着智能设备的发展,在医疗、教育和公共服务等社会领域产生并累积了巨量的时变数据。由于时变数据数据量大,需要对它进行压缩存储。同时时变数据变化复杂,发现数据中的特征