移动通信交往社区发现方法的研究与实现

来源 :北京大学 | 被引量 : 0次 | 上传用户:taizijian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
移动通信数据是移动通信用户之间互相联系而产生的,包含着通信的时间、地点、时长等信息,因而能够更真实而准确的反应用户的实际社会关系。同时,随着移动通信技术的不断发展和移动通信业务的不断普及,电信运营商积累了海量的移动通信数据。在激烈的电信业市场竞争和用户需求不断提高的情况下,电信运营商亟需对移动通信数据中所蕴含的巨大的客户信息进一步地分析和挖掘。因此,移动通信中的社会网络分析,无论在工业界还是学术界,都得到了广泛关注。   社会网络分析的主要目的是实现交往社区发现,将社会网络中的用户群体划分为交往社区,以发现用户的交往模式和社会网络的整体特征。目前学术界已经针对互联网社交网络、邮件网络、论文引用网络等社会网络的交往社区发现提出了很多方法。相比于以上社会网络,移动通信社会网络具有数据量大、用户交往具有方向且密切度不同和用户可能属于多个社区等特点。现有的交往社区发现研究在处理海量数据和实现交往社区软分割方面的工作仍然不成熟,而且没有反映用户交往具有方向且密切度不同的特点,在社区内部结构上描述不够,在挖掘结果的准确性、算法的可扩展性方面还不能满足实际应用的需要。   本文基于北京大学数据库与信息系统研究室与中国移动总公司的合作研究项目“群体客户行为规律挖掘的关键技术研究”,在北京大学数据库研究室设计的数据挖掘系统MobileMiner的群体客户行为规律挖掘子系统的架构上,设计并实现了海量数据环境下的并行社会网络核心节点发现算法PSCDA和基于核心节点的交往社区发现算法PCCMA,并在实际应用场景中,证明了该算法具有良好的准确性、可扩展性和执行效率。
其他文献
随着硬件技术和移动网络技术的快速发展,以智能手机为代表的嵌入式系统的硬件性能越来越强,软件应用越来越丰富,使得嵌入式设备在性能和功能上越来越接近微型个人电脑。性能
随着互联网基础设施和各种互联网应用的快速发展,多媒体内容如音乐、影视、图片等已经占据了互联网绝大部分的流量。在文字搜索的领域,传统的搜索如Google,百度都已经有很成
随着计算机网络的飞速发展和信息化的推进,数据集成技术得到了越来越广泛而深入的应用,也引起了学术界和工业界的高度重视。XML由于其半结构化等特性使其能够集成来自不同数
随着数据库管理系统应用环境的不断变化,一方面,数据管理、数据访问等相关技术变得越来越复杂;而另一方面,维护成本变得越来越昂贵。于是,企业为了更好地专注于所擅长的业务领域,会
随着计算机和网络技术的发展,工具书由纸质载体逐渐向电子版本的方式发展,商务印书馆拥有一百多年的历史,是国内首屈一指的出版和文化机构,至今出版各类书刊近5万种,其中包括大量
自从XML,诞生以来,越来越多的数据以XML文档格式存储和发布,XML已经成为Internet和Intranet上数据集成和交换的标准,被广泛应用于电子商务、内容管理、多媒体、数字图书馆以
由于广东省珠三角地区工业现阶段的发达,其自然环境特别是农业环境也日益呈现出存在着重金属污染的严重问题。土壤重金属污染带来的问题,对人类健康、生态环境和社会的发展,都有
电子投票(Electronic Voting)泛指使用电信、网络、电子机械等手段投票或者通过电子方式计票的投票活动。使用电子投票可以显著地提高计票工作的效率;同时,投票方式的多样化也
历史网页集是一个规模庞大、随时间动态变化,同时承载了许多有价值的信息的数据集。本文研究了在这样一个数据集上进行二维区间数据查询的性能优化问题。二维区间数据查询由两
二进制代码逆向分析在系统安全领域有着广泛的应用。涉及面向对象语言的逆向分析面临的一个基本问题是如何从二进制代码中解析出由虚函数引起的间接调用。本文基于符号执行等