论文部分内容阅读
随着移动通信以及空间定位等技术的融合和发展,移动通信领域中产生并积累了海量的、动态变化的时空数据。这些信息中蕴藏着丰富的用户行为规律。利用数据分析及数据挖掘等技术,研究群体用户的移动行为特征及规律,可以带来很多的商业价值及社会意义。然而,与传统轨迹挖掘问题不同,移动通信领域中数据海量、离散等特点为移动通信领域中的轨迹挖掘带来了许多难点与挑战。如何从离散的、稀疏的信令数据中根据不同应用需求构建用户的移动轨迹,如何从时间和空间两个维度对群体用户的移动轨迹进行聚类,挖掘其中的局部相似性,如何解决海量数据带来的瓶颈问题,这些都是移动通信领域轨迹挖掘需要解决的难点。
因此,本文基于北京大学数据库与信息系统研究室与中国移动总公司的合作研究项目“群体客户行为规律挖掘的关键技术研究”,针对移动通信领域的用户位置数据及应用需求进行研究分析,设计并提出了基于协同聚类的群体移动轨迹挖掘算法,本文的主要研究工作包括:
(◤)提出从离散的用户位置数据根据不同应用需求构建出移动轨迹的移动轨迹构建算法TCA(Trajectory Construction Algorithm)。
(◤)设计并实现了基于协同聚类的轨迹聚类算法CCTMA(Co-Clusteringbased Trajeaory Mining Algorithm),该算法从时间和空间两个维度对用户轨迹进行聚类,挖掘出其中局部相似的轨迹片段。
(◤)设计了轨迹聚类算法CCTMA在Map-Reduce云平台下的实现,引入并行计算技术解决了海量移动数据带来的瓶颈问题。
(◤)开发了群体移动模式挖掘原型系统,结合中国移动提供的真实的、经过扰码的信令数据,分析了算法的效率和可扩展性,并以上海世博园内轨迹挖掘案例为例,验证了算法的可应用性。