使用大规模轨迹数据进行个性化路径推荐

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户：applexiao

【摘要】

：

为支持从各种移动对象产生的大量GPS数据，后端服务器通常存储低采样率的轨迹。因此，人们不能直接从后端服务器获得精确的位置信息，换句话说，不确定性是这些时空数据的固有特性。

【作者】

：

戴健

【机构】

：

中国科学院大学

【出处】

：

中国科学院大学

【发表日期】

：

2015年期

【关键词】

：

个性化路径推荐轨迹数据上下文信息不确定性分析

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

为支持从各种移动对象产生的大量GPS数据，后端服务器通常存储低采样率的轨迹。因此，人们不能直接从后端服务器获得精确的位置信息，换句话说，不确定性是这些时空数据的固有特性。从而，如何应对移动对象轨迹数据的不确定性成为一个基本而具有挑战性的问题。然而，大量的现有研究仅仅关注移动对象本身的不确定性，而往往忽略了这些数据产生的上下文信息。我们发现，移动对象轨迹数据的不确定性可以有效地利用上下文信息进行消减和排序。在本文中，我们利用上下文信息，提出了一个综合框架，来对移动对象轨迹进行不确定性消减和排序。具体来说，对两个连续的采样数据，我们的目标是对可能的移动路径进行推断和排序。由于一些上下文信息可以减少不确定性，而一些上下文信息可用于不确定性的排序，所以我们的框架自然地分为互为补充的两个阶段:消减阶段和排序阶段。我们分别针对不同的上下文信息设计了算法，实现了对不确定性的消减和排序。我们还实现了一个原型系统来验证我们提出的框架的有效性。大量的实验对比结果表明我们的框架可以实现不确定性的消减，并能对可能的移动路径进行排序。　　基于不确定性消减后的轨迹数据，我们研究了如何精确对旅行代价分布进行估计。在一个给定的道路网络中，给定出发时间，利用车辆的历史轨迹数据，我们需要准确地估计任意路径的旅行代价分布。这个问题有三个挑战:第一（数据稀疏性），即使非常大的轨迹数据集也不一定能覆盖道路网络中的所有路径。同时，被覆盖的路径也有可能没有做够多的轨迹数据;第二（分布复杂性），路径的旅行代价分布是复杂的:它是随时间变化的，而且可以是任意的分布。第三（变量相关性），在路径所包含的多条边上的旅行代价分布可能相互相关。为了应对这三个挑战得到准确的旅行代价分布，我们首先在有足够多的轨迹的路径上学习一组不同维度的联合分布。然后，给定一个查询的时间和路径，我们从学习到的随机变量集中计算最优子集，这样，随机变量的组合可以覆盖对应的查询路径。通过这样的步骤，我们可以准确地对查询路径的联合概率分布进行估计。最后，联合分布被用来计算一个表示查询路径的旅行代价分布的边缘分布。我们在真实世界产生的大量GPS轨迹数据集上进行了深入的实验，实验结果证明了我们的方法的可以准确地估计出来较长（包含5个路段以上）路径的旅行代价分布，并且可以在7秒内完成对包含100个路段的路径旅行代价进行计算。　　驾驶员通常会考虑多种不同的旅行代价来规划路线，例如，旅行距离，旅行时间和燃料消耗等。不同的驾驶员可能在相同的源和目的地之间选择不同的路线，因为他们拥有不同的驾驶偏好（例如，具有强时间观念的驾驶员会倾向于选择较短旅行时间的路线，而节能型的驾驶员更喜好消耗更少燃料的路线）。现有的路径推荐服务并没有给不同的驾驶员建立不同的推荐模型，从而不能够给不同的驾驶员提供不同的路线。它们大多数会考虑尽量减少其中一个的旅行代价的路线（例如，最短路径或最快的路线）。我们研究的问题是如何基于海量轨迹数据推荐符合单个驾驶员驾驶偏好的个性化路线。首先，我们能从驾驶员的轨迹中建立和更新不同的驾驶偏好。然后，我们提供不同的过滤器来搜索符合当前驾驶偏好的历史轨迹，并基于它们构建相应的局部参考路网。最后，在参考路网上进行快速的路线推荐。我们在真实世界产生的大量GPS轨迹数据集上进行了深入实验，实验结果证明了我们的方法通常可以在1秒内推荐出欧氏距离达到20千米以上的路线，并且与现有的方法比较，这些路线具有更高的满意度。

其他文献

基于SAML的单点登录系统研究与实现

随着网络技术的不断发展和企业信息化建设的不断进步,企业开发的应用系统也在不断增多,这些系统有着独立的安全验证机制,用户的身份信息分别被每个系统保存的,无法互相传递,

学位

SAMLSAML单点登录单点登录身份认证身份认证安全性安全性互操作性互操作性

面向古今汉语平行语料库的可视化文本挖掘研究

任何民族的发展都不能没有继承。而我国大量的优秀传统文化均以古代汉语为载体。中华文化要传承、要变革，就需要有一批人读文言文，整理古籍，研究历史。然而，由于客观历史条件的限

学位

古汉语现代汉语平行语料库文本挖掘关联规则机器翻译

一种基于Nand Flash的文件系统的设计与实现

随着嵌入式系统在日常生活中日益广泛的应用,嵌入式系统中的数据存储和数据管理越来越得以重视。具有高存储密度和高存储速率特点的Nand Flash作为嵌入式产品中极具发展潜力

学位

嵌入式嵌入式文件系统文件系统NandFlash设备NandFlash设备系统设计系统设计性能评价性能评价

海量数据实时同步并行算法的研究与设计

因特网迅速发展，搜索已经成为网络的主要功能。一个搜索引擎拥有海量的数据，并且能在海量数据中迅速找到符合搜索条件的数据。然而如何在做到以上功能的前提下，实现海量数据与目

学位

数据同步并行算法搜索引擎

判别分析算法在人脸识别中的应用研究

人脸识别技术是一种方便实用的基于人类生物特征的身份识别技术，有着迫切的现实需求和广阔的应用前景。然而目前的人脸识别技术还有许多地方不完善，光照、姿态、遮挡、以及小样

学位

判别分析算法人脸识别分类器

移动IPv6快速切换研究

本文首先介绍了课题研究的技术背景,移动IPv6技术以及快速切换。快速切换(Fasthandover)是移动IPv6技术中的一个关键技术,是对移动IPv6协议的扩展,采用预先切换和基于隧道的

学位

移动IPv6移动IPv6快速切换技术快速切换技术转交地址转交地址EUI-64接口EUI-64接口NS2仿真NS2仿真多播机制多播机制

从UML生成服务描述的技术研究

随着Internet技术的不断发展和跨平台需求的日益增加,Web服务应用越来越广。它是一种自包含的、基于网络的、分布式的模块化组件。目前,对于Web服务描述与服务组合描述生成技

学位

计算机网络计算机网络网络服务网络服务软件开发软件开发程序语言程序语言

初等数学智能评测的关键技术研究与实现

在线教育、智能教育是教育的未来，它们正逐步改变着教育的现状。在在线教育系统中，学生的答题和教师的阅卷是不同步的，学生答题的结果的正确性不能得到及时有效地反馈，为了有效地

学位

初等数学试题自动评测系统功能模块智能教育

基于自主计算的自适应Agent

随着网络和通信技术的迅猛发展，以及计算机应用规模的持续扩大，软件系统的规模越来越大，复杂性越来越高。在这种背景下，发生了软件复杂性危机，即维护、故障排除等人的干预赶不上软

学位

自主计算自适应框架Agent软件复杂性危机

软件自动化功能测试分析及其应用

随着计算机技术的迅速发展,软件的应用范围越来越广泛,软件系统规模越来越大、结构越来越复杂。为了保证软件产品的质量,软件测试特别是自动化测试越来越受到人们的重视。软

学位

软件测试软件测试自动化测试自动化测试测试控制测试控制缺陷管理缺陷管理录制录制回放回放类测试类测试

使用大规模轨迹数据进行个性化路径推荐

其他学术论文