论文部分内容阅读
链路预测是网络分析中一项重要的任务。不同于静态网络中的链路预测,在机会网络中,由于网络节点的移动性、分布的稀疏性以及连接的间歇性等特点,这就导致源节点与目的节点之间不存在一条完整的路径,使得路由转发成为一个极大的挑战问题。机会网络中的链路预测是指通过已知的网络信息对未来链路的形成进行预测,从而降低消息转发的盲目性,提高消息转发的成功率。现有的链路预测算法在静态网络中有着不错的效果,但机会网络属于典型的动态网络,因此现有的链路预测算法在机会网络中受到了限制。本文主要研究的两个主要问题是:1、构建符合机会网络的链路预测算法。2、挖掘机会网络链路随时间变化的规律。本文研究的主要内容是:1、链路预测相似性指标的研究。为了充分利用网络拓扑信息以及链路历史信息,本文将机会网络划分成若干个时间窗口,建立网络时间序列,然后计算时间窗口内每一条链路的相似性指标值。本文针对机会网络稀疏性和间歇连通性的特点,综合考虑历史链接的空间与时间相似性,提出了分离时长概念,构建能反映网络链路时序性的相似性指标。2、时间序列模型的建立。针对机会网络的动态特性,构建长短期记忆网络(Long Short-Term Memory,LSTM)模型,将链路预测问题转变为二分类的问题,该模型以第一步提出的相似性指标作为基础样本,通过深度学习技术进行训练从而提取机会网络链路的动态特征,优化时间窗口与样本维度等参数,对模型进行调优,之后使用样本对模型进行训练,模型训练完成后,使用分类器对模型输出结果进行分类,从而对机会网络中的链路进行预测。本文在机会网络数据集Infocom05和MIT下进行实验,在相似性指标验证阶段采用AUC和precision作为评价标准,将本文提出的平均分离时长指标(ASLP)与传统相似性指标进行比较,验证其有效性;使用受试者工作特征曲线(Receiver Operating Characteristic Curve,ROC)的AUC、precision、accuracy评价标准,将本文提出的LSTM模型与朴素贝叶斯(Naive Bayesian)、逻辑回归(logistic Regression)、K近邻(KNN)、支持向量机(SVM)这些常用分类模型进行比较。试验结果表明LSTM预测模型具有更好的精确性与稳定性。