融合多语义元路径的异质网络表示学习方法研究

来源 :山东师范大学 | 被引量 : 2次 | 上传用户:jiangyoung
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
异质网络指由不同类型的节点或连边构成的复杂网络。由于其复杂多样化的连边关系蕴含着丰富的语义信息,能够更加形象、灵活地建模现实世界的异构数据,因此,异质网络的研究成为学术界和工业界的研究热点。然而,也正是由于异质网络中节点间的复杂关系,如何更好地进行异质网络的表示学习成为当今复杂网络研究领域最具挑战性的基础研究课题之一。目前,研究异质网络表示学习的一个重要思路是基于分解的异质网络表示学习方法,即利用语义元路径将复杂的异质网络分解为多个同质网络,“分而治之”地进行表示学习,然后再将这些表示进行融合。这种异质网络表示学习方法主要面临两个挑战:第一,同质网络表示学习问题,即如何有效地学习基于元路径分解的同质网络的节点表示;第二,多源异质信息的融合问题,即如何将不同元路径信息和网络中其它异质信息(如属性、文本等)进行有效融合。针对第一个挑战,虽然目前取得了很大进展,但是,提出的方法多针对无符号网络,不能实现含有极性关系的符号网络表示学习任务;针对第二个挑战,目前也取得一些进展。但是,大部分方法仅仅是利用网络中有限的显式元路径进行信息融合,而缺乏考虑隐式元路径对信息融合的影响。如何有效地挖掘并利用由于影响力传播而产生的大量隐式元路径信息亟待研究;而且,现有的研究主要致力于对异质网络的结构信息建模,并没有充分挖掘网络中的其它模态信息。事实上,异质网络包含着大量多模态信息,如节点和关系的属性信息等,融合这些多模态信息能够学习到更加准确的节点表示。针对上述问题,本论文展开了符号网络表示学习和多源异质信息融合两方面的研究,创新地提出融合多语义元路径的加权符号异质网络表示学习模型和方法,以解决异质网络表示学习中的极性关系表示、影响力传播隐式元路径融合和多模态信息融合等问题。本文的主要创新成果如下:(1)提出了基于平均通勤时间的符号网络谱表示方法针对符号网络表示学习的关键问题——如何在低维嵌入向量空间中保持符号网络的负关系,提出了基于平均通勤时间的符号网络谱表示方法CD-SNE。首先,设计了一种适合于符号网络的随机游走模型,适当减小正边连接节点间的平均通勤时间的同时增加负边连接节点间的平均通勤时间,使学习到的节点表示保持了符号网络的一阶接近度;然后,发现并利用平均通勤时间与拉普拉斯矩阵之间的关系,构建了扩展的符号图拉普拉斯矩阵,学习符号网络的谱表示,并理论上证明了学习的谱表示是有效的符号网络的低维向量表达,能保持原始符号网络中平均通勤时间。实验结果表明,通过本论文方法学习到的符号网络低维向量表示保持了符号网络的节点一阶接近度,既保持了正边的接近度也保持了负边的远离度,能够准确地预测节点之间连边的符号;另外,通过设置合理的收缩因子,拉大了社团之间的距离,得到较好的社团划分结果。(2)提出了基于二阶近邻随机游走的符号网络表示学习方法针对上述工作提出的符号网络谱表示方法仅保持了网络节点的一阶接近度,以及计算时空代价较高的问题,本论文提出了一种基于二阶近邻随机游走的符号网络表示学习方法NRW-SNE。该方法设计了一种新的符号网络的有偏随机游走模型,使游走者自适应地选择沿一阶近邻游走或沿二阶近邻游走,这样学习到的节点表示同时保持了一阶近邻接近度和二阶近邻接近度;而且,网络的节点表示学习环节采取了基于神经网络结构的最大化节点共现概率的学习框架,提高了符号网络表示学习算法的计算效率,使其适用于大规模符号网络。实验结果表明,本论文方法学习到的节点表示在社团划分和符号预测任务上都较谱表示方法有很大的提高。(3)提出了基于影响力传播元路径融合的异质网络表示学习方法针对异质网络信息融合缺乏考虑影响力传播产生的隐式元路径的问题,本论文提出了一种基于影响力传播元路径融合的异质网络表示学习方法ID-HNE,研究了异质网络中由于影响力传播而产生的复杂隐式元路径在节点表示中的融合问题。本论文首先对异质网络中基于影响力传播的隐式元路径进行建模,发现并利用影响力传播元路径融合的关系矩阵与Katz相似度的关系,将影响力传播元路径集合融合为单一元路径;然后,利用半监督堆叠去噪自编码器在保持基于元路径接近度的基础上学习每种元路径下的节点表示,并将不同元路径下的节点表示深度融合,得到节点的高度非线性低维向量表达。最后,在药物异质网络数据集和推荐系统中实验验证了ID-HNE方法学习到的节点表示的有效性。(4)提出了多源信息融合的加权符号异质网络表示学习方法在上述工作基础上,本论文进一步研究了异质网络结构信息以外的其它异质信息(如节点属性和关系属性)在节点表示中的融合问题,提出了多源信息融合的加权符号异质网络表示学习方法WHSE,该方法以推荐系统这一典型的异质网络为研究对象,深入融合了推荐系统的多源异质信息。该方法首先提出了一种基于加权元路径的接近度来定义用户反馈的极性相似关系,将用户反馈信息体现的用户喜好极性关系融合到用户特征建模中;其次,在基于元路径的同质子网络表示学习阶段,本论文采取了加权采样随机游走方法,获得保持连边符号和权重的节点序列,使学习的节点表示最大程度保留网络中的原始语义关系;再次,在异质信息深度融合阶段,本论文采用注意力机制和池化操作,融合了语义元路径信息和属性信息;最后,结合具体的评分预测任务优化模型学习用户/项的最终节点表示。实验证明,WSHE方法学习到的用户/项的表示能有效提高推荐性能。
其他文献
目的本次研究主要针对H3K27M突变型脑胶质瘤的临床诊断和治疗开展有效的分析。方法本次研究所涉及的时间段为2018年6月~2019年6月,参与本次研究的对象为在我院接受治疗的58例
目前,应用型地方高校会计专业的教学必须进行改革,主要改革教学内容、课程体系、教学方法和方式,建立具有职业技术特色的教材体系、打造具有职业技术特色的专兼职教师队伍、
编者的话:$$丹桂飘香的十月,“零陵文化旅游丛书”出版发行。近日,零陵区举行出版座谈会,邀请20余位永州历史文化研究专家学者、媒体界有关人员座谈。大家畅所欲言,对该丛书
报纸
前言 “总经理联络员制度”是以联络员为纽带架通职工与总经理信息互通的桥梁,实现职工参与民主管理的重要形式。为进一步促进民主管理规范化,推进总经理联络员制度试点工作的
任意反射面激光干涉测速技术(Velocity InterferometerSystem forAny Reflector,VISAR)和电探针技术均是爆轰实验中常用的测试手段。在平面爆轰波驱动金属飞片实验中,利用VIS
ppm,ppb在高校农业学报的论文中常出现,用来表示重量百分浓度、体积百分浓度。ppm,ppb并非单位的符号,ppm取自partspermilion的词头,系10-6(百万分之一)的缩写:ppb取自partsperbilion的词头,不同的国家对其理...
随着全球经济一体化的不断深入,人们意识形态的差异性日益被世界文明的认同性所取代。纵观当今的世界,正处于大发展、大变革和大调整的时期,技能文明程度的高低直接关系到国
马克思主义整体性是马克思主义的根本属性和固有特性,是马克思主义理论研究中的一个基本问题。不完整、准确地把握马克思主义的科学体系,理解马克思主义整体性,便不可能正确理解
“大刀向鬼子们的头上砍去,全国武装的弟兄们,抗战的一天来到了,抗战的一天来到了……”《大刀进行曲》这首威武雄壮、慷慨激昂的名曲,在抗日烽火中诞生,被人们传唱了70多年
<正>重钢集团产业公司(以下简称"公司")成立于1992年的,目前正处于全面深化改革、加快结构调整、促进转型发展的关键时期。面对生产经营高度依存重钢集团、历史包袱沉重、人