基于异构信息网络嵌入的相似性度量研究与应用

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:hcai5188
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于异构信息网络(HIN)在数据异构性建模方面的灵活性,采用HIN来表征检索系统中的复杂和异构辅助数据,通过相似性度量来完成检索任务的方法受到广泛关注。目前,基于HIN的相似性度量方法一般是通过元路径来衡量节点的相似性。然而对于相同类型节点的相似性度量,基于HIN元路径的相似性方法存在一些问题:它们忽略了元路径中其他类型节点的相似性对目标类型节点相似性度量的影响。针对这一现状,本文提出了一种基于异构信息网络嵌入的相似性度量算法(Similarity Measure Based on Heterogenous Information Network Embedding,HNESim)。为了更好地嵌入异构信息网络,HNESim采用了改进的Deepwalk算法,设计了一种基于元路径的随机游走策略,通过节点类型过滤来生成有意义的网络嵌入节点序列。学习到的节点嵌入首先由融合函数进行变换,随后通过计算两个节点嵌入融合后的余弦值,来衡量两个节点之间的相似性。我们在科研项目管理数据上进行实验,并与经典的相似性度量算法PathSim进行对比。实验结果显示,HNESim算法的平均精度(MAP)比PathSim算法要高,降低了无关结果的检索数量,证明了HNESim算法的有效性。此外,本文将HNESim算法应用于合作者检索系统,深入分析科研人员寻求合作者的需求,并针对这些需求定义了功能模块,完成了架构设计,实现了对合作者检索系统中科研人员的精确检索。将HNESim算法应用于合作者检索系统,较好地解决了科研人员寻求合作者难、低效的问题,具有良好的研究和应用价值。
其他文献
选择金银花、连翘、蒲公英、枇杷叶、木通、黄芪、甘草组成中草药方剂。取20只小鼠,雌雄各半,体重(20+2)g,按序贯法测出中草药方剂腹腔注射小鼠100%致死率;采用寇氏法将高剂量组与低
积累语言知识是语文学习过程中重要的环节。作文则是把所学知识运用到书面表达上的重要方式。平日的积累是写好作文的基础,厚积才能薄发。在几年的作文教学实践中,我感到,如
<正>人教版九年级物理第十六章第一节有关分子热运动中的演示液体扩散实验,通常的做法是:在量筒中装入一部分清水,把长颈漏斗插入水底,慢慢地将蓝色的硫酸铜溶液注入清水的下
消化道黏膜与其下肌层组织的位置关系类似于皮肤和皮下组织。消化道黏膜部位相对"表浅",如果将体表皮肤称为"阳肤",消化道黏膜则可称为"阴肤",消化道黏膜病则可称为"阴肤病"。"阴肤病"
长江水上钻探即在长江上利用漂浮物作为钻机平台进行的钻探工作。长江镇扬河段及附近为感潮段,水的流速高潮时最小,最低潮前半小时左右最大,潮水位受洪峰、潮汐及台风等因素影响
介绍了波音777-300ER飞机货舱防火系统的工作原理及各部分构造和功能,并针对一次典型的虚假货舱火警信息进行了深入分析。
基于Gilmore空化泡动力学方程,考虑液体黏性、表面张力、可压缩性、水分子扩散及导热影响,建立湍流作用下孔板空化器下游流场的空化泡动力学模型。采用四阶龙格-库塔法对该空
介绍宜兴市丁蜀污水处理厂较大沉井结构的施工方法,降水采用管井降水,沉井下沉作业时采用人工挖土和水冲法相结合的施工方法,节约工期,保证工程质量。
习近平总书记在十九大报告中指出,创新是引领发展的第一动力,是建设现代化经济体系的战略支撑。过去的五年,中国经济保持中高速增长,我们在创新领域取得了重要成果,天宫空间站、蛟
报纸
在国内外对图像识别软件研究成果的基础上,运用数字图像处理技术,设计了能够检测PCB断路短路缺陷的自动检测系统。