基于属性网络表示学习的开源项目团队扩张研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:ericlin1985
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来随着开源社区的快速发展,开源项目和开发者数量均急剧增加、规模庞大,如何为开源项目推荐合适的开发者以保证其持续发展已成为迫切需要解决的问题。此问题的本质是开源项目与开发者之间的匹配问题,已有若干工作采用深度学习等技术建模开源项目和开发者特征,并通过特征匹配度排序为开源项目推荐开发者。此类工作在开源项目和开发者特征建模方面均存在不足,从而影响其推荐的准确性,主要表现在:1)开发者特征建模侧重开发者自身属性(如参与项目经验、行为特点等),较少考虑开发者之间的社交关系;2)开源项目特征建模侧重建模开源项目的描述信息,较少关注开源项目已有开发者之间的关系以及项目与其团队间的关系。针对上述不足,本文首先提出了一个基于交叉融合的开发者属性网络表示学习模型,用于兼顾开发者自身属性和开发者之间社交关系的开发者特征建模,然后,提出了一个基于二次注意力机制的开源项目团队扩张推荐模型,在考虑开源项目描述信息的基础上,有效建模了开源项目参与开发者对项目贡献的差异性以及他们之间的相互影响。最后,基于上述技术设计并实现了一个面向GitHub的团队扩张推荐原型系统。具体而言,本文的主要工作如下:·基于交叉融合的开发者属性网络表示学习模型,该模型将网络拓扑结构与属性信息分为不同视图单独处理,通过自我中心网络(ego-network)划分分离网络节点邻居的不同社群,使用基于自注意力机制的交叉融合操作交换视图间的信息并最终通过视图加权操作将信息融合于统一的向量表示上。实验表明,该模型在分类、聚类、可视化等任务中效果均有提升。·基于二次注意力机制的开源项目团队扩张推荐模型,该模型利用基于交叉融合的开发者属性网络表示学习模型获得开发者与项目的特征向量表示,并利用二次注意力机制分别对项目描述与现有团队、现有团队成员之间的相互影响关系进行综合建模,最后利用项目与候选开发者之间的特征相似性进行推荐预测。实验表明,该模型比现有工作在最终推荐效果上有较为显著提升。·面向GitHub的团队扩张推荐系统,前端采用React,后端采用FastAPI等框架开发并实现了一个面向GitHub社区的项目团队扩张推荐工具原型系统,初步验证了上述模型与技术的可行性。
其他文献
近年来,随着无线通信和传感器技术的发展,普适计算已经深入到了我们的日常生活中。例如,智能手机上的某些应用程序会利用手机上搭载的各类传感器感知用户所处环境的上下文信息,并利用这些信息自适应地改变自身行为,为用户提供更好的服务。理论上,准确无误的环境上下文信息能够帮助应用程序提升用户体验,但是,考虑到传感器的感知过程极易受到环境噪声的影响,感知的上下文信息很有可能是不准确的或者是相互冲突的,造成上下文
随着社会发展和时代更迭,突发公共卫生事件时有发生,因为其具备突发性、公共性、破坏性等特征,且往往伴随着社会失序和人民生命健康安全受损的严重后果,我们不得不重视对其进行的预防和控制工作。而在针对突发公共卫生事件的应对中,政府信息公开承担了重要的角色。在最短的时间内将重要信息公开,整合防控力量,以强有力的措施对事件进行有效干预已成为全世界的共识。2020年年初的新冠肺炎疫情再一度给我国乃至世界带来警示
新型材料性能各异,服役环境复杂,其材料性能测试面临新的挑战。引伸计是材料力学性能测试的重要工具之一,为材料的实际应用提供有力的数据支撑。传统的接触式引伸计安装复杂、受到使用环境限制;非接触式引伸计测量精度低、跟踪算法不稳定。本文以实现高精度高效率的应变和位移测量为目标,从视频引伸算法的计算精度、计算效率、硬件设计三方面出发,优化了匹配算法的计算过程和迭代策略,设计搭建了稳定成像的硬件系统。本文的主
日前,移动电子设备和电动车的发展日新月异,锂二次电池作为一种能量存储元件而备受瞩目。有机液体电解质因具有超高的离子传导性,可以使锂离子在正负极之间穿梭自如而被普遍使用,然则,有机液态电解质所存在的问题及安全隐患却难以解决,例如:液态电解质易发生泄露挥发、与锂金属易发生副反应产生易燃易爆物质、锂树枝状晶体生长可刺穿隔膜等。开发高能量密度、高安全性的固态电解质来代替有机液态电解质已引起了各方研究者的兴
关系抽取旨在识别文本中命名实体间的语义关系,是信息抽取任务的重要组成部分,有着重要的研究和应用价值。虽然之前的工作聚焦于抽取句子内实体间的语义关系,近年来的研究将该任务上升到了文档级别,即文档级关系抽取任务,该任务需要抽取系统能够对文档内的所有实体及其提及进行复杂的推理,包括逻辑推理、共指推理、常识推理等。为了解决现有方法的局限性,本文提出了两个基于深度学习的文档级关系抽取模型:(1)相比句子级关
随着移动互联网的不断发展,短视频用户规模的不断扩大,短视频APP已经超越游戏类APP成为继即时通讯之外的第一大“时间杀手”,成为了当之无愧的消费市场新流量入口。短视频平台的崛起,同时催生了大量剪辑软件,短视频制作门槛降低,无论是创作主体还是内容形式都有了极大的拓展。出版行业也开始尝试以“图书+短视频”的形式展开宣传营销,传统出版机构、数字阅读平台、文化传媒机构、书店等纷纷入驻平台,以短视频带动图书
随着物联网时代的到来,中国工业将由传统制造模式转型为智能制造模式,因此未来发展的重点必将集中于先进制造业。压力传感器广泛应用于各个领域,如在汽车、能源、石油、化工、航空航天等领域亟需超高负载、耐高温疲劳、抗冲击腐蚀、动态响应快的传感器。在众多压力传感器种类中,陶瓷电容式压力传感器能够满足以上性能要求,其精度、灵敏度、疲劳寿命等显著优于同类传感器产品。本文主要针对陶瓷电容式压力传感器在封装和工作过程
经济的发展离不开能源的消耗,然而大量燃烧化石能源造成的“温室效应”日益严重。目前煤炭在我国能源结构中占据主导地位,亟需大力发展高效清洁的燃煤技术。化学链燃烧技术(CLC)是一种可以实现CO2内分离的高效清洁燃烧技术。尽管化学链燃烧技术在CO2捕集和抑制NOx生成方面优势明显,但是无法避免SOx的产生和排放。以煤为燃料时,煤中硫不仅会影响化学链燃烧过程中CO2捕集的纯度,而且对载氧体活性及反应系统运
伴随人类社会生产生活需要,人类生产生活中每年向全球水体排放大量的抗生素污染物,在表面水、地下水甚至饮用水中都能够检测到它的存在。然而,传统污水处理工艺无法对其实现完全去除,更因其稳定的化学结构和难降解特性,对生态系统和人类健康构了成巨大威胁。因此,除了谨慎使用抗生素外,迫切需要开发高效的环境修复技术。而光催化作为一种环境友好的技术,用于去除水体中抗生素污染物拥有十分广阔的前景。然而,现有光催化剂因
本文以2009—2018年中国沪深A股上市公司作为研究样本,从非效率投资角度切入,考察了企业社会责任信息披露的经济后果,研究发现,企业社会责任信息披露质量与非效率投资显著负相关。本文同时考察了不同产权、披露形式以及鉴证效果下,社会责任信息披露质量影响的情景差异。进一步研究发现,企业社会责任信息披露质量对非效率投资的负向影响有助于促使企业市场价值提升。本文研究结论对于企业完善社会责任信息披露具有一定