基于文本内容分析的Web API协同标注与分类研究

来源 :云南大学 | 被引量 : 0次 | 上传用户:asdf1aasdf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Web服务方式的发展,新型的数据资源Web API大量地涌现出来。为了更加方便地管理快速增长的Web API,人们基于Web API的描述文本使用标签信息对Web API进行标记,而如何正确高效地对Web API进行分类标注的方式显得尤为重要。鉴于此,本文结合深度学习与文本内容分析的相关技术,对于Web API单标签的分类任务,将卷积神经网络(Convolutional Neural Network,CNN)文本分类模型应用于Web API数据,实践CNN对Web API数据的分类效果;对于Web API多标签的标注任务,本文基于文本内容分析及协同过滤的思想,提出基于自编码网络的协同标注模型进行处理。本文的创新之处在于使用自编码网络提取的文本特征来增强相似性计算继而基于文本内容进行协同标注,避免了因为Web API数据稀疏导致协同标注效果不佳的情况。具体来说,本文的主要工作如下:1)通过CNN有监督地学习方式,将相关的基于CNN的分类标注模型应用于Web API文本数据上,并设计相关的实验来验证分类标注模型对Web API文本的分类效果。本文使用的基于CNN分类标注模型有两个,一个是通过CNN连接Softmax进行文本分类;另一个是使用CNN提取文本特征,然后计算文本特征向量与类别标记之间的相似度,并通过相似性对API文本进行分类。2)提出基于自编码网络的Web API协同标注模型,使用自编码网络对Web API文本内容进行无监督地学习,提取得到Web API的文本特征。由于Web API数据的稀疏性,不能直接使用协同过滤算法对Web API数据进行标签推荐。利用自编码网络学习得到的Web API文本特征,求得待标注API的相似API集合,根据相似API集合中的标签类别,完成多个标签的标注任务。设置不同的协同过滤算法中的超参数,查看超参数对Web API协同标注模型的影响。3)选取各个模型中效果最好的结果,纵向比较模型对Web API的分类或者标注的效果,实验最终结果表明基于自编码网络的协同标注模型对于Web API文本的综合分类效果最好。
其他文献
没有好奇,就不会去注意;没有好奇,也就没有兴趣。没有兴趣、没有注意就不会去发现、去探索。学生是学习的主人,不应成为学习的奴隶。与其强迫学生苦涩地学习,跟在教师的后面死记硬
近年来,随着科学的发展,越来越多的先进设备进人医院,不但提高了医院的诊断和治疗水平,也将医院的信息化和自动化程度推向新的高度。门诊药房自动发药系统就是其中之一。自动发药
3D壁画作为当代艺术领域中的一种新型绘画方式,在继承了传统壁画的文化底蕴的基础上,巧妙的融合了当代因素,形成了独具时代特征的艺术语言。与传统壁画相比,3D壁画的功能、形态更具时代特点,将当代的互动性、商业性融入到传统壁画的观赏性、装饰性之中,从而产生了全新的艺术价值与文化内涵。它不再只是精英式的绘画,而是更加注重宣传大众文化、增加观众互动式体验的载体。其以立体、逼真、细腻的艺术效果及通俗、开放、流
某公司一台液压天线升降平台,其液压系统的执行机构为双作用两级液压缸,额定工作压力10 MPa,工作负载5t。工作时要求液压缸必须正向安装(活塞杆向上伸),伸缩平稳,且在任意位
随着电子计算机技术的飞速发展和在工农业中的广泛应用,世界正面临着一场人类历史上最伟大的技术革命。人们将这场革命称之为“第四次工业革命”或“第三次浪潮”。“第三次
期刊
我国56个民族所处的文化类型、文化样式并非完全相同,而是分别适应于各自处境的具体文化,自成体系。要实现现代化自然带有特定的生境对应性,对于每一个希望实现现代化的民族
调查发现,农村老年人面临着经济困境和生活困境,他们通过以土地保障为主的个人自养、压缩日常支出费用和加强与子女的联系来应对经济困境,通过社会网络、社会交往和心理调适来应
利用金华市1953-2005年逐日20~08时、08~20时降水资料,采用第2、3类距平、最大熵谱分析、小波分析等方法分析了汛期降水的基本特征及年际年代际差异。结果表明:金华市降水季节变
【正】 图书馆的目录,是指导读者阅读的工具,是图书与读者之间的桥梁。苏联莫斯科大学图书馆科学部副馆长维廉斯卡娅说得好:"只有在图书馆建立起各种互相联系的目录之间的严
<正>近年,随着短效、强效的全身麻醉药物和麻醉性镇痛药物以及高质量的医疗设备如麻醉机、监护仪在临床麻醉中的应用和普及,加上手术和病人的需求,气管内插管的全身麻醉技术
会议