基于词向量嵌入特征扩展的学术报告分类

来源 :合肥工业大学学报:自然科学版 | 被引量 : 0次 | 上传用户:hz198119
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
学术报告讲座的标题属于典型的超短文本,其固有的特征稀疏问题使得在利用传统的文本分类方法对其分类时效果不佳。为解决上述问题,文章基于词向量嵌入技术,对学术报告标题进行特征词扩展。通过控制特征扩展幅度和设置词间相似度阈值,使扩展的特征词与标题特征词的内容相关,并从词性角度进一步考虑词语相似性,过滤无关特征词。实验结果表明,该方法能够有效地提高对学术报告标题短文本的分类效果。
其他文献
城市公共服务设施供需关系是衡量城市服务水平和服务质量的关键,供需关系平衡是体现资源优化配置的重要指标。文章基于供需平衡的视角,提出供需度的公共服务设施评价方法,继
随着信息业的蓬勃兴起,图书馆的电子阅览室与社会上的网吧应运而生,两者极其相似,又有本质的区别。本文以昌吉州为例,就公共图书馆电子阅览室与网吧的区别、电子阅览室类同网吧的
Laruku 为电影《Final Fantasy》《灭绝光年》日本版做的片尾曲《Sprit Dreams》相信也是乐队短期内的“片尾曲”,因为短期内各成员都在专注于个人活动,Solo 的各位是否仍像
大厨:偶像崇拜成了当今社会一大奇观,有的孩子为了得到一个明星的签名,做出了匪夷所思的狂热举动。从多媒体,为了取悦最大的/n读群体,不厌其烦地制造着一个又一个偶像。是耶?
期刊
针对传统支持向量机(support vector machine,SVM)算法应用于入侵检测中存在参数选取的问题,文章提出了一种改进粒子群算法(improved particle swarm optimization,IPSO)和SV
笔者总结了六年来在本校对以本科生为主的不同层次医学人员中开设信息与交流英语选修课程的实践体会和收到的成效,为在新世纪条件下高等医学院校开设高层次实用性课程提供了思