基于改进词向量模型的深度学习文本主题分类

来源 :计算机科学与应用 | 被引量 : 0次 | 上传用户:mhy8348
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
主题分类在内容检索和信息筛选中应用广泛,其核心问题可分为两部分:文本表示和分类模型。近年来,基于分布式词向量对文本进行表示,使用卷积神经网络作为分类器的文本主题分类方法取得了较好的分类效果。本文研究了不同词向量对卷积神经网络分类效果的影响,提出针对中文语料的topic2vec词向量模型。本文利用该模型,对具有代表性的互联网内容生成社区“知乎”进行了实验与分析。实验结果表明,利用topic2vec词向量的卷积神经网络,在长内容文本和短标题文本的分类问题中分别取得了98.06%,93.27%的准确率,较已知词
其他文献
组织员的主要职责是:(1)做好发展党员工作.一是认真贯彻执行发展党员工作总要求,制订和实施发展党员工作计划.在党委的领导下,按照发展党员工作的总要求,从本地区本单位的实际情
1992年出生的金鹏是北京现代沧州工厂发动机部工程技术科一名技术工人,年纪轻轻就已集河北省劳动模范、河北省技术能手、河北省青年五四奖章等诸多荣誉与奖励于一身,拥有多项
如何在开放环境下建立通用的,可以在异构系统之间交换、共享溯源信息的规则,是目前数据溯源技术的研究热点。本文引入了W3C提出的PROV数据溯源机制,重点探讨了在语义网环境下
针对多个应用系统组成的集成平台,用教育电子身份号(e2ID)研究实现关联认证,通过单点登录、实名制访问多应用系统,节省了网络资源,提高了访问效率。经在湖南省教育厅湘教云平
林语堂的人文思想具有如下特征:以人和人生作为出发点和归宿,以真实的人生、人生实践和人生感悟作为立论的基础;总是用智慧去观照世界,区分美丑,确认价值,即以智慧为根本;古今中外,兼
中国共产党是先进的马克思主义政党,党员的唯一信仰是共产主义,因此,对于共产党人来讲,"纯粹"是一个最基本、最重要、最核心的要求。"欲知大道,必先为史",波澜壮阔的中国近代史告
任务调度是云计算中的一个关键问题,遗传算法是一种能较好解决优化问题的算法。本论文针对遗传算法在任务调度过程中随着任务调度问题复杂度增加,算法的性能出现下降的现象,
本文根据乌鲁木齐河流域降水观测资料,对各降水观测资料进行了降水观测系统误差的总修正。并通过修正后的年降水量资料绘制了乌鲁木齐河流域年降水量等值线图,分析了该区降水
<正> 工程监理是一个新生事物,是确保工程质量的一个重要环节。1999年3月,笔者参加了乌拉泊水库泄水渠加固改建工程的建设监理工作。该工程概算总造价786.45万元,工程项目包