基于深度置信网络的文本分类方法研究

来源 :辽宁工程技术大学 | 被引量 : 0次 | 上传用户:xjzsdy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着网络技术的发展和信息传递的日益频繁,文本分类技术的研究变得越来越重要。但是,大量无标签样本学习给现有的浅层分类方法提出了挑战,那么新的深层的,监督的学习方法和分类算法有待提出。本文分别针对文本特征提取算法和深度置信网络分类算法进行了深入的研究,具体的研究内容和创新点如下:  (1)为了提高文本分类算法的性能,首先,基于齐普夫定律分别从整体和局部的角度对文本进行特征提取,提出了一种整体频率-局部频率特征提取方法。  (2)在新的特征提取方法之后,将类别信息考虑在内,提出基于类别频率的TF-IDF公式来构建文本模型。  (3)为了提高文本分类算法的性能,改进深度置信网络模型,提出新的深度置信网络分类方法。  (4)将提出的深度置信网络分类模型应用到垃圾邮件过滤中去,并且采用不同的适应垃圾邮件二分类方法的性能指标来进行验证。
其他文献
该文着重研究如何提高软件分布式共享存储系统的性能,分别从系统开销、通信优化等方面提出了相应的技术,通过对软件分布式共享存储的系统开销进行的详细分析,发现远程数据不
至今,不少人对上世纪八十年代风靡全国的故事片《从奴隶到将军》记忆犹新,但你也许不知道该片主人公的生活原型就是抗日名将罗炳辉将军,更不一定知道罗炳辉将军的夫人就是四
钢筋混凝土结构施工在房屋建筑中优势明显,对于房屋的各项性能都有一定的提高,在房屋建筑中有效运用钢筋混凝土结构施工技术,更好的发挥钢筋混凝土结构在房屋件数施工中的优
工作流管理系统是当前的一个研究热点.工作流管理系统是指通过计算机技术,实现群组协作,业务过程自动流转的系统.在研究中,最受关注的是两个问题:过程定义法与分布实现法.前
随着我国社会经济的不断加快,工程建设项目越来越多,这就对竣工环境保护验收工作提出了更高的要求.本文首先阐述了项目竣工环境保护验收的特点,然后分析了竣工环保验收工作中
自语义网的概念被提出以来,由W3C组织倡导和支持的语义网标准化建设已经取得了长足的发展,制定了一系列包含资源描述框架RDF、网络本体语言OWL、SPARQL查询语言、RIF规则语言等
由于我国人口基数较大,对自然资源的消耗以及使用量较高,其中建筑耗能占总耗能的比重较大,因此,必须要加强对节能技术的运用.建筑工程节能施工技术的运用不但能够有效缓解我
学位
随着我国社会经济的快速发展,人们日常生活水平的不断提升,人们对于建筑物内部各项基础设施的要求与标准也有所提升,尤其是建筑暖通给排水工程施工作业,为了确保暖通给排水工
视频通信系统近年来得到了蓬勃迅速的发展.基于普通电话网的低比特率视频通信因为其广泛的应用背景而得到了充分的重视,并取得了长足的发展.该论文将在基于Windows CE的掌上