基于词嵌入与生成对抗网络的垃圾邮件分类算法

来源 :南京工程学院学报:自然科学版 | 被引量 : 0次 | 上传用户:yysky99
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
包括朴素贝叶斯算法在内的现行较为有效的垃圾邮件分类算法大都依赖于大量的垃圾邮件样本.但是在一个邮件系统建立初期,往往不能够搜集到足够数量的垃圾邮件样本.针对这一问题,引入生成对抗网络的相关理论,提出一种能够快速训练垃圾邮件分类器的WE-GAN算法.该算法将词嵌入与生成对抗网络相结合.通过词嵌入获得邮件特征,利用生成对抗网络来训练一个辨别器和一个生成器,起到增大样本数据集、提高分类效率的目的.结果表明,在小数据集的情况下,其可以获得不低于朴素贝叶斯方法的分类效率与准确度.
其他文献
大班英语教学是目前高校普遍存在的现象。本文探讨了在这种客观环境下,要取得良好教学效果,使学生在各方面得到全面发展,可以采取的几点教学策略。
目的分析对比降钙素原检测与血培养在诊断血流感染中的临床应用价值。方法选取本院2017年1月-2018年12月收治行血液培养与PCT检测患者60例,分别进行PCT检测与血液培养分析,对
目的观察不明原因致发热伴白细胞血小板减少患者的临床症状、干预方法及效果,以指导本病临床诊治工作。方法选择2015年-2017年期间我所收治的50例发热伴白细胞血小板患者,对
目的探析标本采集制备质量对骨髓细胞形态学分析的影响效果。方法选取我院2018年3月-2018年9月送检的骨髓细胞形态学的475份样本作为研究对象,其中发报告406份,未发报告69份,
随着移动互联网技术的发展和微信的上线推广,手机微信APP逐步成为新生代主流社交软件平台,基于微信公众号和微信朋友圈的交易,总称微商,逐步呈现爆发增长的繁荣态势。与之伴
目的探讨尿红细胞形态联合尿蛋白定量检验在肾病中的应用价值。方法选取我院2016年6月-2017年6月肾脏内科接诊的肾病患者68例,对所有患者进行尿蛋白定量检验,同时分析患者尿
采用高效液相色谱法,对方中麻黄的盐酸麻黄碱和马钱子粉的士的宁进行含量测定。结果表明所选的方法简单准确,专属性强、精密度高、重现性好,可为风痛片的临床安去提供保障。