【摘 要】
:
随着移动互联网的快速发展和移动智能终端的普及,人们在体验移动通信所带来便利的同时,也时常遭受到大量垃圾信息的影响。目前,垃圾信息以各种媒体形式,并借助方便的即时通信
论文部分内容阅读
随着移动互联网的快速发展和移动智能终端的普及,人们在体验移动通信所带来便利的同时,也时常遭受到大量垃圾信息的影响。目前,垃圾信息以各种媒体形式,并借助方便的即时通信进行传播,给社会造成极大危害。为营造良好的通信环境,研究准确、高效的垃圾即时消息检测及过滤方法一直是人们关注的焦点。针对移动互联网环境下垃圾即时消息的特点,本文从即时消息文本内容出发,设计并实现了基于朴素贝叶斯方法的垃圾即时消息检测。首先将搜集的垃圾即时消息数据集分成训练集和测试集两部分,分别对其进行文本预处理,并将向量表示的即时消息文本特征用于训练朴素贝叶斯分类器,再将测试集输入给训练好的分类器进行分类。实验结果表明基于朴素贝叶斯算法的垃圾即时消息检测方法训练时间短,实现简单。由于基于朴素贝叶斯算法的垃圾即时消息检测方法忽略了即时消息文本特征之间的联系,导致分类准确率和召回率都偏低。本文利用深度信念网络模型能充分挖掘文本特征之间的相关性,设计并实现了基于深度信念网络模型的文本分类器来实现垃圾即时消息的检测。其过程为首先对垃圾即时消息进行预处理,之后采用信息增益(IG)方法提取有效特征,通过TF-IDF权重计算对选取的特征进行重要性排序,并用布尔逻辑模型来表示文本的特征,最后将所得的特征向量输入给深度信念网络的输入层进行分类器训练,其中输出层的节点个数由分类的类别标签数而定,并用训练得到的分类模型对测试样本进行分类。实验结果表明,与朴素贝叶斯方法相比,基于深度信念网络的分类模型能挖掘即时消息的更深层信息,对垃圾即时消息的区分能力更强,识别准确率更高,更能适应不断变化的垃圾即时消息文本形式。
其他文献
近年来,随着互联网的发展,以及Web2.0与移动终端的快速普及,传统的信息传播渠道逐渐向网络信息传播渠道靠拢。属于互联网产物的社交网也成为了当今最流行的信息传播媒介。随
本文通过记述笔者《大椿》系列绘画作品的创作过程,分析了笔者研究生三年期间在绘画艺术创作过程中的思考与认识。通过对现代绘画艺术中的代表人物蒙德里安、康定斯基等的作
在跨组织业务流程中,一个组织的业务流程需要跨越不同组织边界与其他组织的业务流程进行通信,交互以完成自己的业务目标。跨组织业务流程具有的隐私性、协作性、自治性和交互
随着信息技术的迅猛发展,人们对于基于位置服务的需求越来越高,不再满足于以GPS为代表的室外定位,而对室内定位提出了更高的要求。在室内定位技术领域中,基于Wi-Fi的室内定位
传统的绘画创作中艺术家们的观察方式是亲身面对大自然与生活场景,结合情绪与灵感通过肉眼观察去发现美,在去创造出美的作品。信息化快速传播的图像时代里,平日里眼前熟悉的
随着计算机和通信技术的发展,网络已成为工业生产和日常生活中必不可少的一部分。在网络化系统中,控制对象变得越来越复杂,很多设备的运行过程会表现出不同程度的非线性和随
利用实测地震记录反演地下结构是探测地壳结构的重要地球物理方法。随着对城市地区进行地下结构探测需求的不断提高,绿色环保震源的需求也在不断的提高,因此包括炸药震源在内的多种常规人工震源将逐渐不再适用。因而使用列车振动作为地震震源进行地下结构的探测成为了地下结构研究领域中一项新的具有重要意义的探索。高铁运行时会产生较强的振动信号,不同运行环境下所产生的信号不同,这些振动信号不仅包含列车的结构信息,同时也
随着信息技术的迅猛发展,网络数据日渐增涨、业务也越来越复杂。云计算应运而生,虚拟化技术作为云计算技术核心。将分布在不同域的不同类型资源抽象成虚拟资源,提供给用户使
随着微信、微博等社交媒体的迅速流行,利用社交网络进行信息传递变得快而有效。通过对信息传播机制进行建模分析,可以更好地对社会网络进行信息扩散预测或舆情监控等的研究应
首先,针对局部二值模式(Local Binary Pattern,LBP)的空间支持区域偏小而只能获取人脸图像中小的微观结构的问题,本文提出了一种基于局部二值模式的多尺度对数差分人脸识别算