【摘 要】
:
随着中国网民数量的不断增长,论坛、博客、微博等网络媒体作为民意表达最为集中、信息传播最为畅通的一个“场所”,越来越受到网民的热衷。网络舆情检测与控制涉及到的关键技
论文部分内容阅读
随着中国网民数量的不断增长,论坛、博客、微博等网络媒体作为民意表达最为集中、信息传播最为畅通的一个“场所”,越来越受到网民的热衷。网络舆情检测与控制涉及到的关键技术,例如,信息的采集与抽取,话题的聚类与分析以及舆情控管等技术,是学术界研究的热点。论文中,将以109所高校论坛作为研究对象,通过对当前信息采集技术以及信息抽取技术的应用与改进,获取能够反映大学生最新思想动态的舆情信息;通过对舆情控管过程中遇到的相关问题进行讨论,提出了一套完整的舆情控制解决方案。论文中,将对网络舆情检测与控制中涉及到的三种关键技术:信息采集、信息抽取以及舆情控管展开详细的讨论。信息采集部分将采集过程分为了两部分:离线部分和在线部分。离线部分,首先,通过对样本网页的采集,获取到采集器的采集路径以及网页属性信息;然后,通过对关键资源的识别,得到了能够抽取它们的路径。另外,通过与信息抽取技术结合,将得到的发言时间及有效信息含量应用到了基于泊松模型的时间模型中,得到增量采集的合理时机。在线部分,将使用离线部分的结果指导采集器的工作,极大地提高了信息采集的准确率以及降低了采集器的负担。信息抽取部分,通过利用帖子中存在的网页结构相似性,结合用户创建信息的特点,提出了索引路径定位标题、主题和回复信息的算法,并对回复信息可能存在的干扰,进行深度噪音去除。舆情控管部分,充分利用论坛提供的操作接口,通过对验证码、身份隐藏等问题的讨论,最终得到一个可以针对不同论坛实施舆情干预的统一解决方案。
其他文献
全文检索技术是现代信息检索技术的一个非常重要的分支,它是处理非结构化数据的强大工具。全文检索的一个重要应用就是办公自动化领域,随着我国办公自动化进程的加速,人们对
双目立体视觉是基于视差原理,由左右两幅视图获得匹配点对,根据匹配点对的视差计算出该点在空间中的高度,从而获取物体的三维几何信息。利用物体的三维信息根据不同的应用可
在传统电网对各类状态信息获取的基础上,智能电网增加了更多内容,并且对电网中产生的各类实时信息获取能力进行了进一步扩展。数字化变电站系统作为智能电网重要组成部分,自然成为智能电网状态监控的重点部分,而监控离不开实时、可靠高效的通信系统。变电站通信系统遵循IEC 61850国际标准,目的在于实现整个通信系统的互操作性和可插拔性,后者提出变电站通信中采用发布订阅架构,但并未提出具体实现方案。数据分发服务
Web服务匹配是异构平台上数据与应用整合与共享的关键问题。与传统基于关键字匹配的方法相比,语义Web服务匹配算法效果更好、准确率更高、时间复杂度更差,服务的响应时间随着待
近年来,虚拟机技术在服务整合以及高性能计算等方面的优势日益明显,然而,天然的隔离特性使得虚拟机间的通信性能并不理想。虚拟机间通信的常用方法是虚拟网络,但是,进行通信
无线传感器网络集中了微机电、感知、嵌入式计算、分布式信息处理和无线通信等技术,形成了一种全新的信息获取和处理模式。布局、覆盖、节点定位、网络通信协议是传感器网络
RIP协议是基于距离向量的路由协议,由于其操作简便,系统资源消耗小,适合应用于小型网络。RIPng是基于IPv6的RIP路由协议。为了保证网络中运行RIPng的路由器能够正确互联互通
移动自助服务系统通过有线或无线网络实现了对其自助服务终端的远程监视和控制,方便公司内部管理,并且为用户提供了方便的途径完成缴费和其他基础业务。由于系统的复杂性,对
“数字油田”源于1998年前美国前副总统戈尔提出的“数字地球”的概念,旨在最大程度地实现信息共享,为勘探开发、经营管理以及科学决策等提供强有力的信息技术支持,从而满足
与传统网络不同,无线传感器网络通常部署在野外或者敌方区域,其网络节点成本低廉、结构较为松散、不具备抗篡改能力、且容易被攻击者俘获,无线传感网络的安全问题已经成为制