层次化话题检测与跟踪技术及应用

来源 :北京科技大学 | 被引量 : 0次 | 上传用户:longshentailang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
校园网络不断快速发展,己成为反映大学生思想道德健康的一个重要窗口。从校园网络BBS、博客中检测大学生乐于讨论的话题和事件是掌握大学生心理健康的重要途径。为了建立一套校园网络文化安全预警平台,检测校园网络中讨论的事件和话题,本文提出了层次化话题检测与跟踪技术。该技术能够从输入文本中检测出文本描述的事件、跟踪话题的发展,并将相关的事件组织在一起形成一个具有层次结构的完整话题。本文通过动态的树构建过程生成一种层次化事件树,用以表达不同事件之间的层次关系并清晰地展现出话题的发生、发展和结局,从而解决了传统话题检测与跟踪不能跟踪话题发展的问题。本文还改进了文本向量传统的权值计算方法,提出了词的动态反转事件频率,改善了原有方法在网络文本灵活多变和网络新词层次不穷的情况下的计算准确度,增强了对文本所描述的事件的识别能力。为了评估层次化话题检测与跟踪技术的性能和效果,我们定义了一种基于树的编辑距离的评估模型。这种评估模型通过计算层次化事件树与语料库中我们所建立的标定事件树之间的相似度达到评估系统性能的目的。本文将层次化话题检测与跟踪技术应用于校园网络文化安全预警平台,检测和跟踪了校园网络中讨论的事件和话题。在实际应用中,层次化话题检测与跟踪技术准确地检测了事件的发生,跟踪了话题的发展,表现出了很好的实用性。
其他文献
近年来,并行计算技术获得了充分的发展,各种新的软硬件层出不穷。图形处理器(GPU)作为一种高度并行化的处理器架构,已得到越来越多的重视,目前已诞生了以NVIDIA CUDA(Compute Uni
随着Internet的广泛普及,对等网络很快成为研究和应用的一个热点,其P2P覆盖网的构建得到了极大关注和重视。结构化P2P覆盖网中,资源的分布具有一定的映射规律,但在利用分布式
学位
在互联网高速发展的今天,网络应用早已不局限于传统的网页浏览,电子邮件等,文件共享的地位越来越重要,而传统的C/S模式无法满足用户对于速率的需求,因此P2P逐步成为最重要的文件共
随着多媒体技术的发展和移动设备的普及,人们开始通过手机等设备浏览图像和视频,面向移动设备的视觉媒体应用逐步成为新的消费时尚。与面向电视、电脑等传统展示设备的视觉媒体
近年来,随着Agent技术、理论、应用等方面研究的不断深入,越来越多的工业和商用等应用领域开始采用Agent的方式进行软件系统的构造。其中Agent通信语言(ACL)作为充分发挥Agent
广告的推广、商品的买卖是电商、社交、搜索等诸多类型互联网科技公司主要的经济来源。商品、广告的划分以及用户的点击行为预测,可以帮助企业解决商品、广告的推荐问题。  
RFID(无线射频识别)系统是开放环境下的,没有任何物理或其它可见接触的一种通信技术.由于其布置不受环境影响,成本低廉,所以RFID系统有着广泛的应用前景,目前已在很多领域使用.但
基于FPGA与USB的综合地面检测设备是国家重大科技基础设施项目——东半球空间环境地基综合监测子午链(即子午工程)探空火箭综合监测分系统的组成部分之一。地面检测设备要解
钻井领域的软件开发工作需要软件开发人员和领域专家密切合作来完成,领域专家提供适用于领域内的专业计算算法,软件开发人员依据这些算法实现相应的功能。由于领域专家往往掌握
针对新靶标探索新颖的先导化合物是药物发现和设计过程中最重要的步骤之一。目前,获得先导化合物的途径主要有两种:一是通过基于实验的高通量筛选方法来筛选分子库从而获得有苗