论文部分内容阅读
校园网络不断快速发展,己成为反映大学生思想道德健康的一个重要窗口。从校园网络BBS、博客中检测大学生乐于讨论的话题和事件是掌握大学生心理健康的重要途径。为了建立一套校园网络文化安全预警平台,检测校园网络中讨论的事件和话题,本文提出了层次化话题检测与跟踪技术。该技术能够从输入文本中检测出文本描述的事件、跟踪话题的发展,并将相关的事件组织在一起形成一个具有层次结构的完整话题。本文通过动态的树构建过程生成一种层次化事件树,用以表达不同事件之间的层次关系并清晰地展现出话题的发生、发展和结局,从而解决了传统话题检测与跟踪不能跟踪话题发展的问题。本文还改进了文本向量传统的权值计算方法,提出了词的动态反转事件频率,改善了原有方法在网络文本灵活多变和网络新词层次不穷的情况下的计算准确度,增强了对文本所描述的事件的识别能力。为了评估层次化话题检测与跟踪技术的性能和效果,我们定义了一种基于树的编辑距离的评估模型。这种评估模型通过计算层次化事件树与语料库中我们所建立的标定事件树之间的相似度达到评估系统性能的目的。本文将层次化话题检测与跟踪技术应用于校园网络文化安全预警平台,检测和跟踪了校园网络中讨论的事件和话题。在实际应用中,层次化话题检测与跟踪技术准确地检测了事件的发生,跟踪了话题的发展,表现出了很好的实用性。