【摘 要】
:
近年来随着互联网迅猛发展和日益普及,网络已经成为人们获取信息的主要来源之一。然而互联网上的信息良莠不齐,不良信息的泛滥给人们尤其是未成年人的身心健康带来了极大的危
论文部分内容阅读
近年来随着互联网迅猛发展和日益普及,网络已经成为人们获取信息的主要来源之一。然而互联网上的信息良莠不齐,不良信息的泛滥给人们尤其是未成年人的身心健康带来了极大的危害。阻止和过滤掉互联网上的不良信息对保护青少年极其重要。网络上的大多数信息是以文字的形式存在,因此,对网页文本过滤进行研究,提供高准确率和实时的文本过滤越来越重要。系统采用URL(Uniform Resource Locator)过滤、字符串匹配过滤和文本分类过滤相结合的过滤方法。建立URL黑名单机制,对黑名单上的页面直接过滤。采用快速的字符串匹配技术对文章标题、超链接内容和文本前几段直接进行敏感词汇搜索,实现初次过滤。然后再利用文本分类技术进一步判定文本属性,过滤掉不良文本。并且将检测到的不良页面的URL信息反馈给黑名单,提高系统对其后页面的处理速度。在对IE浏览器体系结构进行分析的基础上,采用ActiveX控件和后台程序相结合的方法来实现过滤,其中ActiveX控件负责对IE浏览器的访问进行监控,将浏览信息传给后台程序,同时接受后台程序的命令,对浏览事件进行阻止或重定向;后台程序负责内容过滤的处理、数据库的查询和维护。最后,设计实现了一个基于IE浏览器的网页过滤系统原型。在自建词库和文本库基础上进行试验,结果表明总体识别率和处理速度上基本上能够满足不良信息过滤的要求。
其他文献
资源配置是综合模块化航空电子系统(IMA)设计的重要环节,配置信息的安全性分析是保障整个航空电子系统安全性的关键。传统的安全性分析方法得到的结果往往不能展示其安全性属
随着计算机网络通信技术和多媒体技术的飞速发展,新型的人机交互技术已成为当前计算机科学领域一个十分活跃的研究课题。语音信号和面部表情一样,传递着情感信息。语音情感识
在程序设计和数据结构算法的教学中,算法的抽象性使学生难以理解其实质。算法演示可以辅助教师生动形象地教学,并帮助学生高效而轻松地掌握算法的设计原理和执行过程。本文在
远程实时监控软件是计算机取证中的一个重要组成部分,但在植入远程实时监控软件时往往会受到虚拟还原软件的干扰。因此,研究虚拟还原穿透技术对于计算机网络隐蔽取证具有重要
当今时代是一个信息时代,越来越多的企业实现了信息化管理,对一些大型企业或组织,有着大量的内部网语料,如何通过文本检索技术,自动挖掘出企业文本语料中的有用信息,受到了大
随着web信息的急剧增加,用户如何准确、快速有效地从海量web信息中提取所需信息,已成为当前急待解决的问题。搜索引擎技术是解决用户检索海量web信息的有效途径之一。目前搜索
计算机网络技术迅猛发展,开始深刻地改变着人们的生活方式。尤其是web2.0时代以来,社交网站和社交网络服务蓬勃发展,如国外的Facebook、LinkedIn,twitter,国内的各大主流微博客等
网络状况的复杂多变以及客户端设备的处理、显示能力各不相同,给视频编码技术带来极大的挑战,使得视频编码不仅需要具有良好的率失真性能,较好的视频图像质量及相对较低的计
光纤通道技术结合了远程网络技术和高速通道技术的优势,具有高带宽、高可靠性、低延时、低成本等特点,使其成为存储区域网的主要接口技术。利用片上可编程系统SoPC(System-on
时间序列是一组按时间顺序排列的数据集合,它广泛存在于商业、交通、工业等各个行业,对时间序列数据进行分析,可以揭示事物运动、变化和发展的内在规律,对于人们正确认识事物