论文部分内容阅读
随着计算机的高度普及和相关技术的飞速发展,自动化办公广泛地应用在很多政府机关和事业单位,在提高工作效率的同时,也带来很多安全隐患。 我校涉密部门,涉密电子文档必须存储在涉密计算机上,并需要严格分类、管理和保护,如果存储在非涉密计算机上,安全性就无法保证。然而,受限于技术条件,我校现有的文档检索工具只能被动的扫描检索涉密电子文档,效率很低,不能在日常工作中实时地发现计算机上新增的涉密电子文档,因此很难保障涉密电子文档安全性。 为解决涉密电子文档通过存储设备、网络通信软件和电子邮件等方式传递到计算机却不能被及时发现的问题,考虑到涉密电子文档最终要存储在计算机硬盘上并且会有关键词标识,本文设计和实现了一种基于.net的针对计算机硬盘涉密信息的检索和监测系统。系统通过相应组件获取计算机已存在或新增文档的内容,采用KMP(Knuth-Morris-Pratt)算法将全文字符串与关键词匹配,将匹配成功的涉密文档属性和关键词所在句生成Txt日志,同时记录到SQL Server数据库后台管理系统。系统通过功能测试和整体性能测试后,交付我校保密部门使用,运行稳定有效。 涉密信息检索和监控系统完成了既定的功能和任务。本文的技术难点包括: (1)以FileSystemWatcher控件数组的形式监控多目录下的多种类型的文档文件。 (2)使用多线程、委托调用和多态等技术实现多种类型文档全文检索以及使用多种组件提取PDF文档文本内容。 (3)数据库三层架构的实现以及使用ADO.NET实现数据库的访问和对数据源的操作。