基于文档平滑和查询扩展的文档敏感信息检测方法

来源 :计算机应用 | 被引量 : 8次 | 上传用户:wuww
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于办公终端可能出现敏感信息泄露的风险,对终端上的文档进行敏感信息检测就显得十分重要,但现有敏感信息检测方法中存在上下文信息无关的索引导致文档建模不准确、查询语义扩展不充分的问题。为此,首先提出基于上下文的文档索引平滑算法,构建尽可能保留文档信息的索引;然后改进查询语义扩展算法,结合领域本体中概念敏感度适当扩大敏感信息检测范围;最后将文档平滑和查询扩展融合于语言模型,在其基础上提出了文档敏感信息检测方法。将采用不同索引机制、查询关键字扩展算法及检测模型的四种方法进行比较,所提出的算法在文档敏感信息检
其他文献
针对高分辨率遥感影像场景的分类,受人类视觉系统从场景中提取汇总统计信息用于场景感知的启发,提出场景汇总统计特征提取方法。该方法提取场景的平均方向信息和视觉杂乱度,利用Gabor滤波器统计场景的平均方向信息,并基于视觉拥堵进行场景的杂乱度度量,然后将两者组合在一起,形成基于汇总统计特征的复杂场景描述。在21类遥感数据集上的实验表明,当训练样本和测试样本各为50幅时,该方法的分类精度比Gist方法高6
针对人脸视频中眼睛定位精度影响眼睛状态识别正确率问题,提出了一种融合在线肤色模型的眼睛状态识别算法。首先,在人脸主动表观模型(AAM)定位的基础上,使用当前用户的肤色特征,建立在线肤色模型;其次,在初步定位的眼睛区域,再次使用在线肤色模型,定位内外眼角点的精确位置,并利用眼角点的位置信息提取精确的眼睛区域;最后,提取眼睛区域的局部二值特征(LBP),使用支持向量机(SVM)算法,实现对眼睛睁闭状态
中华人民共和国海关总署令第92号《中华人民共和国海关行政裁定管理暂行办法》已经2001年12月7日海关总署办公会审议通过,现予发布,自2002年1月1日起施行。署长牟新生二○○
硫酸庆大霉素注射液皮试结果分析祝培友,谢法冬,王永田,孙兆勇(山东省淄博市第一医院255200)庆大霉素(Gentamicin)自六十年代末用于临床以来,为革兰氏阴性杆菌感染的治疗发挥了巨大的作用;但近年来有关
环发[2001]199号各省、自治区、直辖市环境保护局(厅),经贸委(经委),科委(科技厅): 为贯彻《中华人民共和国固体废物污染环境防治法》,保护生态环境,保障人体健康,指导危险废
基层公共图书馆的服务体系构建及体制改革、创新是建设覆盖全社会公共文化服务体系的重要内容。而图书馆总分馆制是公共图书馆服务体系建设机制体制的一种尝试和创新。本文通
针对一般查新系统中存在的当项目申请量大时任务分配效率降低从而影响查新进程的问题,通过分析农业科技文献查新室多年查新数据与工作流程,并对其实际工作需求详细调研,提出了一种基于指标权重叠加的自适应分配模型(ATAM)与算法,并设计实现了基于此模型的农业科技文献查新系统。最终测试结果表明,采用该模型的查新系统能够一定程度地减少任务管理的工作量,缩短任务分配时间,加速查新流程。
本文研究同服吗丁啉(Domperidone)对6例肾移植初期病人口服环孢素A药物动力学过程的影响,荧光偏振免疫法多抗试剂测定不孢素A全血浓度,PKBP-N1药物动力学学程序计算单服环孢素A及环孢素A与吗丁啉同服的药
高频地波雷达在海洋领域发挥着不可替代的作用。文章分析了高频地波雷达的发展动向。
发展医院药学的几点设想陈兰英(上海市药品监督办公室200233)药品是防病治病、康复保健、计划生育和科研教学必不可少的特殊商品。医院是使药品发挥上述作用的终端环节和关键环节。根