非结构化数据处理技术在科技管理中的应用与研究

被引量 : 2次 | 上传用户:z362523
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会对于半结构化和非结构化信息技术应用和规模需求的急速增长,内容管理作为一种专门针对非结构化信息管理技术,正在逐步成为信息管理技术发展的一个重要方向。与存储在关系数据库中的结构化数据相比较,内容管理的主要管理对象是以各类非结构化数据为主的数据信息,比如:公司里面的各种报表、账单和网站中的各种的图片、影像、大量的音频和视频信息等。科技奖励评审系统作为内容管理中的一项,每年都要面临着很多非结构化数据的处理问题,例如文档、图片等非结构化和半结构化信息。其中,项目管理、申报、推荐、审查、专家在线评审及成果发布是科技奖励评审工作的重要组成部分,在这些组成部分中,每个条例都有严格而明确的评审规定,因此,申报信息所涵盖的数据必须准确才能保证业务流程对申报资料的有效处理,使得评审结果公正公平合理。显然,申报资料的有效填写、上传及处理是极为关键的。科技奖励系统中出现的非结构化信息的准确抽取是本文要解决的问题。针对现有科技奖励系统中出现的内容管理问题,本文以非结构化数据中一种常用类型——Word文档为例,分析和研究了科技奖励评审活动中支撑业务流程的数据处理问题。首先介绍了非结构化数据处理的研究现状,介绍了开源内容管理系统一—Drupal,具体分析了Drupal的优缺点及应用于昆明市科学技术奖励管理系统的可行性;接着介绍了科技奖励评审活动的具体流程,并给出昆明市科学技术奖励管理系统的具体设计与实现,指出在该业务流程中申报信息在各个模块中准确传递的重要性。通过对评审活动中申报资料处理中出现的问题进行分析,提出以开放性的Word文档为手段解决申报资料填写、上传及对申报信息准确处理的问题。然后介绍了如何对申报信息进行上传、存储、管理及展现的方法和策略,论述了基于Drupal的安全性存储策略和上传下载安全性。对系统中Word文档数据准确抽取效果进行了总结,最后论文提出构建一种新的数据结构模式来处理非结构化信息,对该数据结构进行了详细阐述,并分析了该数据结构处理非结构化数据的优缺点,提出下一步的总结研究工作。
其他文献
上个世纪80年代美术思潮显然是点燃积蓄已久美学热情的火源,在改革开放形成的良好文化生态和社会格局的辅助之下,引发了一场巨大的美学燎原。书法现代性探讨就是在这种氛围的
《教育部关于实施研究生教育创新计划加强研究生创新能力培养进一步提高培养质量的若干意见》中提出,要“建立研究生科研创新激励机制,营造创新氛围,强化创新意识、创新精神
介绍米德关于青年心理跨文化研究的独特性 ,并探讨其对我国当今教育的启示
本文在海洋环境立体监测(观测)系统框架下描述了海洋监测(观测)技术的国内外现状及发展趋势,涉及的内容包括海洋环境自动监测技术、卫星遥感海洋应用技术及水声遥测技术,基本上概括
在古代中国,人们营建选址活动所奉行的标准——“风水学”,体现了“人与环境”的整体观,这在一定程度上与现代室内环境艺术设计所要遵循的“人与自然和谐、以人为本”的设计
在大学英语课堂教学中,培养学生的思辨能力是教学的主要目标之一,其中,课堂讨论是一个重要的途径。为此,教师要精心设计各种话题讨论,比如开放型话题、代入型话题、对比型话
教育旅游是基于我国教育业的蓬勃发展而兴起的一种特色旅游,是教育产业与旅游业的结合产业。打造高质量的“教育旅游”基地,是国家和旅游界向游客提供一个高品位的旅游环境的共
近年来,随着社会经济文化的发展,群众的价值观、审美情趣的不断变化,观众对博物馆形式以及内容设计的要求越来越高,面对社会上多种文化娱乐设施、形式、渠道竞争日趋激烈的局
<正>张国焘是萍乡市上栗县金山镇山明村人,1916年秋考入北京大学理科预科,1919年10月预科期满转入哲学系本科,至1922年毕业。这期间正是中国处于社会大
管道输水具有输水效率高、施工简便、占地少、维护成本低等优点,目前已成为世界上农业节水的一项关键技术。灌溉管网一般使用PVC、PE等塑料管道,这种管道的承压能力比较低,常常