论文部分内容阅读
殊卷是明清科举考试的产物,其数量巨大、内容丰富、信息详实。蕴含了丰富的时空信息与完整的语义信息,是研究我国明清社会、政治、文化、教育、科举以及人文地理等及其重要的原始资料。将殊卷中蕴含的时空信息显示化,可以从多个尺度上再现明清科举分区取士的沿革,重构个人的中试、任职及其他的重要社会活动,反映科举人才及其家族在空间上的迁移与扩展。然而,自科举废除后,殊卷大量散失,尚存的殊卷多以纸质形式分散于各地,数字化、信息化程度低;对其的研究应用,也多局限于殊卷文本述及内容的简单考证与查补,缺乏殊卷文本信息的整体性的数字化、结构化与时空化方面的存储与管理研究,更谈不上殊卷的时空演变分析与深层次数据挖掘。目前,GIS、空间分析与模拟等空间综合方法已被广泛应用于人文、社会科学的研究中,尤其将GIS技术作为人文、社会信息的采集、分析与展示平台已成为人文、社会科学的重要研究方向和热点。本文将GIS技术应用于殊卷时空数据的采集、组织、管理以及分析中,结合华夏家谱GIS统一时空框架,设计面向多学科领域研究应用的殊卷信息分类体系与殊卷时空数据模型,建立殊卷GIS管理系统。从而实现基于殊卷历史地理描述框架的殊卷文本内容的数字化、结构化以及时空化存储与管理,为殊卷信息的定量与半定量分析、殊卷时空演变分析以及深层次数据挖掘提供数据基础与技术支撑;为正史、方志以及华夏家谱GIS的研究提供数据支持,拓展殊卷的研究应用领域。基于上述分析,以殊卷原始文件为研究对象,本文的研究内容与成果主要包括下列三个方面:1)针对硃卷数量巨大、内容庞杂的特点,对殊卷文本的内容组成、殊卷时空表达特征以及殊卷时空演变特性进行分析与总结,并对其潜在的研究应用价值进行调研与预测。将时间、地点、事件、人物以及人物社会关系五大要素作为殊卷信息分类对象,并以时间表征内容、空间表征内容、事件性质、人物身份、出身以及人物社会关系等作为直接分类依据,研究殊卷信息的分类标准与对应的等级层次,建立面向多学科领域研究应用的殊卷信息分类体系。2)基于殊卷时空表达特征、殊卷时空演变特性,结合殊卷信息分类体系与华夏家谱GIS统一时空框架,研究殊卷历史行政区划、历史地名、书院、官署以及贡院等地理实体的统一描述框架与组织方法以及殊卷时空信息与语义信息的内在联系,建立基于Geodatabase的殊卷时空数据模型。3)以殊卷时空数据模型为基础,研究殊卷中表达方式多样的时空信息、语义信息的自动、半自动解析与标准化处理方法,建立基于Geodatabase的殊卷时空数据库与殊卷GIS管理系统,实现殊卷信息的有效存储与管理。