论文部分内容阅读
交通运输信息标准是交通运输信息系统建设的重要依据,其本身应具有科学性、唯一性。然而,由于交通运输领域内的复杂性、相关领域之间的交叉特点以及标准编写人员对交通运输业务理解的差异性,让编写出的标准自身就存在重复性和不一致性规定,导致建设的标准失去了应有的价值,不能够权威的指导交通运输行业的信息化建设工作。而且随着交通运输业务的发展,标准本身也在不断的扩展和改进。为此,本文提出开发标准辅助性编写系统,让后续的标准编写能够参考已有标准的规定,从而提高标准的编制效率和一致性。通过对现有基础技术适应性的深入分析,本文对标准辅助编写系统的总体框架及其功能模块进行了研究和设计。首先,利用Jacob对Word文档进行处理,把已审批的Word标准文档抽取为结构化的字符流信息,并将其内容存入数据库;之后,利用Ictclas中文分词器,实现对交通信息标准的可靠分词操作;最后,以标准检索的需求为依据,分析了Lucene索引检索框架,并利用Lucene检索机制实现对已有标准规定信息的快速检索,实现辅助编写功能。本文实现了标准检索系统的原型,并对交通信息的中文分词、标准内容的结构化抽取和标准检索几个功能模块进行了测试。结果表明,它们都达到了预期的目标。利用此系统标准编写人员可以快速参阅已有标准的规定信息,高效的进行标准编写工作。