论文部分内容阅读
早在上世纪60年代末,国外情报学者就指出,越来越多的机构出版互不兼容的主题词表会在很大程度上对信息交流造成巨大障碍。不同的分类法、主题词表对同一个主题概念的表达形式存在很大的差异,这种差异会对学术交流产生阻碍。为此,大批学者们从事对某一学科词表的互操作研究,以求能够得到一种方法使得用户可以在同一个学科领域不同机构之间的异构数据库和检索语言体系中实现跨库检索。而随着现代科学技术逐步向学科交叉方向发展,研究者们往往需要对多个领域进行深入了解。这种发展趋势对传统的文献情报工作也提出了挑战,越来越多交叉学科的科技文献需要依靠多个领域的情报检索语言进行标引和检索,在这种情况下对不同学科和领域的传统词表进行整合就显得十分必要。为了体现交叉学科的特点,本文选取了“交通运输词表”、“汽车工程词表”和“环境科学词表”作为“新能源汽车’’领域的组成部分进行概念集成试验。另一方面,互联网逐步向语义网的方向发展,而语义网是以概念体系作为基础的,这就需要在词汇层面构建完善并且可靠的“概念和术语体系”。而对多领域受控语言的概念集成,将不同类型的词表进行整合,可以对语义网的建设起到很大促进作用。
本文首先回顾了主题词表互操作领域的国内外研究历史和现状,细致比较和分析了现有国内外词表整合与互操作项目。结合以往的词表互操作理论,并在此基础上根据实际情况提出了适合于“跨领域科技词表集成”的基本思路和理论方法。在确定方法论之后,本文利用“交通运输词表”、“汽车工程词表”和“环境科学词表”作为实验词表,对跨领域主题词表的概念集成方法的细节进行研究和探索,针对概念集成过程中的“同义词发现”、“概念关系梳理与整合”以及新的概念集成系统的组织和管理三个方面进行了全面而细致的理论和实证研究。同时,结合三个实验词表的具体数据,利用Visual Foxpro数据库软件对相关词表进行分析处理,对文中提出的各种方法和实施方案进行可行性进行验证并取得第一手数据。最后,文章总结了研究所取得的初步成果并指出了当中存在的不足。