论文部分内容阅读
在智慧城市背景下,随着现代科技的不断发展进步,各企事业单位都建立了各自的信息系统,实现了数据的信息化和网络化管理。但是由于各公司存在职能上的差异,其信息系统也都是由不同的开发人员在不同时期、不同平台上开发和实施的,只考虑了系统自身的业务需求,导致系统平台、数据库技术、数据结构、查询语言等都不相同,积累了大量以不同形式存储的、依赖于不同数据库管理系统的数据,即异构数据。这些异构数据存在明显的结构异构性、分布性和自制性,使得各信息系统之间不能进行信息的共享,从而形成了“信息孤岛”。因此如何实现异构的数据集成,变得尤为重要。目前国内外已经有许多异构数据集成方案被提出,有效地解决了一些异构问题,尤其是语法上的异构。但是关于语义异构一直没有得到很好的解决。本文主要引入本体的概念来解决异构数据集成中遇到的语义异构问题。本文首先阐述了异构数据的概念和异构数据集成的目标,总结了几种典型的异构数据集成体系结构及其优缺点。之后又引入了本体的概念,总结了本体用于异构数据集成的方法及优势,给出了基于本体的异构数据集成系统的整体体系框架结构,并在此基础上讨论了集成过程中的关键问题。接着本文对本体映射进行了研究,在分析了现有本体概念相似度计算方法后,提出了一种改进型的综合领域本体相似度计算方式。该算法首先通过在世界知识体系内查找概念是否存在,避免了领域本体内概念相似度计算的局限性,同时又结合了基于概念语义、概念属性和概念结构的方式来计算综合相似度,避免计算过程的单一性和片面性,达到提高领域本体相似度准确性的目的,为本体间的映射及后续的查询扩展奠定扎实的基础。最后本文将提出的改进型综合领域本体相似度计算方法应用于个人公共事业费账务管理平台,将该算法运用于实际异构数据系统中进行了算法验证,经比较可证明该算法相比于传统的单一概念相似度算法有较高的匹配成功率和更高的匹配准确率,其综合匹配率优于单一算法。该算法的应用可屏蔽异构系统底层的异构数据,实现用户在统一的平台上“一站式”地查询个人公共事业费账单的功能,体现了改进型算法的应用价值。