论文部分内容阅读
随着互联网的发展,电子商务渗透到人们日常生活的方方面面。商品信息是电子商务中不可或缺的组成部分,贯穿了电子商务企业的业务运营和消费者在线购物的体验。然而,越来越多海量的、语义异构的、结构异构的、无序的商品信息涌现出来,不断地消耗企业的信息资源,也无形中增加消费者信息获取的难度。因此,企业内部以及企业与消费者之间对商品信息的集成和共享,已成为电子商务企业的难点问题。 由万维网创造者Tim Berners-Lee提出的关联数据(Linked Data)技术是语义网的关键技术,关联数据让数据发布者在互联网上发布和关联结构化数据,能够有效地维护数据的一致性与完整性。关联数据概念被认为是语义网的轻量级应用。越来越多的研究者和企业意识到关联数据的独特优势,开始将其应用到企业信息集成与共享领域。关联数据能够有效地减轻企业集成异构信息的复杂性,关联数据可以让计算机更好地读取这些数据,促进企业信息资源的共享和利用。 关联数据本身不会增加信息的语义含义,不具备语义特征。关联数据能够携带语义数据,而本体有明确统一的语义知识体系。本体(Ontology)在哲学领域是研究客观存在物,以一系列的共享词汇来描述领域内的概念以概念之间关系。起源于哲学的本体论在信息处理、人工智能、语义网等领域被赋予新的定义并受到广泛的关注和应用。本体可以理解为一个预先确定好的词汇集,用于定义特定领域中概念以及概念间的关系。基于领域本体的语义描述能够解决信息的语义异构与结构异构问题。 本文将本体与关联数据技术结合起来应用于电子商务企业商品信息集成与共享领域。首先介绍本体、RDF、关联数据等语义网技术相关概念;深入分析企业信息集成中存在的问题和基于本体工程或关联数据技术的语义集成方法的应用经验,针对电子商务企业商品信息集成的特点,提出基于语义网技术的商品信息集成框架;接着结合商品领域的特征,基于斯坦福大学的七步本体构建法,利用Protégé本体编辑工具构建一个具体通用性的商品领域本体,介绍关联商品数据集的数据关联方式,实现商品信息的语义关联描述;最后本文利用D2R平台完成关联商品信息数据集的构建,实现商品信息的集成,并介绍关联商品数据集的应用。 总体来说,本文的研究成果为电子商务商品信息集成的建立奠定了基础,利用本体和关联数据技术实现企业信息集成,为企业解决信息集成中的语义异构、结构异构等问题提供新思路。