产品分类的语义分析及其形式化研究

来源 :武汉大学 | 被引量 : 2次 | 上传用户:xialiaoj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
产品分类描述和定义产品的技术参数,给定产品分类代码结构,使产品的查询、发布、统计汇总和数据一体化,使产品数据通俗易懂、便于常规处理,为不同组织、不同生产厂家生产的产品建立标准,使得实时获得的产品信息具有系统性、一致性,且可共享。在大数据时代,每时每刻都发生着商品交易,每天都有海量的与产品相关的数据产生。针对海量数据,其处理思路为:一种是基于数据挖掘技术对那些非标准化、非结构化、半结构化的数据进行挖掘,找出数据之间的内在联系;另一种是事先对数据进行标准化、结构化,使之有序,也就是先做好信息组织工作。产品分类正是对应了后一种思路。但是产品分类有着类目线性排列与网状关系的矛盾、语义表达能力有限、概念的专指度受限、周期长更新慢、使用过于专业等五大固有缺陷。语义分析是克服产品分类固有缺陷的前提。为了更方便用户使用,研究者们已经做了大量的工作,提出用语义的方法克服产品分类的固有缺陷,甚至用OWL Lite完整书写了ecl@ss。遗憾的是还未见对产品分类本身进行深入的语义分析,消除产品分类中的不合理语义,细化其语义。因此,要突破类目线性排列的限制,增加网状关系,丰富语义,提高类目专指度,必须对产品分类法进行深入的语义分析。形式化就是产品分类的知识表示。一是要形似,即能完全表达现有产品分类的体系结构;二是有足够的语义表达能力,即能充分表达产品分类中各种语义关系。三是推理的可判定,即在有限的时间内,能给出明确的结果。本文针对产品分类中的系统性问题与应用中的问题,通过对产品分类进行人工语义分析,找出其中的内在语义关系,利用逻辑描述工具将语义关系形式化,构建本体,使人们使用产品分类时,从形式匹配转到语义匹配,为不同产品分类之问的相互转换提供映射工具,提高用户的查询效率。本文所构建产品分类本体不是用来取代现行的产品分类法,而是作为用户与产品分类之间的桥梁,使用户的查询通过产品本体映射到产品分类法中去;作为不同产品分类法之间的桥梁,使不同产品分类法在语义匹配的基础上进行相互转换。本文主要内容有:第一章绪论,在理解了产品分类的意义、调研了产品分类的研究现状的基础上,针对产品分类存在的问题提出了相应的研究内容。第二章产品分类,详细回答了本文研究对象问题。通过产品分类产生与发展的介绍进一步说明产品分类在经济生活中的重要性。在众多产品分类法中,按照广度、认可度、精度、便捷度四项标准,对当今国际上通用的六个产品分类法进行选择,最终确定GPC与ecl@ss为本文的研究对象。对GPC与ecl@ss进行的全面介绍,深入剖析了这两个产品分类法的体系结构,提出人们希望的产品分类的图景。第三章产品分类的形式化表示,详细介绍了本文的理论基础——描述逻辑。为了使产品分类从提供信息转变到提供知识,需要将产品分类形式化。在众多的形式化方法中,找到了既有足够的表达能力、又有很强的的推理能力、且推理的复杂性为可控的是可判定的描述逻辑作为本文知识表示的工具。通过描述逻辑的层次展开避免了推理中的逻辑循环,说明了推理的可判定,推出了用描述逻辑代替自然语言表达概念定义目前是不可能的结论。介绍了实现描述逻辑的语言OWL。第四章语义分析及本体构建,语义分析保证了概念的正确性,针对在概念划分、类目处理、属性处理、语义细化中存在的问题,提出了处理问题的原则,并按照原则进行具体处理。根据语义分析的结果构建产品本体。第五章本体查询,将检索词与产品分类本体匹配,经过添加了推理规则的推理机及SparQL的推理查询得到查询结果,并对结果进行分析,验证了所构建的产品分类本体概念的正确性、语义的完备性与推理的可判定性。第六章总结与展望,包括逐一回答等级体系产品分类固有五大缺陷是如何解决的,解决的程度;逐一回答Martin Hepp提出构建和使用产品分类本体六大困难是如何解决的,解决的程度;本文有待改进的地方以及后续的研究。本文的创新之处有:(1)通过深入的语义分析,找出了GPC与eCl@ss中概念划分、类目处理与属性处理的不合理之处,并予以调整;细化了它们的语义。在此基础上构建了这两个产品分类法的部分本体。(2)实现了产品本体的查询实验系统,通过在该系统中添加推理规则,验证了产品分类本体概念的正确性、语义的完备性、推理的可判定行。(3)对等级体系产品分类存在的五大固有问题,在其中四个问题上都有显著进步。对照等级体系产品分类的五大问题,本文取得的进展有:(1)类目线性排列与网状关系的矛盾产品分类本体继承了等级体系,但在此基础上,添加了类目之间的横向联系,使原有的线性关系不破坏的情况下,变成了网状关系,克服了原来的矛盾。(2)语义表达能力有限产品分类本体细化了类目之间的关系,强化了类目属性,通过属性词典的建立及属性词典的编排使产品分类的知识更加丰富,语义表达能力有了大幅提升。(3)概念的专指度受限产品分类本体打破了原有产品分类层级限制,调整了逻辑混乱的类目,可以达到理论上的专指度。(4)周期长、更新慢产品分类本体不能解决该问题,在此问题上没有任何进展。(5)使用过于专业产品分类本体进行了大规模的语义扩展,在推理中层级关系、等价关系、反转关系及类与属性关系可极大方便用户对产品分类的使用。本文系国家社会科学基金重大项目“基于语义的馆藏资源深度聚合与可视化展示研究”(批准号:11&ZD152)的组成部分和研究成果之一。本文系国家社会科学基金重点项目“基于知识组织的产品分类本体研究”(批准号:13ATQ005)的组成部分和研究成果之一。本文系教育部人文社会科学研究项目“产品分类的语义分析及其形式化研究”(批准号:11YJA870014)的组成部分和研究成果之一。
其他文献
目的:研究探讨根管治疗失败的原因。方法随机抽取我院2012年4月~2014年4月根管治疗失败的80例患者为研究对象。根据患者临床治疗的资料及病历,分析患者治疗失败的原因。结果
废杂糖的资源化利用是高果糖浆生产行业迫切需要解决的问题。该研究首先通过高效液相、质谱和红外光谱分析,确定了杂糖成分为葡萄糖、果糖和聚合度为2~16的线性葡聚糖,包括葡
纳米TiO2具有稳定性高、低成本、无毒、光催化活性高等特点,广泛应用于太阳能电池、降解有机污染物等领域。然而,TiO2的禁带宽度较大(金红石相:3.0 eV,锐钛矿相:3.2 eV),只能吸
文化对语言,尤其对语言的词汇有着重要的影响。该文试从分析词汇联想意义的产生原因出发,探讨《高级英语》词汇的跨文化教学策略。
PLC程控-是可编程序控制器(Programmable logic control er),简称PLC。可编程序控制器是一种以计算机(微处理器)为核心的通用工业控制装置,目前已被广泛的应用于工业生产的各个领
目的探讨中西医结合治疗肝炎肝硬化顽固性腹水的临床效果。方法选取来我院进行治疗的肝炎肝硬化顽固性腹水患者156例,将156例患者按照治疗方式进行分组,分为治疗组和对照组两
《高级英语》是高校英语专业提高阶段开设的一门重要课程。结合高校英语专业人才培养目标,从文化,词汇,修辞与文体,写作,以及创造性思维能力培养等方面探讨如何实现该课程的教学目
《老人与海》是海明威最著名的作品之一,是一部寓意极浓的象征主义作品。在作品设计与描写的过程中,海明威赋予了老人、孩子、大海、马林鱼、鲨鱼和狮子各自不同的象征意义。
针对文本类翻译理论的局限,提出了基于"内外有别"原则的框架,以及新的外宣翻译理论模式,并利用排除法(排除消极因素),用具体案例演示了海西地区外宣翻译策略是如何建立与实施的。
进一步规范废旧金属(塑料)回收行业的经营秩序,促进企业合法经营,严厉查处影响环境、消防安全不合规、无证照经营等违法行为.为推动第一阶段专项整治,大沥镇镇长黄伟明主持召开