论文部分内容阅读
Zipf定理揭示了一篇文献中词出现的频率规律,Luhn在Zipf定律的基础上提出了自动抽取有效词的基本思想。基于Luhn思想的传统信息检索长期停留在文献层次上,难以满足人们通过知识元获取知识的需求。为解决这一问题,本文从概念的内涵和外延的认识论出发,考察人们由“模拟”事物内涵和“模拟”事物外延提出的图灵机和Petri网构建两种不同的计算机系统。由此提出了知识信息谱分析概念,试图建立具有语义关系的知识元理论框架,实现一种计算机对知识的理解和处理方法。文中给出了最大熵法提取知识元的方法。试验证明这种方法实用、