论文部分内容阅读
针对目前互联网搜索引擎主要使用全文检索技术,无法从W eb页面中提取元数据信息情况,设计了一个基于信息组织模型的W eb元数据信息提取和检索系统。使用基于正则表达式的元数据信息提取模型,信息提取和索引程序不断从数量巨大的W eb页面中提取元数据信息,对本地元数据库进行不断地更新。抽象了多种W eb信息组织模型,设计了相应的信息检索模型,并且这些模型可以大范围地应用于提取W eb站点的元数据,所采用的方法充分利用了W eb页面的数据结构,避免了采用复杂的语法、语义分析,为面向多个领域的元数据信息检索做