论文部分内容阅读
提出一种基于模型匹配的深网(Deep Web)在线专业数据库查询接口特征抽取方法,该方法通过分析网页结构中特征词的深度自动抽取查询接口特征向量,同时考虑频度和集中度两种因素定义特征词向量空间中的权值,并在传统向量模型的基础上加入特征词个数作为一个新的分量,构建一个数据库查询接口,使用模型匹配的分类方法对其进行分类.实验验证了该方法的有效性.