文档相似度相关论文
作者分类是按照作者的写作风格将作品分类的过程。作者分类是文本分类的一种。风格特征集合的选择是作者分类的关键问题。 本文......
随着信息产业特别是互联网的高速发展,人们可以很容易得从互联网、数字图书馆以及公司内部网络获得海量的数据。这些数据按照其组织......
随着社会信息化进程的不断发展,人类对信息的需求和依赖程度越来越高,如何从海量信息资源中快速有效的获取有用信息,已经成为人们研究......
近几年来,随着社会信息化进程的不断深入发展,人类对信息的需求和依赖程度越来越高,如何从海量的信息资源中快速有效的获取有用的信息......
随着互联网的高速发展,搜索引擎为用户获取各种信息提供方便,但随着数据量、信息量的大幅增长,存在着信息过载的问题,用户如何从海......
聚类是一个重要的基于统计的无监督信息处理工具,在很多应用领域起着基础的作用。其中,文档聚类是对文本文档进行聚类的方法,对于......
基于SaaS的在线服务数量日益宠大,使得如何有效的查找特定的服务成为突出问题.目前普遍采用用户自定义的服务标签来标识服务,并通......
为了弥补树编辑距离方法时间复杂度高和频繁路径方法丢失过多语义信息的不足,建立XML文档的双向路径约束模型,从而更全面地提取XML......

