论文部分内容阅读
Maze系统是有中央服务器结构的P2P网络文件资源共享系统。本文的研究主题是基于Maze系统下的文件资源关键词详细生成算法和文件资源关键词的各种具体应用技术。
第一部分提出了为文件资源生成关键词的意义,设计了关键词的产生模型和生成流程,并给出了详细的关键词生成算法。在具体的生成算法中,论文着重介绍了词典的选用、生成原理和生成方法,以及根据系统收集的用户对文件资源的评价,调整关键词权重(词权)的设计方法和具体实现。最后,将具体的结果通过网页的形式向用户进行展示,并采用“盲测”的方法对关键词生成效果进行了评测,提出了改进关键词生成算法的方法。
第二部分给出了文件资源关键词的多种具体应用方法和实例,并对部分方法进行了初步的实现和评测。这些方法包括:根据文件资源关键词进一步匹配更翔实的外部资源信息,并且根据资源信息反匹配文件资源;通过文件资源关键词验证文件的真实度,进而识别系统中的虚假文件;通过文件资源关键词更准确的识别和过滤系统中的特定文件资源;定义了关键词词条之间的关联度和文件资源之间的关联度等。