基于Maze系统的文件资源关键词生成算法与应用

来源 :北京大学 | 被引量 : 0次 | 上传用户:IDYLL123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Maze系统是有中央服务器结构的P2P网络文件资源共享系统。本文的研究主题是基于Maze系统下的文件资源关键词详细生成算法和文件资源关键词的各种具体应用技术。 第一部分提出了为文件资源生成关键词的意义,设计了关键词的产生模型和生成流程,并给出了详细的关键词生成算法。在具体的生成算法中,论文着重介绍了词典的选用、生成原理和生成方法,以及根据系统收集的用户对文件资源的评价,调整关键词权重(词权)的设计方法和具体实现。最后,将具体的结果通过网页的形式向用户进行展示,并采用“盲测”的方法对关键词生成效果进行了评测,提出了改进关键词生成算法的方法。 第二部分给出了文件资源关键词的多种具体应用方法和实例,并对部分方法进行了初步的实现和评测。这些方法包括:根据文件资源关键词进一步匹配更翔实的外部资源信息,并且根据资源信息反匹配文件资源;通过文件资源关键词验证文件的真实度,进而识别系统中的虚假文件;通过文件资源关键词更准确的识别和过滤系统中的特定文件资源;定义了关键词词条之间的关联度和文件资源之间的关联度等。
其他文献
本文的研究工作基于“搏邦综合业务管理平台”(IBMP Office)的设计与实现,有效地将Web Service技术应用到综合管理平台的研发中。 先就系统使用的Web Service技术进行了研
随着网络技术的不断发展,Internet技术已经渗透到日常生活和工业生产的各个领域。这使得远程监测成为现实。JAVA是当前比较流行的一种网络设计语言,它最大的优点就是操作平台的
随着科学技术的迅速发展,人们生活各个方面都发生了重大的变化。监控技术的重要性正在逐渐被人们所认识和重视。目前,监控技术已经广泛应用于生产、生活等各个领域。铁路部门作
本文致力于用基于启发式学习+Q-学习的启发式Q-学习来解决在非合作泛和博弈框架下随机博弈的Nash均衡解的求解问题。决定一个有限状态随机博弈的Nash均衡解是否存在是一个NP-
设计模式以文档的形式把面向对象的软件设计经验记录下来,并予以系统的命名、解释和评价。其目的是使开发人员在进行系统的设计与开发时,可以使用前人的成功经验而不必为普通的
移动通信和互联网是当今信息产业发展的两个热点,两者融合产生的移动互联网及其应用,为信息产业带来巨大商机,两者相结合的产物WAP,是开发移动网络上类似互联网应用的一系列规范
“软件危机”,这一始于上世纪60年代的概念,始终伴随着软件业的整个历史发展进程。为了解决该问题,人们逐渐开始借鉴一些传统领域内的管理理论、方法和工具,以期解决软件开发中所
近年来,由于在商务管理、市场分析、决策分析、科学探索等领域的实用性,数据挖掘已经引起了广泛地关注。在数据挖掘中,聚类技术是一个很活跃的研究领域。聚类就是将物理或抽象对
支持向量机(Support Vector Machines简称SVM)是在统计学习理论的VC维理论和结构风险最小化原则的基础上提出的一种新的模式识别技术,它寻求的是在有限样本情况下的最优解而不
近年来,随着移动用户规模日益扩大,基于移动通信网络的定位技术发展迅猛,移动定位也因此受到广泛关注。网络中各种基于终端位置的定位服务,如安全援助服务(紧急医疗、紧急定