网络中文信息发现与分类的研究

来源 :清华大学 | 被引量 : 0次 | 上传用户:ztldkd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet在中国的迅速发展,中文信息资源越来越丰富.帮助用户快速、准确地查找网络上有用的中文信息,成为近年来Internet上的研究热点.该论文对大型中英文信息发现系统的体系结构、检索原理、检索算法以及信息自动分类等方面进行了理论和算法研究,实现了应用系统.主要的研究工作有以下几个方面:(1)设计大型中英文信息发现系统-- "网络指南针(net-compass)"的总体体系结构.以中英文全文检索技术为核心,应用智能 的网络搜索技术、主题分类索引等实用性技术,设计并实现了实用性的信息查询系统.(2) 研究中英文全文检索原理.(3)提出一种新的字词结合的中文全文检索数据结构和高效的检索算法.(4)提出一种新的中文网页自动分类算法.
其他文献
图像压缩是数字图像应用的重要组成部分,随着互联网的不断发展,云上的语料库不断完备以及图像特征提取技术的日益成熟,图像压缩过程不再局限于利用图像本身像素点间的相关性
PCI总线是先进的计算机局部总线,它的突出特点是数据传送速度快、兼容性强,目 前已得到了越来越广泛的应用.大家使用高速A/D转换器及PCI接口芯片设计实现了PCI总线 的100MHZ
论文中首先介绍了l/f波动理论及其应用,主要阐述了什么是l/f波动,l/f波动的和谐特性,并对此作出了解释.此外,还介绍了l/f波动理论及应用研究的现状,并对其前景进行了展望.
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
首先建立了多分辨率目标跟踪方法的基本框架,并介绍了这种方法的基本概念.该中介绍了两种机动目标跟踪算法:多模型算法和交互式多模型算法,以及三种多目标跟踪算法:概率数据
随着用户对无线通信需求的大量增加,现有的稀缺的频谱资源正受到日益严峻的挑战,而对于私有频谱和公有频谱的不合理划分,使得该问题雪上加霜。针对该问题,Joseph Mitola在199
目的:研究积雪草甙对体外培养的人宫颈癌Hela细胞的生长抑制和诱导凋亡的作用,并通过检测凋亡相关蛋白Survivin和Caspase-3来分析其凋亡的分子机制。 方法:应用MTT比色法观察
近年来,图象压缩领域的研究更多地是集中在处理照片、图片、视频影象等供人眼观赏的图象方面,在衡量压缩质量时主要基于L准则.在L准则下,足够高的信噪比意味着压缩重建图象能
人群的活动轨迹看似杂乱无序,实则存在潜在的模式。Song等人指出人群移动性具有非随机性和周期性,人们总是频繁地出现在某些特定的地点,不管行为活动如何多样性,人群活动总是
该论文对HCL2000汉字库与高精度识别处法作了较为深入研究.论文完善并改进了HCL2000汉字库系统的功能,对该库进行了初步的统计分析,论证了职业特征对手写汉字样本识别率的影