科技主题识别及表示

来源 :第五届全国信息检索学术会议CCIR2009 | 被引量 : 0次 | 上传用户:hnbc2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
科技主题用来表征学科的研究关注点,是科技热点的具体承载对象。当前,科技主题获取的自动化程度不高,绝人多数都借鉴专家经验实现。结合自然语言处理领域TDT的研究成果,针对科技文献特征,借助链接分析及文本聚类方法对科技主题进行自动发现。并对科技主题的表示方法进行了讨论,提出了科技主题的框架式表示方法。实验证明科技该主题发现的方法是有效的。
其他文献
随着网络搜索用户的大规模增加,网络用户行为分析已成为网络信息检索系统进行架构分析、性能优化和系统维护的重要基石,是网络信息检索和知识挖掘的主要研究领域。为更好理解网
会议
每天有大量的信息涌现在论坛上,用户可以通过论坛获知目前国际国内正在发生的一些突发事件。这些突发事件或话题在论坛中并不是显而易见的,它们需要通过人工的总结与归纳。这需
会议
认识他之前,我不知道世界上有如此快乐的人,认识他之后,我不觉得世界上有任何事情可以夺走你、我、他的快乐!他是意大利声名卓越的制鞋师,是技艺超群的艺术家,是全身每一个毛孔都洋溢着快乐的天使!  您没有看错,我也没有写错,是鞋将,不是鞋匠,因为在我眼里Doriamo Maycucci绝不仅仅是一般的制鞋匠,他是制鞋师中的将军,是至高无上的存在。  绝非头脑发昏的小女生,也早过了盲目追星的年龄,此番如此
网络话题层出不穷,往往会引发重大舆情危机,如何快速高效的从海量信息中发现热点是一重大挑战.本文提出了一种基于主题词的网络热点话题发现算法。其基本思想为:首先综合主题词
会议
为部队服务是军队医院永恒的主题,54960部队医院称得上为兵服务的典范。近几年,该部队官兵对这个医院的信任率和满意率均为100%,都超过了全军要求标准。该医院连年被军区、集团军评为医疗
降维是在损失较少信息的情况下处理高维图像数据的关键技术,是高维数据预处理的重要步骤。本文研究了基于配对约束和混合核函数的半监督非线性降维方法KS2DR,该方法可有效利用
会议
搜索引擎日志是记录网络搜索引擎用户行为的重要载体,通过对搜索引擎日志的分析可以得到搜索用户的行为特点和规律。为了发现用户组织查询的规律,本文对Sogou中文搜索引擎一个
会议
目前,已提出的XML枝匹配算法返回的结果都是整个匹配枝,另外,当XML文档中存在递归结构时,一个目标数据元素可能存在于多个匹配的枝中。然而,通常情况下,用户只需要得到目标数据元素
会议
研究界关于相关反馈问题的研究已经有近30年的历史,相关反馈也被证明可以在很大程度上稳定地提升检索系统的性能。由于目前相关反馈的应用,以及用户提供反馈信息的方式都发生了
查询反馈是通过分析反馈文档来更改原始查询项。检索词在检索公式中的权重直接影响检索结果的质量,但是缺乏可靠的依据来设置检索词权重。本文将检索看作是一个二分类问题,在线
会议