论文部分内容阅读
科技情报的及时发现与迅速传播对新理论和新技术的创新和应用起着极为关键的作用。根据科学交流理论,科技情报主要分为正式型(即科技文献类情报)和非正式型(网络环境下指在线的科学交流信息)两种。
科技文献检索是正式型科技情报交流的主要方式。信息技术的飞速发展和互联网的广泛应用为文献检索带来了新的模式,如开放存取和在线检索。然而,已有的研究表明,现有的文献检索系统并不能解决跨学科检索问题使得文献引用仍然停留在狭窄的领域之内,限制了新想法和新技术的传播和应用。
在非正式科技情报交流中,Web2.0技术的应用使科学家们能够方便的在互联网中公开的进行交流和探讨。但是,由于这些讨论是在自组织的方式下进行的,所产生的在线科技情报无序地分布在网络中,很难对实际的科学研究形成真正的指导。
因此,提高科学文献检索的效率和准确度,及时从在线科学交流中获取高质量的情报,掌握在线科技情报的传播规律和发展趋势,对科研本身起着巨大的推动作用。
针对以上问题,通过对国内外科技情报研究工作进行仔细分析和总结,本文主要从以下三方面进行了深入的探索和研究,以提高科技情报为科学研究提供及时、有效、准确、全面的服务。
一是对科技情报的获取方面进行研究,通过编写专门的网络爬虫获取主流学术媒体中的科技文献以及开源科技情报,并从中抽取相应的特征数据。设计了基于关键词的文献目录自动构建,以克服传统的专家目录对经验的依赖,并能不断地自动更新、扩充和完善。
二是在对科学关系网络进行复杂网络分析的基础上,对科技情报的分类和检索方法进行研究。本文在传统的Bayes网络分类算法基础上进行改进,提出一种基于语义的文本分类方法。同时,提出了基于作者合作关系网络和文献引用关系网络的相似度计算方法,体现了合作关系和引用关系在文献检索中的地位和作用。最后基于这两种方法设计了支持跨学科检索的科技文献检索系统,并采用分级精确的方法对系统进行验证和评估。
三是对学术博客中开源科技情报的传播规律、发展趋势进行研究。应用经典的Logistic阻滞增长模型对学术博文的传播进行量化分析,并根据实际传播条件对Logistic模型进行修正,进而为开源科技情报的传播进行数学建模,探索学术博客的传播规律和机制,预测学术博客的发展趋势,提高科学交流的水平和效率,为对科学研究进行决策支持提供新的方法和思路。