论文部分内容阅读
随着知识经济时代的到来、网络信息技术的迅速发展,信息管理必须适应形势,转变理念,而作为信息管理关键一环的信息服务也必须调整转变服务,改变服务方式,以更好地适应时代的发展。
在网络环境下,情报用户需求及其认知结构都得到了扩展:用户范围的扩展,人机直接交互,用户信息行为更加主动,用户获取信息方式多样,并且用户在信息需求、搜索、检索、信息利用过程中的认知心理、认知行为、认知能力都呈现出了新的特点,这使得我们面向用户开展信息服务成为必然。
一网络信息组织结构网络信息资源组织是对网络信息进行整序与加工,使其呈有序状态。标识语言和数据格式是网络信息资源组织的切入点,是网络信息资源组织的基础。
HTML(HypertextMarkupLanguage)是一种用来描述WWW上超文本文件的标识语言。它主要是在原来文本文件的基础上,加一系列的标识符号描述其格式,形成网络文件,当用户使用浏览器下载文件时,就把这些标识解释成它应有的含义,按照一定的格式,将这些被标识文件显示在屏幕上,而HTML的标识符号并不显示在屏幕上。
XML是一种元标注语言,是一系列定义文档元数据的规则集合。它规定了数据的语法和语义结构;它保持了用户界面与结构数据的分离;它允许用户根据不同的数据和文档内容制订标记,是一种扩展性的标识语言。
元数据是“结构化的编码数据,用于描述载有信息的实体特征,以便标识、发现、评价和管理被理解的这些实体。”就元数据的功能而言,在信息资源组织中,它具有定位、描述、搜索、评估和选择等功能,而其最基本的功能在于为信息对象提供描述信息。
二信息用户研究用户研究的基本内容包括:用户类型研究。类型研究是用户研究的一项基本内容,是开展用户信息需求分析的基础。
用户信息心理研究。利用心理学的理论研究用户需求和吸收信息的心理过程和状态,分析其中的各种因素,探索用户的心理—行为规律。
用户信息需求的调查分析,调查和分析用户的信息需求是设计和建立新的信息机构和信息系统的依据,也是开展高水平的信息服务与咨询活动的需要。
用户获取信息的研究,研究用户获取信息的途径和方式,从社会交流的高度对各种渠道加以比较与分析,使信息交流适应科学技术和人类社会发展的需要,是这一研究工作的目的。
用户吸收信息的机理研究。主要内容包括用户对信息的评价,信息的使用价值及其测量,用户吸收信息的机理和创造过程研究。
用户信息保证研究,主要探讨信息保证的一般原理与方式,研究各类用户信息保证的特点、途径与手段,评价信息保证工作的质量,分析其效率等。
用户信息培训研究,主要研究用户信息培训工作的组织原则、方式和内容,从提高用户的信息素质出发,探讨信息系统与信息用户之间的某些不协调问题的方法。
用户研究方法论。研究用户研究中的方法体系是方法论研究的基本方面。
三用户检索模型信息查询行为的一般模型。在这个一般模型里,信息查询行为是信息行为的一部分.信息查询行为的根源是信息需求,因为需求是一个主观过程,我们只有通过行为或人的需求记录才能发现其需求。
信息检索的认知理论。大多数的信息查询系统有三个部分:用户、专家中介、检索系统。我们所提出的框架有两部分组成:用户和信息查询支持系统。为了整合知识表达的元素和行为,我们使用通讯规则。这便形成了信息检索认知理论。Infovine是一个软件系统,其把常规的信息检索和人际间检索成功地整合在一起,来提供一个强大、灵活的工具。人际检索是找出谁会了解一特定主题,并向他(他们)寻求建议和信息的过程。当越来越多的人通过网络可用于这个目的,就有必要建立一种方式,来找出给予建议的最合适的个人。
基于概念的信息检索。所提出的基于概念的信息检索模型中,其中概念词典是模型的接口,是从词汇到概念的桥梁,它里面包含了语法和词汇信息,它是整个模型的核心。基于概念的数据库不仅保存文档,还给出了文档抽取出的概念及频度信息。
四用户服务建立整合的知识结构贮藏库。我们所创建的一整合贮藏库,其能够包容同义词典、分类方案、主题图、概念分类体系和其它一些知识表达形式中所使用的知识结构。这个系统还提供定制工具,允许用户自己为自己的主题设定知识结构,并让用户决定如何表示和浏览这些结构。
元Web服务—构造以Web服务为基础的基于Web的开放决策支持系统(DSS)。元Web服务采用了语义网技术和Web服务技术来支持网络服务周期的一部分。这些决策单元彼此合作,为用户提供解决方案。
网络信息服务模式。我们可以把网络信息服务模式概括为“认知—应用—创新”模式。
个性化信息服务的类型。在个性化信息服务系统中,用户可以根据自己的需要,选择不同的信息资源;依据自己的习惯,指定信息的显示方式。
五案例分析Google的优势在于掌握的信息量以及检索模型和检索速度。Google的核心软件称为PageRank(TM),这是由Google的创始人LarryPage和SergeyBrin在斯坦福大学开发出的一套用于网页评级的系统。虽然他们每天有很多工程师负责全面改进Google系统,但是,仍把网页级别(Ps-geRank)作为所有网络搜索工具的基础。
BACIIS(BiologicalandChemicalInformationIntegrationSystem)是基于信息整合方法来应对与在不同的生物数据库中不相兼容性相关的挑战。其可以透明地进入一些异质数据源而不需要把他们复制到一个数据贮藏库中。BACIIS使用调节器—打包器方法,而BAO是这一方法的概念体系的核心。其用于简化生物网络数据库中的相互操作性。
六结论6.1通过对GOOGLE案例的分析,我们可以得出这样的结论。6.1.1采用了先进的网页级别(PageRankTM)技术。这种独树一帜的技术打破了传统网络分类概念,它是基于网页的自然结构,即任何网页均可直接地连接到另一网页,而无须任何媒介。6.L2在同一个界面下,用户可以定制语言和到何种网站中进行搜索。因为Google将多国语言的搜索引擎整合到同一个界面,供用户方便选择。目前,Google已可以对包括中文简体、中文繁体、英语、日语、法语、、俄语、希伯来语等26个国家和地区的语言文字进行搜索。6.1.3Google的搜索结果,通常会比其它搜索引擎来的更准确。当用户输入关键字作Google搜索时,Google不仅会去搜索包含关键字的网页,同时还会搜索和这些网页具有高相关性的网页。并根据相关性的高低排列出次序,以确定该网页的质量或重要度。6.1.4当用户在查询时,同时提供多个关键字,Google将只提供包含所有关键字的网页,其正文或指向它的链接包含用户所输入的所有关键字。而且,Google还能遵从关键字的相对位置,不仅搜索出包含所有关键字的网页,并且对网页关键字的接近度进行分析,按照关键字的接近度区分搜索结果的优先次序,筛选与关键字较为接近的结果。从而节省了查阅时间,同时也大大提高了查询结果。
总之,GOOGLE之所以受到众多网络用户的青睐。关键在于其先进的网页识别技术(PAGERANK)对应人们的认知结构,符合人们认识事物的一般规律。可以在最短的时间内让用户找出他(她)最需要的或最易满足他们的信息需求的网站。其次,GOOGLE的界面友好,提供同一界面的多国语言检索,这样,既可以满足持不同语言的用户的个性化输入,又可减轻用户的信息检索负担,使用户更能轻松的表达自己的个性化需求。
6.2通过对案例2语义整合信息检索结果的全过程的分析。我们可以得出这样的结论。6.2.1整个BACIIS系统架构的核心是BAO(BACI工Sontology),其由三个层次组成:对象、关系和性能。BAO提供了核心的语义知识,这些语义知识允许并支持BACIIS其他组件来完成各自的语义过程,以最终输出一语义整合后的输出结果。6.2.2BACIIS可以借助数据源图式进入各个相关的网络数据库。这些数据库的数据源是异质的,但BACIIS可借助数据源图式所描述的每一个网络数据库的特定规则及ontology性能的分类来进行相应检索,而不需要把这些异质数据复制到一个数据贮藏库,从而可以简化网络数据库中的相互操作性。6.2.3用户的参与过程:6.2.3.1BACIIS语义检索式的构建。BACIIS网络界面引导用户通过对BACIIS中的概念和关系导航来创建检索式。每个检索式包括两部分:输入部分和输出部分。每个输入部分包含一个