论文部分内容阅读
标注系统是一种利用标签实现信息管理的系统:标签是由用户自由选择的、用于标注信息资源的关键词,系统基于资源的标注组织资源并创建标签云,即有限标签的可视化呈现,使用户可在了解资源概况的基础上通过点击标签浏览资源。在信息快速增长的现状下,标注系统与利用受控的词汇和结构实现信息管理的系统相比,具有资源组织更灵活、资源描述与用户视角更相符、资源查找操作更简便等优点,已在办公网络与个人桌面领域得到了极大重视。 在办公网络与个人桌面中,提供与用户相匹配的信息管理功能是标注系统应该满足的一项基本需求。然而在现有标注系统中,资源组织针对不同类别的用户与用户在不同状态下所贡献的资源标注不作区分,而且在此基础上,针对所有用户、用户的所有状态所提供的标签云和资源查找结果均相同。这种统一的标签云和资源查找结果很难与用户的具体类别和具体状态相匹配,导致标注系统的作用得不到有效发挥。 针对上述问题,本文研究现有标注系统的扩展,提出一种面向用户角色的标注系统,其以用户角色为依据实现资源的组织、标签云的创建与资源浏览的支持,以提供与用户的类别和状态相匹配的信息管理功能;而且,本文建立面向用户角色标注系统的一种结构,针对实现其关键组成部分的技术与方法展开研究,并以此为基础实现原型,该原型能够提供与用户角色较匹配的信息管理功能。 本文工作包括: 1.扩展现有标注系统,提出一种面向用户角色的标注系统。 建立一种用户角色模型以描述用户的类别和状态,在此基础上,面向用户角色的标注系统在资源组织、标签云创建与资源浏览支持三方面针对现有标注系统进行扩展;进一步地,从用户角色的许可维度,建立办公网络环境下的面向用户角色标注系统的一种结构,其中标签使用控制与标签选择是关键组成部分,前者针对用户的标签使用活动设置控制机制以避免标签泄露办公资源的敏感内容,后者从给定资源标注集的全部标签中选出有代表性的有限标签以创建标签云。 2.提出两种标签使用控制框架。 为了避免标签泄露办公资源的敏感内容,依据用户许可、结合资源属性与标签属性,针对资源标注、标签阅读与资源浏览的标签使用活动设置控制机制;首先提出标签使用控制框架TUCF,其中包括一个控制标签使用的模型和一种模型实施的架构;之后在框架TUCF的基础上,通过扩展模型与改进模型实施的架构提出标签使用控制框架TUCFM。 3.提出四种兼顾覆盖度与非相似性的标签选择多样化方法。 为了提高标签选择结果的多样化程度,采用综合考虑信息覆盖度与标签非相似性的思路,在最大化问题框架下提出四种新的标签选择多样化方法;在每种方法中,定义目标函数以同时量化标签集合的信息覆盖度与标签非相似性,并设计近似算法以求解相应的最大化问题,同时还对近似算法的近似比进行分析。 4.实现面向用户角色标注系统的一个原型,并针对该原型进行实验评估。 该原型基于所提标签使用控制框架与所提标签选择多样化方法实现。针对该原型进行资源标注与查找实验,实验结果表明所提标签使用控制框架能够很好地支持标签的使用,同时保护了资源的敏感内容。另外,利用公开的标注数据集,将所提标签选择多样化方法与已有标签选择多样化方法进行比较,实验结果表明所提方法能够取得更好的多样化效果。这两方面实验结果综合表明,该原型能够提供与用户许可较匹配的信息管理功能。 本文的研究成果对于改进标注系统的信息管理功能具有良好的实用与参考价值:面向用户角色的角度为标注系统的扩展提供了突破口,对于后续研究具有一定的指导意义;标签使用控制框架提高了标注系统应用于敏感办公领域的适用性;兼顾信息覆盖度与标签非相似性为标签云内容的多样化提供了新的思路;原型为标注系统应用于敏感办公领域的实现提供了参考。