开源软件评估证据收集系统的设计与实现

来源 :北京大学 | 被引量 : 0次 | 上传用户:linco87
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
软件复用可以有效地减少在项目开发中的重复劳动。随着开源软件的快速发展,Internet上出现了越来越多质量高、应用广的开源项目。在软件复用实践中,开源软件逐渐成为了可复用构件的一个重要来源。  Internet上存在着大量的开源软件,质量参差不齐。如何从中选择优秀、合适的开源软件作为构件进行复用,是基于开源软件构件的软件开发中需要面对的一个重要问题。选择开源软件包括对开源软件的质量、功能等方面进行评估的过程。已有的研究表明开发人员经常会通过Internet收集与开源软件相关的信息,以此为依据选择和评估开源软件。因此,自动从Internet上收集对评估开源软件有价值的证据信息,既能帮助开发人员简化评估开源软件的操作过程,又能提供比手工收集更全面的证据信息,帮助开发人员更好地作出评估决策。  本文提出了一种开源软件评估证据收集方法,该方法考虑了开源软件在Internet上可收集到的评估证据特性,建立了适用于开源软件多种评估证据类型的收集流程和开源软件评估证据的描述模型。以此方法为基础,本文设计并实现了一个开源软件评估证据收集系统OSER(Open Source Evidence Repository)。此系统适用于多种开源软件评估证据,并可以灵活地扩展以加入新种类的评估证据及其收集方法。  本文主要工作包括以下几点:  1)提出了一个以“评估源信息”为过渡的两阶段开源软件评估证据收集流程。该流程抽象自多种具体评估证据的收集过程,能够适用于本文涉及的常见开源软件评估证据。此评估证据收集流程是本文其他工作的出发点和基础。  2)研究实现了Internet上常见的开源软件评估证据及其收集方法。这些证据包括Maven库pom文件中的jar包依赖关系,SourceForge、ohloh网站开源项目页面中的用户数、用户评价,源代码包中的缺陷数、测试用例等。本文详细叙述了收集上述证据的技术和算法。  3)提出了一个开源软件评估证据的通用描述模型。该模型基于两阶段的评估证据收集流程,包括“软件资源”、“评估源信息”、“评估证据”三个核心概念。此模型用于描述本文列出的各类开源软件评估证据。  4)实现了开源软件评估证据收集系统OSER(Open Source EvidenceRepository)。OSER的设计基础是两阶段评估证据收集流程和评估证据通用描述模型。此外,OSER考虑了证据的更新和扩展机制,能够更灵活地完成对开源软件评估证据的收集。  本文所研发的OSER与北京大学TSR软件资源库相集成,为TSR资源库中的开源软件jar包收集了评估证据,辅助TSR资源库实现了对这些jar包资源的可信评级。
其他文献
随着科技水平的不断提高和电子计算机的出现,人类探索世界的工具、方法和实验环境发生巨大变革,已经由远古时期的经验性考察转变到以处理、分析和挖掘海量数据为核心的阶段。科
由于数字化终端设备的轻便性以及丰富的电子阅读资源,人们越来越多的采用电子阅读方式。智能电子书是嵌入学习方法、效果测评的等智能功能、依学习者特点动态显示内容的电子书
随着移动技术的不断发展,智能手机上的应用和数据越来越多。但是,智能手机存储容量小,易丢失,所以需要为用户提供更加可靠,透明的存储解决方案。虽然网络文件系统可以很好地满足这
在高度信息化的今天,网络与信息安全问题越来越突出,信息系统安全保障的意义变得越来越重要。中国信息安全测评中心提出《信息系统安全保障评估框架》(GB/T20274),用以解决对
混杂系统是指即存在着连续状态,又存在着离散状态,连续状态和离散状态之间既相互联系,又相互作用的一个系统。混杂系统主要解决的是实际工程中需要解决的问题。而半代数混杂系统
随着计算机技术近几年的飞速发展,移动互联网的盛行都达到了前所未有的高度,应用的增长速度超过了以往任何一个时期,与之相应的各种数据积累也达到了新高度,大数据时代无疑是
随着新能源汽车的不断发展,其涉及的各个业务部门均建立了自身的信息平台,但由于各平台采用相对独立的架构和标准,从而导致出现“信息孤岛”。然而由于各系统功能并非完全相
随着流程工业与计算机技术的迅速发展,制造执行系统(Manufacturing Execution System, MES)在流程工业中得到了广泛的应用,使得数据校正技术也拥有了很广阔的发展前景。论文
随着企业的信息系统越来越庞大,产生的客户数据量越来越多,为了从这些数量不断增加的客户数据中获得“唯一的准确版本”,很多企业开始部署企业客户单一视图(ECIF)。它被认为是探知客户数据真相的途径之一,它创建和维护着一个企业内主题域和系统内相关客户数据以及跨主题域和系统间相关客户数据的实时性、一致性和准确性。但是ECIF实现起来并不容易,在企业进行部署时会面临巨大的障碍,包括人员、流程、管理和费用等许
在当前科技大环境下,互联网技术几乎已经普及到人类社会的所有领域,数字图像作为互联网中信息的重要传播媒介呈现爆炸式增长态势。海量的数字图像信息在为人们的生活和工作带来