网络系统的工程监理、性能评估和故障检测

来源 :互联网世界 | 被引量 : 0次 | 上传用户:snake916
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  曙 光
  


  互联网的力量是巨大的,对于这个正在进行信息技术革命的时代来说,在信息网络技术上获得主动权,就跟在农业革命时代掌握耕作技术、工业革命时代掌握蒸汽机一样意义重大、至关重要。我国在工业革命中落后于现在的发达国家,而现在我们面对的是一次绝好的机会,只要抓住了这次的数字化机遇,我们的国家和民族就可以再一次展现辉煌。
  我们可以高兴地看到,现在各行业、各地区都在积极建设信息网络,开发和使用信息资源,网络基础设施和信息技术应用都正在迅猛地发展。在建设和开发中,各部门、各单位投入了大量的人力、物力和财力,并且毫无疑问都期望获得最好的收益。而最后的结果到底怎么样,信息网络基础设施建设的质量是否良好,信息技术应用的开发和配置是否合理,建设和开发方是否对工程项目进行了充分的检测,是否提供了用户日后维护和升级所需要的一切资料和文档,工程项目的验收项目是否完备……等等,各种各样的问题在以前其实都没有一个很好的解决方式。
  在以前建设的信息系统中,有很多是相当成功和优秀的。但是,也应该看到,由于这是一个新兴的产业,又缺乏相关的政策法规,也有一些信息系统存在各种各样或有意或无意的问题。可以说,在以前的网络基础设施建设和信息技术应用开发中,在一定程度上,用户在工程项目完成之前不知道最后的质量会怎么样,在工程项目进行中也并不完全了解其质量状况,甚至在完成之后也不真正清楚其软硬件的设计是否是最优的、系统是否可以长期稳定、快速地运行。而一旦出现用户可以觉察的问题(也就是说,有些时候是系统存在问题而用户没有觉察到或者不能确定的)的时候,由于整个信息系统组成的复杂性,并且不同的部分(例如布线系统和应用软件)一般都是由不同责任方完成的,对于问题责任的认定是一个很麻烦的问题,因此必然会出现各责任方的互相推诿,而用户则会受到很大的损失,甚至长时间影响到用户单位各种事务的正常进行。
  经过两年的酝酿和准备之后,最近信息产业部正式发表了《计算机信息系统集成资质等级评定条件(试行)》,并公布了首批获得该资质的企业名单。这个文件的发布对于规范我国的信息系统集成市场具有重要的意义,使得用户在选择集成商的时候有了一个客观而方便的指导,从而可以在很大程度上识别那些采取低质低价方式的不法集成商,选择一个真正质优价廉的系统集成公司,为建设优质的信息系统提供了有力的保障。
  自此,我们看到了信息系统集成的曙光。在不久的将来,信息系统集成产业必然会以一种全新的规范运作方式展现在我们面前。
  
  托起太阳
  
  信息产业部的文件给用户选择信息系统集成商提供了公正、可靠的指导,但是仅仅有指导是不够的,要保证每一个信息网络都成为设计合理、施工精良、运行稳定的系统,还需要其他更多的努力。
  一方面,我们固然可以寄希望于集成商自发地规范自己的行为,提高自身的技术技能,从而给用户建设出个个是精品的信息网络系统。但是,毋庸置疑,仅仅依靠集成商自身的完善是远远不够的,也是不切实际的。用户在这种情况下是处于完全的被动地位,我们需要的是用户能够以自己的主动行为了解、控制系统的质量,并从而保证自己的系统建成后是优秀的。
  如果说信息产业部的文件是信息网络系统建设的曙光,那么我们现在要做的就是让曙光成为真正的白昼,而这托起太阳、迎来光明的手段,就是由具有足够技术实力和充分公正信誉的第三方对信息网络系统的建设进行全流程、全方位的监理、评估和检测。
  我们知道,按照流程来说,信息网络系统工程可以分为四个阶段:系统方案设计,工程施工和软件开发,系统调试和验收,系统维护和升级。为了确保不合理的因素带来的影响尽可能地小,我们需要尽可能早地发现问题并予以解决。如果让隐患遗留到了后期。由于系统复杂性加大,干扰因素增多(并可能存在多种互相影响的隐患),将使得问题确诊的难度大大增加,并可能遗漏比较隐蔽的问题继续影响系统的运行,而即使完全、准确地确定了所有问题,并且全部予以圆满地解决,也必然使系统延期,或需要用户投入计划外的资金,给用户带来比较大的损失——而这已经是后期发现问题的最好结果了。更坏的结果是什么呢?那就是用户或者容忍问题的存在(如果用户比较幸运,问题是可以容忍的话),而在以后的长期使用中处于“痛苦”的境地;或者从存在问题的地方开始,全部重新建设!
  让我们先看看系统方案设计阶段。系统的方案直接关系到系统的性能,如果方案不合理,就好象是把好钢用在了刀背上;或者整把刀都是好钢,虽然刀刃也不错,却是大大的浪费。而且,在系统建成以后要改正方案的失误是很困难的,也必然要花费大量的资金。所以,必须对系统设计方案进行全方位的论证和考察。对于简单的网络系统,可以由具有丰富经验的技术人员人工进行分析论证,检查网络系统的拓扑结构是否合理、连接设备的配置和选型是否足够或浪费、系统负载是否存在瓶颈、系统运行起来以后是否是稳定的等等。而对于复杂的系统,则应该使用人工分析和系统模拟软件进行模拟相结合的办法,这样不但可以防止人工分析可能的遗漏,也可以得到更精确的结果。
  在工程施工和软件开发阶段,则主要是监督施工(软件开发)的质量和进度。检查其材料质量是否良好,考察工程人员(开发人员)的操作是否规范,工程(软件)进度是否按计划进行,工程(软件)过程中是否产生出了需要的技术文档等等。通过对这个阶段全面的监督和质量控制,一方面可以保证工程的质量,另一方面也可以方便以后的系统维护和升级。
  系统建起来以后,需要进行各种初步调试并最好进行整体的验收。由于在前面的各阶段都进行了很好的质量控制,可以想象这种情况下的调试将比调试没有严格监理和质量控制的系统简单得多。即使发现了问题,由于具有调试所需要的各种记录文件和技术资料,在监理和评估方技术人员的帮助下,也应该能够比较顺利地解决。对于最后的整体验收,监理和评估方会考察集成商的验收方案是否是完备和规范的,验收过程是否严格和客观,是否产生了用户日后维护和升级所需的各种验收文档和资料。并且在必要的时候,监理和评估方也可以对系统质量和性能进行独立的全面评估。用户通过参考集成商和监理和评估方各自独立的验收和评估结果,可以对系统的质量和性能有更准确和细致的了解。
  
  拨开迷雾
  
  从信息网络系统的方案设计开始,用户就需要具有足够技术实力和充分公正信誉的第三方对信息网络系统的建设进行全流程、全方位的监理;在系统建设完成以后,用户需要第三方参与对系统进行完备、客观的验收和评估。经过这样严密的技术保障后,应该说网络系统的质量得到了充分的保证。但是,任何手段都不是万无一失的,由于技术的限制、或者实际工作中的一点小小的失误,也许会在系统中遗留下暂时没有发觉的隐患;或者用户系统建设的时候没有第三方进行技术监理和评估而在后来的使用中发现了问题。即使用户网络系统的建设得到了良好的质量控制,没有遗留下隐患,由于网络设备的正常老化、外部环境的变化影响到了网络的运行、操作人员对配置的不合理改动等等因素都可能导致系统出现各种各样或明了或“神秘”的问题。这时候,就需要对网络系统进行故障检测了。
  由于现在的网络越来越复杂,往往涉及到多种介质类型、多种协议,并且常常要连接到外部的“未知”网络(典型的如连接到互联网)。而网络环境越复杂,发生故障的可能性也就越大,引发故障的根源也更难以确定。因此,网络系统故障检测是一项相当专业的工作,不仅仅需要合适的专业检测设备,更需要测试人员具有良好的分析能力、敏锐的洞察力和对网络知识广泛而深入的了解;同时,测试人员的经验也是至关重要的,往往会对问题的顺利解决起到决定性的作用。
  为了定位故障的根源,首先的一项基本工作是收集与系统相关的各种信息,以便对网络系统有全面和清晰的了解,例如网络系统的布线状况、使用人员的分布和对网络的使用情况,网络系统配置的网络设备、服务器,网络上运行的系统软件和应用软件等等。
  在掌握网络系统的情况之后,就需要去了解当前系统的问题了。为了尽可能全面地得到故障的状况,需要咨询各种各样的用户方人员,系统的普通用户、网络管理员、各类经理等等都在咨询的范围之内。在咨询过程中,发放调查表、叫用户演示问题的表现等等方法和手段都可以根据实际情况灵活地采用。在完成这一步之后,应该能够完整、清晰地描述故障现象。
  接下来,测试人员应该根据了解到的故障现象,充分利用收集到的网络系统信息、自己的经验等做细致的分析,并在需要的时候进行一些简单的检测。这样做的目的是为了缩小引发故障的范围,为进一步的详细测试做准备。对于比较明显的故障,往往能够在这一步就发现并予以解决。
  现在,我们可以制定详细的测试计划并予以实施。这时候,测试人员需要制定详细测试的方案,选择测试工具,并能够很好地分析测试数据,从中发现各种隐藏的问题。这不只是要求测试人员能够熟练的使用各种测试工具,还需要对各种网络技术(例如各种网络协议)有厚实的功底。
  最后,制定排除故障的方案也需要做很多方面的权衡,我们在实践过程中总结为十六字方针:“省钱省时,易管好用,瞻前顾后,皆大欢喜。”这些方针的意思主要就是下面几点:
  * 花尽量少的钱,但是要有很好的效果
  首先,毋庸置疑的是必须保证改造方案在实施后要有很好的效果,能够提供给用户一个更加良好的网络环境,让用户确确实实感觉到改进之后的网络比改进之前要更加快速,更加稳定。当然,改进方案的投资数量也是必须要考虑的,高的性价比比单纯的追求高性能更有实际意义。
  * 容易实施,能够很快很方便地完成,这包括政策上、管理上、行政上、工程上等各方面
  我们知道,一个新方案的实施总是关系到方方面面的,一个在技术上很好的方案如果实施起来会有其他诸如管理、行政上的难题,甚至与国家或部门的政策法规相抵触,那么这个方案就很难实施,也算不上一个真正的好方案。
  要使得一个方案既在技术上是优秀的,同时实施起来又没有其他问题,就需要考虑到各个方面,比如国家的政策法规、当事人的部门设置和管理、网络所处的物理环境、改造工程的实施等等。
  同时,还要考虑到新的方案在实施之后,应该让管理部门管理、维护起来比以前更容易、更方便。对于网络管理人员来说,长期面对一个管理起来麻烦、出了问题很难诊断、维护起来困难的网络是一件很痛苦的事情,也就必然导致管理松散混乱、出了问题不知道在哪里、发现了问题也不好解决的糟糕状况。
  * 尽量利用已有的设备,但是同时又具有很好的延续性
  现在的网络是一个快速发展的世界,新技术、新设备层出不穷,如果一味地追求新设备,而把已有的旧设备完全抛弃不用,不但会急剧增加需要的投资额度,而且也会增加方案的实施时间。所以,应该尽量利用已有的设备,避免浪费。
  但是,对于那些的确必须淘汰的设备和技术,又应该毫不犹豫地淘汰掉。这时候,如果过分考虑节省资金,往往会对系统性能有大幅度的影响,反而得不偿失。其实,前面已经说过,网络是不断推陈出新快速发展的,这种网络的升级应该说是普遍的,具有一般性。所以,考虑方案的延续性在任何时候都是必须的。
  只要我们的改造方案做到了以上这些原则,就一定是一个好的方案,其结果必然使使用人员满意、管理人员满意、测试人员也满意。
  
  结 束 语
  
  信息产业部发布的《计算机信息系统集成资质等级评定条件(试行)》表明我国已经意识到了规范信息网络系统的必要性和紧迫性。我们希望通过第三方的参与,能够使得这个规范得到真正的实施。其实,这种由第三方进行监理和评估的方式早已在其他行业中得到了广泛应用,我国目前也已经在有的信息网络系统项目上采取了这种方式,并收到了很好的效果。我们有充分的理由相信,这种由第三方提供网络系统监理、评估和故障检测的方式必将在我国信息网络这一产业的规范化中起到重要的作用。最后,再一次提醒一下:
  * 在信息网络的建设中引入第三方进行监理、评估和故障检测是完全必要的;
  * 引入的第三方必须具有足够的技术实力和充分的公正信誉。
其他文献
随着Internet应用的发展和日趋成熟,其系统的可扩展性和高可用性变得日趋重要。经过与客户、ISV、Web设计商的长期合作,以及在试验室的广泛测试,康柏公司为建立高伸缩性、高可用性的Internet应用提出了一个先进的体系结构——分布式Internet服务器阵列(Distributed Internet Server Array,DISA)体系结构,此体系结构摄取了常规的系统可伸缩性/高可用性的