【摘 要】
:
目前,XML(Extensible Markup Language)文档已被广泛用于电子商务、B2B通信、企业信息交换/集成、信息发布等应用领域。低效的XML解析会导致过度的内存消耗和过长的处理时间,
论文部分内容阅读
目前,XML(Extensible Markup Language)文档已被广泛用于电子商务、B2B通信、企业信息交换/集成、信息发布等应用领域。低效的XML解析会导致过度的内存消耗和过长的处理时间,成为低资源消耗和高性能应用的瓶颈。 StAX(Streaming API for XML)是为了加强用户对XML解析过程的控制而提出的处理XML文档的API。它允许用户以pull模式从XML流中解析事件,也允许将事件写入到XML文档中。与已有的处理XML文档的SAX、DOM相比,StAX具有其他解析方式所不具有的灵活性。本文重点研究了高性能的StAX解析器的设计与实现。 我们在详细分析了XML语法产生式的基础上,进行了下推自动机的设计,给出了StAXParser的设计,并介绍了StAXParser各个组成模块的设计和实现,实现了对XML文档的良构性解析。 随之,我们以软件工程相关理论为指导,对StAXParser进行了全面的XML兼容性测试。为此,我们设计了测试框架,并利用测试工具进行了自动化测试,保证了测试的高效率和高质量。同时,我们进行了API兼容性测试,使其成为了完善的基于事件的流式解析器。 最后,我们以XML Test为测试基准,进行了严格细致的性能测试工作,利用Boland Optimizeit和JProfiler等测试工具和自写代码进行了性能监测与跟踪,寻找性能瓶颈,并采用算法级和语言级的各项优化策略持续进行性能改进,使得StAXParser达到了比较好的性能指标。
其他文献
本文的目标是研究并实现科学数据库元数据注册系统。研究工作分为三个阶段进行:首先,综合分析比较了元数据互操作技术,从科学数据库元数据互操作问题的出现背景引出了国际上
人工智能研究者认为智能Agent必须能够采取某种理性方式维持其心智状态的一致性,进而认识到信念修正理论是Agent各种智能行为的逻辑基础。随着对多Agent系统研究的进展,多Agent
本文涉及一种社区宽带综合业务网络系统,使用交换式以太网技术,在一个物理网络上实现常规电话网、数字电视网、计算机网的基本业务,为社区用户提供IP电话、数字电视、Interne
随着Internet的飞速发展,Web的信息量越来越大,通用搜索引擎在信息采集、存储等方面面临更大的挑战。此外,由于通用搜索引擎面向所有的用户,力争在返回结果上做到面面俱到,而
LDAP的不断发展完善及其在分布式环境中的广泛应用促进了目录服务的发展,然而在网络中总是有一些不安全的因素存在,对于那些对安全性要求较高的应用而言,提供安全可靠的目录
本文在分析和总结当前主要视频会议技术的基础上,论述了基于IP的集中式视频会议系统的设计与实现。全文共分七章:第一章简要说明视频会议的现状、发展趋势,以及关键技术;第二
Internet的出现使计算机软件所面临的运行环境开始从静态封闭逐步走向动态开放。为了适应这样一种发展趋势,软件系统开始呈现出一种柔性、多目标、连续反应式的新的系统形态,我
VoIP电话网关是VoIP电话系统的重要组成部分,它提供了IP网络与PSTN网络的接口,将IP技术与传统的电话网络相融合,实现IP数据包与PSTN语音数据包的实时交换。 本文进行了实
现代基于网络的商业行为规模巨大,由于产品或者实体的数量繁多,用户不可能一一去阅览,从而有可能遗漏掉很多对用户有价值的商品。推荐系统是信息过滤领域的一个子集,目的是预
本文的研究目标是解决项目门户系统上的用户身份认证以及资源访问控制方案的设计和实施问题。研究工作分两个方面进行:首先分析和比较了各种用户身份认证技术,从国家科技基