Unicode非BMP平面字符在LINUX上的实现

来源 :中国科学院软件研究所 | 被引量 : 0次 | 上传用户:ososxx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机能力的提高,越来越多的文字信息需要通过计算机来处理,这迫切地需要软件全球化的支持。软件系统的国际化水平影响着其全球化能力。软件国际化就是指让软件的实现独立于具体文化、文字的能力。大多数的软件已经基于Unicode编码编码标准实现了软件的国际化。   本文通过研究Linux的主流桌面环境KDE/QT,对其国际化文字处理机制进行了深入的分析,成功地解决了KDE/QT不能支持Unicode标准中的Non—BMP字符的问题。在此基础上,实现了对藏文扩充集、中日韩表意字符集扩充区B的支持。具体地说,论文完成了以下工作:   第一,归纳了软件全球化、国际化、本地化之间的关系,对目前Linux操作系统的国际化系统部件进行了简要分析,分析表明:KDE/QT无法支持Unicode的Non-BMP字符。   第二,结合Unicode字符模型,分析了QT国际化文本处理引擎、支持多种文字处理的机制、QT国际化文字处理流程。其中,详细讨论了字体匹配算法,并找出其中存在的问题。   第三,尝试了以UTF-16、UTF-32为基础的两种不同的QT处理码改造方案,比较各自的实现代价:基于UTF-16编码方式,使KDE/QT支持Unicode标准中的全部字符,包括BMP字符和Non—BMP字符。   第四,将本地若干个物理字体抽象成一个逻辑字体,设计了逻辑字体,提高了字形查找的成功率,解决了原来QT库字体匹配机制中的错误,   第五,从本地化系统的角度,在KDE/QT上实现了藏文扩充集、中日韩表意字符集扩充区B的支持。
其他文献
计算机视觉通过对图像的理解来模拟人类视觉,具有应用广泛、发展前沿等特性。大数据时代,图像资源急剧膨胀,给人们工作生活带来了便利,但是从繁杂多变的图像资源中寻找有价值的图
移动数据库系统本质上是移动的、异构的、多数据库系统。移动计算环境具有一些新的特性:移动性、网络断接的频繁性、网络条件多样性、网络通信带宽和费用的非对称性:此外移动计
Ontology(本体)作为一种表达领域知识的手段,正在计算机科学的各个研究领域中受到越来越多的重视,并在许多领域得到广泛的应用。从自然语言处理的角度来看,构造领域Ontology的关
随着计算机的普及以及信息化办公的需要,将传统纸质媒介保存的图纸内容用计算机进行存储,已经是必不可少的操作。图纸扫描生成的计算机图像都是位图格式的,但是对于诸如地质
随着VoIP的普及,对VoIP监测的需求愈加迫切,目前一般的网络测量工具不能满足VoIP监测的需要。同时主动式测量的局限性也越来越明显,对于运营商和大中型企业来说,更需要一种被动式
音频作为多媒体信息的一个重要组成部分,承载着很多资讯。随着多媒体技术的发展,音频资料的数据量不断膨胀。为了有效地利用这些信息,不仅需要合理的数据库系统来组织如此庞大的
随着计算机技术的迅速发展和硬件水平的快速提升,尤其是近年来高性能计算机和并行技术的发展,可视化技术作为科学研究和工程技术应用的一个手段变得日益重要。“高性能计算机及
近年来,高速铁路在我国发展迅猛,高速铁路运营里程和投用高速列车规模均跃居世界首位。与传统的机辆式普速列车相比,高速列车运用具有运行速度高、运行距离长、运营规模大的特点
三维重建是计算机视觉和计算机图形学的基本问题,在许多领域有广泛的应用。基于图像的三维重建技术恢复的三维信息精度低,而高分辨率的激光或结构光扫描技术设备昂贵且操作复杂
本文研究了WMN网络中的节点定位技术,研究目标为设计低误差、高可用性的定位解决方案,同时为WMN网络中的路由节点(MeshRouter)和客户机节点(MeshClient)提供准确的定位服务。主