现代汉语字、词基础部件统计分析

来源 :1998中文信息处理国际会议 | 被引量 : 0次 | 上传用户:zydolphin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文依据《信息处理用GBI3000.1字符集汉字部件规范》①所规定的汉字基础部件,对“现代汉语研究语料库系统”②(以下简称“语料库”)中使用的全部汉字和词进行基础部件拆分,并对拆分出的部件进行统计和分析。文章分三部分:对“语料库”中使用的汉字进行拆分,对拆分出的结果进行静态和动态的分析;以词为单位,对“语料库”中使用的全部的词直接进行基础部件拆分,对词和部件的关系进行统计和分析;对基础部件构字、构词的情况进行分析。
其他文献
会议
字形编码是汉字编码的歧途,日本的假名——汉字变换法对中国无借鉴价值,拼音编码具有优势,但仍有问题,汉字编码应向语文现代化方向发展。
期刊
当前数字消费电子(CE)产品中越来越多要考虑中文字符的存储与显示问题。该文结合笔者几年来从事数字CE产品软件开发以及参加数字电视产业联盟(DTVIA)高清晰度电视接收机(HDTV)研制的实践经验,试总
会议
会议
该文力求探讨电脑字根及其与传统偏旁部首的关系问题。电脑汉字的拆分必须是建立在汉字是表意系统的认识基础上,电脑字根必须具备一定的形体,可以称读且有一定的含义。电脑字根
会议