书面藏语的熵值及相关问题

来源 :1998中文信息处理国际会议 | 被引量 : 0次 | 上传用户:caikesbad
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文以20余万字文本语料对书面藏语作了小规模信息熵估算,计算出一阶熵和二阶熵熵值以及藏语的多余度,本样本一阶熵为3.9913,二阶熵为1.2531。与欧洲语言比较,书面藏语的条件熵极小,有序度高,多余度很大,这是因为藏语自身严格的结构所造成的。
其他文献
山西省拥有丰富的矿产资源,为我国社会主义建设、国民经济水平的提升提供了重要保障.同时,过度开采、粗放型发展模式造成了大量的资源浪费,山西省国家资源型经济转型综合配套
会议
会议
会议
会议
该文讨论了藏文计算机键盘国家标准的三个原则:字符输入字件的频数统计原则,德沃拉克(Dvorak)原则,学习容易和使用方便的原则。给出了约10万字的字符字件的频数统计的结果,并设计了符合德沃