关于多音字频度的统计

来源 :第三届中文信息处理国际会议 | 被引量 : 0次 | 上传用户:a479704375
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
历来关于汉字的频度统计,大多以形为主,所以所谓的汉字的频度,充其量只能说是汉字的“形频”的统计。这样的汉字频度,由于将多音字的不同音的频度叠加在一起,从而形成了汉字的伪频。该文所发表的多音字的频度,是作者利用了2500万汉字的语料库,对汉字的多音字进行多音字编码输入计算机后进行的统计。这些统计结果是历史上首次进行的统计,因而改写了汉字频度的排序。(本刊录)
其他文献
该文引入“熵”的概念,对BP网络加以改进,实现了相似样本的模式分类。在此基础上设计了一种实现脱机手写汉字细化神经网络模型,同时给出了该模型的预处理方法、网络结构、学习算
会议
会议
会议
气辅成型通过将气体引入注射成型过程,使工艺具有产品翘曲小、表面质量好、注射压力低等优点。但是,气辅成型技术存在一些技术问题。比如引入了大量的工艺参数,成型稳定性降
武器装备篇-北京212型军用吉普车rn二十世纪六十年代我国与前苏联交恶后,无法获得各项军事援助。因此,北京汽车制造厂(简称北汽)借鉴前苏联伏尔加车的技术,并受美国吉普外观的启示,