论文部分内容阅读
历来关于汉字的频度统计,大多以形为主,所以所谓的汉字的频度,充其量只能说是汉字的“形频”的统计。这样的汉字频度,由于将多音字的不同音的频度叠加在一起,从而形成了汉字的伪频。该文所发表的多音字的频度,是作者利用了2500万汉字的语料库,对汉字的多音字进行多音字编码输入计算机后进行的统计。这些统计结果是历史上首次进行的统计,因而改写了汉字频度的排序。(本刊录)