论文部分内容阅读
本文通过对经分词和词性标注的大规模语料库(1.8GB)的统计,计算出语料库中出现的词对个数、距离及方差,并应用t检验的改进方法,得到了词对之间的“搭配强度系数”值R,以此来衡量它们之间这种搭配关系的强弱.这一系数直接面向依存文法分析,以得到到一个句子中各个词的搭配关系强弱序列表,以后将要从此表中得到依存文法树.目前我们可以在智能搜索引擎等多种场合找到此种方法的应用.