用基于词的二元模型消解交集型分词歧义

来源 :南京师大学报(社会科学版) | 被引量 : 0次 | 上传用户:sydna521
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
解决交集型分词歧义问题,对于大规模语料库建设具有十分重要的意义.我们用基于词的二元模型对两个各200万字的语料库中的三字长交集型字串进行了消歧实验,封闭测试正确率达到99%以上,开放测试正确率达到90%以上,比以往最好结果有明显的提高.
其他文献
亚裔美国人是美国多种族社会中正在崛起的一支族裔集团 ,它在美国社会生活的各个方面日益显示出其强大的潜力。亚裔美国人这个概念的形成得益于1 96 0年代末的亚裔美国人运动
从依靠皮卡创业,到凭借SUV造势,直至今年形成风骏皮卡、哈弗SUV、腾翼C30三足鼎立格局,长城汽车发展战略日趋清晰。在这一进程中,正是腾翼C30的横空出世,为长城汽车格局的形