词义模型的训练及其在音字转换中的应用

来源 :第六届全国青年通信学术会议 | 被引量 : 0次 | 上传用户:m2564
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文主要研究词义知识的利用,词义模型训练和词的发类问题。首先给了使用统计模型标准中文文本词义的实验。其中,所用的词义标注集包含了1428类。在2000万词的语料训练得到一个二阶的词义模型后,运用该模型对50万词的集外语料进行测试,复杂度为65.48,词义准确率为92.73℅。然后,将该词义模型用于汉语的音室转换系统中,音字的转换的准确率为97.82℅。这个结果要明显好于传统的二元文法模型(93.2℅)和词性+二元文方法模型(95.1℅)。我们的实验表明该词义模型能减少词的岐义性,并能且够表地自然语言中词和词之间的短距离和长距离的词义依赖关系。
其他文献
等电位联结能够降低接触电压,防间接接触电击及接地故障引起的爆炸和火灾,在电气设计中是行之有效的安全措施.本文就编制《等电位联结安装》(97SD567)标准图提出了一些基本做
2020年4月9日,中共中央、国务院发布《关于构建更加完善的要素市场化配置体制机制的意见》(以下简称“《意见》”)。这在社会各界尤其是经济金融圈引起极大关注,产权市场的从业者也热切搜寻其中关于产权交易行业的描述,从中探究自身在未来要素市场化配置中的角色和定位。在笔者看来,对于这个文件,应当认清这样四个关键点:  首先要素市场化配置是十九大以来国家着力推进的一项重大战略。十九大报告提出“经济体制改革
期刊
会议
本文阐述了渐开线标准蜗杆的螺旋线误差、齿形误差和啮合误差的测量原理及计算方法,并就电气系统中的可变倍频分频器及节拍自动控制线路作了重点介绍。经初步鉴定认为,仪器在
党的十九届四中全会作出的《中共中央关于坚持和完善中国特色社会主义制度 推进国家治理体系和治理能力现代化若干重大问题的决定》,系统总结了我国国家制度和国家治理体系的
期刊
历经三个月的奋战,我们国家率先度过了新冠肺炎疫情的至暗期,从全面暂停到全面复工,为世界各国做出了榜样.我们国家取得防疫抗疫的阶段性成果,主要经验有三条:第一,党的坚强
期刊
[摘要]  立足于科技端新基建开启了一个创新创业创造时代,其关键在于用创新改革的方式进行系统化软硬件环境建设。新基建应用必将以推动产业发展新主体,以新的思维,新的方式,进行创新创造及应用。企业是各类主体创新的最基本载体,创新是企业转型和可持续发展保证,人才机制是企业创造创新的内动力,创新是创业的基础和前提。本文对我国四种典型的创新创业创造生态系统建设的做法、经验和启示进行总结和分析,为其他区域创新