词义模型的训练及其在音字转换中的应用

来源 :第六届全国青年通信学术会议 | 被引量 : 0次 | 上传用户：m2564

【摘要】

：

该文主要研究词义知识的利用，词义模型训练和词的发类问题。首先给了使用统计模型标准中文文本词义的实验。其中，所用的词义标注集包含了1428类。在2000万词的语料训练得到一个

【作者】

：

张建平;王作英;

【机构】

：

清华大学电子工程系(北京)

【出处】

：

第六届全国青年通信学术会议

【发表日期】

：

1999年期

【关键词】

：

标准算法人机交互词义模型词义标注机器学习语音识别复杂度音字转换

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

该文主要研究词义知识的利用，词义模型训练和词的发类问题。首先给了使用统计模型标准中文文本词义的实验。其中，所用的词义标注集包含了1428类。在2000万词的语料训练得到一个二阶的词义模型后，运用该模型对50万词的集外语料进行测试，复杂度为65.48，词义准确率为92.73℅。然后，将该词义模型用于汉语的音室转换系统中，音字的转换的准确率为97.82℅。这个结果要明显好于传统的二元文法模型(93.2℅)和词性＋二元文方法模型(95.1℅)。我们的实验表明该词义模型能减少词的岐义性，并能且够表地自然语言中词和词之间的短距离和长距离的词义依赖关系。

其他文献

浅谈《等电位联结安装》标准图的编制

等电位联结能够降低接触电压,防间接接触电击及接地故障引起的爆炸和火灾,在电气设计中是行之有效的安全措施.本文就编制《等电位联结安装》(97SD567)标准图提出了一些基本做

会议

等电位联结标准图间接接触电击接地故障接触电压电气设计安全措施火灾编制爆炸

实现要素规范高效配置的关键在于进场交易

2020年4月9日，中共中央、国务院发布《关于构建更加完善的要素市场化配置体制机制的意见》（以下简称“《意见》”）。这在社会各界尤其是经济金融圈引起极大关注，产权市场的从业者也热切搜寻其中关于产权交易行业的描述，从中探究自身在未来要素市场化配置中的角色和定位。在笔者看来，对于这个文件，应当认清这样四个关键点：　　首先要素市场化配置是十九大以来国家着力推进的一项重大战略。十九大报告提出“经济体制改革

期刊

第十一次全国标准物质学术交流会

会议

标准物质

标准通用标示语言及文件的自动化制作

会议

标准通用标示语言文件自动化

HJY013型标准蜗杆检查仪

本文阐述了渐开线标准蜗杆的螺旋线误差、齿形误差和啮合误差的测量原理及计算方法,并就电气系统中的可变倍频分频器及节拍自动控制线路作了重点介绍。经初步鉴定认为,仪器在

会议

标准蜗杆螺旋线误差仪器啮合误差控制线路计算方法电气系统齿形误差测量原理测量精度渐开线倍频器签定可变基层国内

学习运用党的创新理论建设发展产权交易市场(上篇)

党的十九届四中全会作出的《中共中央关于坚持和完善中国特色社会主义制度推进国家治理体系和治理能力现代化若干重大问题的决定》,系统总结了我国国家制度和国家治理体系的

期刊

亮点四说现代企业与职工

历经三个月的奋战,我们国家率先度过了新冠肺炎疫情的至暗期,从全面暂停到全面复工,为世界各国做出了榜样.我们国家取得防疫抗疫的阶段性成果,主要经验有三条:第一,党的坚强

期刊

创新创业生态系统建设典型模式及经验启示

[摘要]　　立足于科技端新基建开启了一个创新创业创造时代，其关键在于用创新改革的方式进行系统化软硬件环境建设。新基建应用必将以推动产业发展新主体，以新的思维，新的方式，进行创新创造及应用。企业是各类主体创新的最基本载体，创新是企业转型和可持续发展保证，人才机制是企业创造创新的内动力，创新是创业的基础和前提。本文对我国四种典型的创新创业创造生态系统建设的做法、经验和启示进行总结和分析，为其他区域创新

期刊

创新创业创造生态体系典型模式经验启示新基建

ＩＣＰ－ＡＥＳ法在研制人血清标准物质中的应用

会议

血清标准物质

ＩＣＰ直读光谱分析在标准物质定值分析中的应用－－测定合金铸铁标准物质中Ｎｉ、Ｃｕ、Ｍｏ、Ｖ元素

会议

直读光谱分析铁标准物质定值分析应用测定合金

词义模型的训练及其在音字转换中的应用

其他学术论文