【摘 要】
:
该文围绕面向口语对话系统的语料分析,详细分析和统计了一些口语非规范现象,并制定标注体系来对收集的口语语料进行标注.该文还针对口语语料分析中特有的断句问题提出了断句
论文部分内容阅读
该文围绕面向口语对话系统的语料分析,详细分析和统计了一些口语非规范现象,并制定标注体系来对收集的口语语料进行标注.该文还针对口语语料分析中特有的断句问题提出了断句规则并进行了评价,评价结果表明该规则是切实可行的.在此基础上,提出了一种基于决策树的自动断句算法并取得了令人满意的结果.最后,该文采用了基于记忆的词性标注方法首次用于中文词性标注.实验结果表明,尽管理书面语中该方法与传统的基于HMM的统计方法有一定的差距,但在语料规模很小的口语语料词性标注中该方法一定程度上优于基于HMM的统计方法.
其他文献
随着集成电路设计和制造水平的不断提高,测试面临着越来越多的困难,可测性设计(DFT)成为解决测试问题的主要手段。其中,内建自测试(BIST)能在芯片内部完成自测试,使产品的设
矿井提升机是矿山最重要的关键设备,它的运行质量的好坏直接关系到整个矿井的生产能力,关系到整个矿山的经济效益和井下工作人员的生命安全。矿井提升机的运行一旦出现异常,
该文通过分析并行工程设计过程的特点和并行设计中冲突问题的产生根源,详细研究了冲突解决的体系框架及其理论与技术.首先,提同了适用于并行工程设计过程的冲突解决模型.接着
智能轮椅是智能机器人的一个应用,它们研究的问题基本上相同,主要包括自定位、障碍检测、随机避障、路径规划等.目前世界上越来越多的研究人员开始从事智能轮椅方面的研究,所
该文以此项目第一期工程的基个业务为研究对象,从业务综合调研出发,采用新的系统分析方法,着重分析各业务中共有的业务规则和变化规律,继而推广至一般用户需求.由经抽象出业
石墨电极是电炉冶炼钢铁、黄磷、棕刚玉、金属硅等的必用导电材料,发达国家的电炉炼钢比例已达45%以上,而我国仅占15%左右。石墨电极生产行业是个高耗能高污染的行业,世界上能生产超高功率石墨电极的国家已经在缩减碳素生产规模,国际市场出现一定空间。但是在当前我国石墨电极生产的自动化程度并不很高,具体到电极的测量上,电极的各项参数还是依靠人工来完成,这样不仅工人的劳动强度高,测得的数据不精确,而且工作效率
自动指纹识别系统(AutomatedFingerprintIdentificationSystem,简称AFIS)有着广泛的应用背景.指纹图像增强和细节匹配是AFIS的两个重要问题.该文给出了一种基于方向场的指纹
动态联盟被认为是敏捷制造时代企业主要的组织和运行模式.该文的主要研究内容为动态联盟建盟问题,企业敏捷性评价和动态联盟企业间集成模式.论文提出了一种工具-广义产品依赖
该论文以三轴精密测试转台为背景,对三轴台的测角系统误差和动态测角方案进行了分析和研究.该论文的主要工作如下:对静态测角方案的动态工作情形进行了分析.针对静态测角方案
大行程(分米级)高精度(亚微米级甚至纳米级)的定位技术是半导体加工、精密制造、光学工程等领域的关键技术之一,对上述产业的发展极为重要。精密定位控制系统的研究是精密定