英文口语中非流利区域的检测

来源 :第九届全国计算语言学学术会议 | 被引量 : 0次 | 上传用户：kok671113

【摘要】

：

本文介绍了我们在非流利部分检测以及对非流利句子进行句法分析上的工作。我们的主要贡献是扩大了非流利部分检测的特征集合,最佳特征选择,并且比较了三种不同的分类器(AdaBo

【作者】

：

张奇黄萱菁吴立德翁富良

【机构】

：

复旦大学计算机科学与工程系,上海,200433

【出处】

：

第九届全国计算语言学学术会议

【发表日期】

：

2007年期

【关键词】

：

英文口语流利区域 Random Fields 特征选择特征集合句法分析检测标点符号分类器系统

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

本文介绍了我们在非流利部分检测以及对非流利句子进行句法分析上的工作。我们的主要贡献是扩大了非流利部分检测的特征集合,最佳特征选择,并且比较了三种不同的分类器(AdaBoost,Maximum Entropy,and Conditional Random Fields)在这个任务上的结果。通过上述的改进,我们系统的结果相对于考虑标点符号的最优结果[2]在 F 值上有了43．98％的相对提高,在不考虑符号的结果[7]上有了20．44％的相对提高。

其他文献

人类史上的十大环境灾难

从1986年以后每年人们郡像往常一样来到切尔诺贝利核事故纪念碑前哀悼死难者.人类对自然和科学的掌握.创造了更好的生活,也带来了不少灾难.环境的污染和资源的流失,威胁到了

期刊

人类历史切尔诺贝利核事故环境保护意识环境灾难十大事件纪念碑自然资源污染威胁梳理时代生物生活生存美国流失科学创造

基于树到串对齐模板翻译模型的n-best解码算法

基于树到串对齐模板的统计机器翻译模型是一种新颖的翻译模型,本文提出了基于树到串对齐模板翻译模型的n-best解码算法。实验结果表明,本文提出的解码算法不但提高了开发集上

会议

对齐模板翻译模型解码算法最小错误率训练程序模型参数翻译质量翻译系统统计实验开发机器

基于句型模板和统计机器翻译技术的翻译方法

当前统计机器翻译系统还存在很多弊端,对于一些常见的语言学现象的处理并不理想,离真正的实用化还有一定的差距。本文结合统计和规则翻译方法的优点,提出了一种将句型模板融

会议

基于“松弛尺度”的短语翻译对抽取方法

短语对抽取是基于短语统计机器翻译方法的关键技术。当前广泛使用的Och提出的短语对抽取方法,过于依赖词对齐结果,因而只能抽取与词对齐完全相容的短语对。本文给出一种基于

会议

尺度短语翻译对短语抽取机器翻译方法词对齐标注信息关键技术源短语性能比统计实验目标词性词典

基于N-gram的句子相似度计算技术

在基于大规模双语语料库的机器翻译研究中,如何找到最有效的翻译参考一直以来都是人们的关注焦点,其核心技术就是参考例句的相似度计算。本文提出了一种基于HowNet词语相似度

会议

句子相似度相似度计算方法机器翻译语义相似度计算双语语料库词语相似度评价公式关注焦点翻译研究交互式应用评测例句技术基础辅助

FirteX-高性能全文索引和检索平台

FinteX是一个功能强大、高性能、灵活的全文索引和检索平台。FinteX的主要目标是作为一个开放式的实验平台研究信息检索的各种数据结构、算法和模型,并可快速搭建实验系统。

会议

基于后缀数组方法的网络译文挖掘

利用互联网上丰富的信息资源来挖掘出专业术语的翻译选项可以应用在计算机辅助学习、机器翻译和跨语言检索等多个领域。如何挖掘出Web上所有可能的标注对形式并获取候选译文

会议

基于文档扩展的中文信息检索系统

本文介绍了我们参加国际信息检索比赛NTCIR中所使用的方法。我们首先利用传统的伪相关扩展方法检索文档,得到单个文档与查询之间的相似度:然后将前n篇文档聚类,再次计算类别

会议

文档聚类扩展方法中文相似度查询信息检索线性组合检索效果结果集计算类实验程度比赛

基于投影函数和梯度方向的快速人眼定位方法

本文提出了一种基于投影函数和梯度方向相结合的眼睛自动定位方法。首先利用水平投影曲线和垂直投影曲线确定眼睛区域,然后根据眼球的梯度方向信息定位眼睛中心。试验证明该方法计算简单,定位准确率较高,并且对头部姿态变化等具有一定的鲁棒性。

期刊

投影函数梯度眼睛定位

基于虚拟专家描述文档的专家检索研究

企业内部的专家检索是人们通常遇到的一个问题,但由于企业内部的数据类型多样、分布结构复杂,而且专家相关的信息很稀疏的分散在企业数据中,因此数据不易组织来进行检索。虚

会议

英文口语中非流利区域的检测

其他学术论文