基于Web网页语料构建动态语言模型

来源 :信息技术 | 被引量 : 0次 | 上传用户：youjia88

【摘要】

：

为语音识别系统构建语言模型，首先要进行语料准备，语料来源决定语言模型的性能。Web网页中涵盖了各种最新的语言现象，为语料准备提供了最多样化的资源。但Web网页中语义完整字串

【作者】

：

李雪涛文茂平杨鉴

【机构】

：

云南大学信息学院

【出处】

：

信息技术

【发表日期】

：

2006年8期

【关键词】

：

语言模型语料库信息提取动态更新 language model Chinese training text extracting information

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

为语音识别系统构建语言模型，首先要进行语料准备，语料来源决定语言模型的性能。Web网页中涵盖了各种最新的语言现象，为语料准备提供了最多样化的资源。但Web网页中语义完整字串通常夹杂在格式、标记、广告等无用字串中。首先介绍语言模型的训练算法和更新方法，继而提出一种从HTML文档提取用于训练语言模型的语义完整汉字字串的算法，最后给出语料提取实验结果、语言模型训练结果和语言模型的动态更新结果。为基于Web网页语料动态更新语言模型提供了一个完整的解决方案。

其他文献

益力多预防机械通气患者肠内营养相关性腹泻的护理观察

目的探讨益力多预防机械通气患者肠内营养相关性腹泻的临床效果和护理.方法选取我院2010至2012年ICU病房收治的行机械通气患者70例,均应用鼻饲肠内营养支持,将所有患者随机

期刊

益力多机械通气肠内营养腹泻护理Yakult Mechanical ventilation Enteral nutrition Diarrhea

消瘀片治疗新型血小板聚集功能缺陷症的临床研究

本研究采用中药消瘀片治疗新型血小板聚集功能缺陷症７２例，并与维生素Ｃ、Ｐ加安络血组６５例作对照，进行临床症状和血小板聚集功能的疗效比较。结果：显效率：中药组为８７．５％，对照组为３５．４％；两组小血小板聚

期刊

消瘀片血小板聚集出血综合征new platelet aggregation defect Xiaoyu pian platelet aggregati

立“血劳”易血液病中虚劳的诊断：附红细胞免疫功能的观察

立“血劳”易血液病中虚劳的诊断──附红细胞免疫功能的观察梁贻俊，任卫华，陈庆平虚劳是以脏腑元气亏损，精血不足为主要病理过程的一类慢性虚衰性疾病。它可见于西医多系统的慢

期刊

虚劳诊断血液病红细胞免疫功能

《OSPF和IS-IS详解》

本书是在大型IP企业网络、运营商网络、服务提供商网络中部署OSPF和IS—IS协议的权威指南。网络技术巨擘Jeff Doyle根据其多年的咨询经验，向读者详述了链路状态路由协议的方方

期刊

IS-ISOSPF链路状态路由协议详解企业网络服务提供商数据库同步JEFF

虚拟功能“显身手”

无论用户如何小心谨慎，总是会有一时不慎遭遇安全攻击的可能，每当遇到这些情况时，大家都会找来各式各样的杀毒软件或防火墙来为系统运行“保驾护航”，甚至不惜厦新安装操作系统。

期刊

功能虚拟安全防范措施操作系统安全攻击杀毒软件防火墙

中药“三品”治疗慢性宫颈疾患的临床和实验研究

135例慢性宫颈疾患均经临床、细胞学、病理学检查,排除癌变及心、肝、肾等慢性疾病后,用中药三品片、三品杆外治。经2～3个月治疗,均获近期治愈。其中110例进行了1～11年的定期随

期刊

三品片三品杆子宫颈疾病Sanpin pills and rodschronic cervcial diseaseschronic hypertro

发展云计算应用是关键

云计算、物联网、大数据、移动互联网再加上智慧城市等的出现引领着社会技术和产业的发展，有专家认为它们带来了新一轮信息技术革命。然而，要推进云计算和相关产业的健康发展，还

期刊

计算应用信息技术革命相关产业移动互联网社会技术研究机构物联网

益气活血法对沙土鼠脑缺血重灌流脑膜微循环的作用

为研究中医益气活血法对沙土鼠脑缺血重灌流后脑膜微循环的作用,用激光显微血流计及其电视录像系统,量化观察记录了沙土鼠脑缺血及重灌流后,注射益气活血药对脑膜微循环的作

期刊

沙土鼠益气活血法脑缺血重灌流脑膜微循环gerbilsupplementing Qi and activating blood circulation

抗纤灵对HepG_2细胞毒及诱导其凋亡的作用观察

抗纤灵系国家科委资助开发的治疗血吸虫病肝纤维化、肝硬化的新药中药制剂。临床实验证实该药对原发性肝癌亦有确切疗效,为了进一步扩展其应用范围和探讨其抗肿瘤机制,我们观

期刊

边界DNS防护设置

对于数以百万计的SOHO上网用户来说，宽带路由器就是网络的边界门户，但大部分宽带路由器的初始账号和密码都是一样的，而多数用户又从不修改初始设置，所以路由器的DNS地址很可能被

期刊

初始设置DNS边界宽带路由器防护上网用户SOHO网络

基于Web网页语料构建动态语言模型

其他学术论文