【摘 要】
:
文章提出了一种在真实文本中抽取中文信息结构的方法-利用大规模基于语义依存关系的语料库对的中文信息结构模式进行训练,用这些带概率的模式作为规则建立部分依存分析器,从
【机 构】
:
清华大学电子工程系,北京,100084清华大学计算机科学与技术系,北京,100084;
论文部分内容阅读
文章提出了一种在真实文本中抽取中文信息结构的方法-利用大规模基于语义依存关系的语料库对的中文信息结构模式进行训练,用这些带概率的模式作为规则建立部分依存分析器,从而从真实文本中最大限度地抽取符合知网中文信息结构定义的短语.该研究除了对将要建立的基于语义依存关系的语言模型是个有益的补充外,对于文本理解、对话系统甚至语音合成中的重音预测、韵律建模等等方面都有十分广阔的应用前景.
其他文献
第二次世界大战中,攻克柏林在所有参战的反法西斯盟国军人眼里,是最熠熠生辉的军事荣誉.谁攻克了德国首都,就意味着在战胜法西斯德国中立下了首功.因此,为争夺这顶桂冠,苏美
改革开放以来,社会生产力飞速发展,人们物质生活水平不断提高。然而,人们的思想品德素质的发展却不尽如人意。造成这种情况的原因是多方面的,其中一个非常重要的原因是思想政
1924年1月24日,孙中山大元帅任命当时在国民党内资历、人望和地位均尚浅的蒋介石为中国国民党陆军军官学校筹备委员会委员长,全权负责该校的筹备工作.
随着网络的宽带化,传统的防火墙已经无法适应这样的变化。对于防火墙来说,需要支持1G,甚或10G这样的链路。无论是基于包过滤的防火墙,还是基于应用网关的防火墙都必须满足这
目的建立气相色谱测定工作场所空气中二甲基苯胺方法。方法使用硅胶管采集空气中二甲基苯胺,无水乙醇解吸,通过毛细管气相色谱柱分离,氢焰离子化检测器检测,观察检测方法的线
请下载后查看,本文暂不支持在线获取查看简介。
Please download to view, this article does not support online access to view profile.
1950年10月,新中国刚诞生一年整.中国共产党和中国政府正在领导全国人民医治战争创伤,恢复经济建设.祖国百业待兴,各方面均面临着严重的困难.
电气图在电气系统及成套电器的施工设计中具有举足轻重的作用.文章简要地分析了电气图的功能及特点,介绍了基于XML的电气图描述语言XvgML(eXtensible Vector Graphics Markup
针对常规BP算法收敛速度慢和易陷入局部极小的问题,文章提出了一种新的BP算法———SASSFBP算法。该算法根据训练中最近两个梯度的符号及其相对大小来动态地改变权步因子,提
1964年10月16日15时,中国在罗布泊地区成功进行了第一次核试验.同时声明:中国政府一贯主张全面禁止和彻底销毁核武器,中国进行核试验,发展核武器,是被迫而为的.中国掌握核武