【摘 要】
:
藏族人名汉译名识别属于人名识别的范畴,但现有的人名识别方法并不能完全切合藏族人名命名特点:藏族人名具有浓厚的宗教文化内涵,字(串)特征和内部构成复杂 其次,藏族人名中含有
【基金项目】
:
基金项目:本文得到国家自然科学基金(60572159)、教育部科学技术研究重点项目(107017)的资助.
论文部分内容阅读
藏族人名汉译名识别属于人名识别的范畴,但现有的人名识别方法并不能完全切合藏族人名命名特点:藏族人名具有浓厚的宗教文化内涵,字(串)特征和内部构成复杂 其次,藏族人名中含有大量高频单字,使得藏族人名和普通词语之间歧义冲突变得十分突出,同时也使得藏族人名和上下文之间的边界变得非常模糊。本文在大规模藏族人名实例和语料库调查基础上,统计分析了藏族人名的用字(串)特征,并构建了藏族人名属性特征库 通过藏族人名的命名规则及属性特征将藏族人名形式化表示,实现了藏族人名汉译名自动识别系统。真实语料库开放测试F值达到87.
其他文献
法律框架网络知识本体的构建是以现有美国加州大学伯克利分校的FrameNet本体为参照,以法律文本语料库为依据,以法律专业人员参与为核心.通过核心概念集的抽取及其概念之间关
如何对索引词加权是信息检索中的一个关键技术.本文针对搜索引擎检索的对象是Web页面这一特点,通过分析HTML标签的修饰功能,结合传统的tf * idf加权公式,对网页进行加权索引.
本文介绍了数据仓库的概念和发展,民航快递信息系统的应用情况及产生的问题,民航快递信息系统建立数据仓库的必要性.提出了民航快递建立数据仓库所涉及的数据模型.讨论了在Or
投资要点1、系统性风险逐步出清。2、银行股处于历史估值底部。银保监调整了存款偏离度检测指标,检测上限从3%提高到4%,而且取消了季末的存款偏离度检测指标,同时在处罚力度上也在
元数据的使用可以大大提高信息系统检索和管理的效率,W3C提出的RDF则解决了在Web数据集成中使用元数据的问题.本文逐一介绍RDF的基本含义,RDF在Web上实现元数据描述及交换的
<正>在人教版高中物理选修3 1第2章第5节"焦耳定律"教材中,有关于电功公式和焦耳定律表达式的推导,由于这两个推导过程存在着一些缺陷,学生理解起来较为困难.本文对这两个推
兰州市不仅是甘肃省省会所在地和全省的政 治经济文化中心,而且是全国的历史名城之一。历史上,兰州 市所在地区的气候并不是象现在这样干燥少雨;兰州市的所 在地也并不是一直在
<正>传闻2已有自主知识产权的OLED成品材料在下游厂商进行验证。求证:属实。日前,网上有消息称万润股份(002643)已有自主知识产权的OLED成品材料在下游厂商进行验证,股市动态
从行业线索来看,三条结构性的价格线索正在形成,至少值得进一步关注和跟踪。线索一:粮食、猪肉、蔬菜。线索二:原材料、工业品、生活用品。线索三:房租、人力成本、服务业。
<正>中美贸易谈判上周取得进展,发表联合声明,表示不打贸易战,停止互相加征关税。然而贸易摩擦余波未了,美国总统特朗普重申并未就处理中兴通讯达成任何协议,亦对最近一轮中