【摘 要】
:
在维吾尔语中,词缀的数量有限且构词具有一定的规律性。为了提高维吾尔语词切分算法的性能,在一个词缀库的基础上,通过分析维吾尔语的基本构词规则,提出了一种改进的非监督维
【机 构】
:
中国科学院新疆理化技术研究所,中国科学院研究生院
【基金项目】
:
中国科学院“西部行动计划高新技术项目”基金项目(KGCX2-YW-507)
论文部分内容阅读
在维吾尔语中,词缀的数量有限且构词具有一定的规律性。为了提高维吾尔语词切分算法的性能,在一个词缀库的基础上,通过分析维吾尔语的基本构词规则,提出了一种改进的非监督维吾尔语词切分方法。该方法对词进行规则切分,采用MAP切分评价模型对规则切分打分,选取得分最高的规则切分作为该词的最终切分形式。在一个5000词的测试语料上进行了实验,实验结果表明,使用该方法进行维吾尔语词切分具有更高的准确率。
其他文献
本文对病种质量管理的目的、内容及病种质量控制体系建立、病例质量评价方法作出了相应的阐述.病种质量控制是以预防和控制医疗缺陷作为主要目的.病例分型分级质量包罗模型评
火灾频发严重影响社会稳定、经济发展和人民群众生命财产安全。《西部法制报》通过开辟“三秦119,,专栏,将安全发展理念植根于广大百姓心中,把火灾警钟敲响于百姓耳畔,把防火常识
本文根据环吡咯酮类催眠药佐匹克隆的构效关系及作用机制,合成了八个未见文献报道的环吡咯酮类化合物,并进行了初步的药效研究。
针对传统的FCM算法随机获取初始聚类中心与分类类别数的缺陷问题,提出了一种获取初始聚类中心与分类类别数的方法,并采用交叉熵测度准则进行FCM聚类,对彩色图像进行分割,提取有意义区域。实验结果表明,该方法不仅能够提高算法的聚类速度与算法的普适度,而且可以改善图像的聚类效果。与传统的FCM算法相比,该算法更易于实现彩色图像有意义区与背景的分离,分割效果令人满意。
麻城市位于大别山南麓,是一个集山区、库区、老少边区、贫困地区于一体的山区市。近几年,我市卫生局坚持不断创新管理模式,在极其困难的情况下,寻找自我发展之路,促进了卫生
在支持J2ME技术的手机上,结合JSR82技术规范可以实现适合手机用户使用的蓝牙联网游戏,从而增强了游戏的互动性。以J2ME平台和Java蓝牙无线API为基础,分析了博弈树搜索、棋局
目的探讨腹腔镜治疗异位妊娠的临床疗效。方法将150例经腹腔镜治疗的异位妊娠患者的治疗结果与开腹治疗的73例异位妊娠患者进行比较,比较两组患者的术中出血量、手术时间、术
本文主要研究了非离予型分散齐4聚氧乙烯醚OP阴离子分散剂聚醇铵盐类5029以及复配分散剂对色素炭黑分散、中性墨水稳定以及触变性能的影响,通过表征体系中炭黑微观分散状态判
目的预测南宁市2018年手足口病疫情趋势,为早期预警、预测手足口病流行提供参考依据。方法通过国家"传染病报告信息管理系统"下载2008年5月-2017年12月南宁市手足口病疫情资