未登录词识别相关论文
随着近年来网络技术的高速发展,互联网逐渐成为越来越多信息的载体,网络平台每天产生海量的数据,如何高效地处理利用这些文本数据是目......
该文设计并实现了一个汉语自动分词系统,对系统中采用的关键技术进行具体介绍.词典查找是影响系统切分速度的重要因素.该文提出一......
随着Internet的快速发展,Web信息的迅速增加,人们越来越依赖使用搜索引擎来获取互联网上有用的信息。中文未登录词的识别和歧义的消......
《国家中长期科学和技术发展规划纲要(2006-2020年)》实施以来,我国财政科技投入快速增长,科技项目和资金管理不断改进,为科技事业......
随着企业信息的飞速增长,企业信息检索逐渐成为信息检索领域研究的热点,中文分词作为信息检索的文本处理阶段一个重要步骤,直接影......
随着传统互联网和移动通信网络的快速发展,网络侧及对应的终端侧数据的种类和数量也得到了快速的发展,如何快速的获取用户所需要的......
在汉语中,句子由连续的汉字组成,中文分词完成句子从有字的序列转化为词的序列的任务。传统的机械分词方法基于人工维护的辞典,需......
随着互联网信息的发展,盲人应摆脱传统盲文书籍的束缚,享受丰富多彩的信息世界。然而,目前汉字盲文的信息化处理程度较低,盲人能够......
自动分词是中文信息处理的基础课题之一。现有的分词软件和技术主要是针对现代汉语新闻科技等较为规范的文本,对于其他领域汉语文本......

