未登录词相关硕士博士期刊学术论文

未登录词相关论文

数学自然语言处理中新定义的理解及其应用研究

自然语言处理（Natural Language Process,NLP）是一种让计算机尝试学会理解和处理人类口语或书面语的计算机技术。它与基于语言理解的......

学位

中文自然语言处理初等数学新定义问题未登录词

融合双语词典的汉缅神经机器翻译方法研究

神经机器翻译成为当前机器翻译的主流方向,在语料资源丰富的语言对上达到了极高的性能,但是在汉-缅这种低资源语言对上应用还不太......

学位

汉-缅双语平行句对抽取双语词典未登录词神经机器翻译

基于神经网络的文本摘要生成技术研究

日常生活中,人们的阅读量越来越多,但获取的有效信息却越来越少,这本质上源于信息过载。文本摘要技术可以帮助读者快速了解文章主......

学位

文本摘要端到端模型 C-RNN编码器未登录词注意力机制

基于字符信息相关性与多语义特征的命名实体识别研究

命名实体识别任务的目的在于高效地从文本信息中抽取实体信息,是自然语言处理的基础性工作,但受制于数据中未登录词的影响,导致命......

学位

命名实体识别未登录词双数组Trie树 GCN

基于知识库问答的未登录词研究

近年来,随着人工智能的高速发展,传统的搜索引擎已经越来越难以满足人们的搜索要求。相比搜索引擎依靠的关键字匹配,智能问答系统......

学位

智能问答系统未登录词词向量流形排序动态规划循环神经网络

现代汉语深度语义标注语料库研究

当前,世界各国学者都十分重视自然语言处理的知识资源的建设,建立了许多带各种标注信息的语料库,以适应更为深入的语言研究和自然......

学位

语义语法学语义词类句法语义范畴未登录词知识库语义角色

基于语料库的现代汉语词缀与派生词自动识别问题初探

汉语词缀的显著特点是语义半虚半实、位置固定以及较高的能产性。词缀能够批量造就语言中急需的部分词语,造词规则较为明晰简单,符......

期刊

现代汉语词自动识别未登录词造词能产性现代汉语语法自动切分句法分析经济性原则自动分词

中文分词算法研究

中文分词技术是中文信息处理中的重要环节，中文分词算法与中文分词系统的性能紧密相关。目前的分词算法可以分为基于字符串匹配的分......

学位

中文信息处理分词算法中文分词系统歧义排除未登录词蚁群算法

汉语分词中未登录词识别及词性标注的研究与实现

本文主要介绍了汉语分词中未登录词识别与词性标注方法。未登录词是影响汉语分词准确率的一个重要因素，未登录词包括人名、地名、时......

学位

汉语分词未登录词词性标注自动分词

一种基于组合模型的中文未登录词词性猜测方法

在当今信息时代,伴随社会、经济、文化等的飞速发展,生活中不断涌现了大量的中文未登录词语。这些未登录词语在丰富了语言色彩的同......

学位

中文未登录词语词性上下文内部特征外部特征

大规模WWW文档分类与特征词抽取方法研究

当前,随着Internet技术的推广和应用,国际互联网已经成为世界上最大的信息资源库和全球范围内传播信息的最主要的渠道.如何帮助用......

学位

文档分类 VSM向量空间模型多层次分类特征项未登录词 N-grams 互信息

中文短文本未登录词发现及情感分析方法研究

随着互联网科技的蓬勃发展,微博微信等即时通讯工具随之出现,由于其具有简单易用,传播迅速等特点,日益成为大众日常重要的沟通交流......

学位

情感分析未登录词发现特征扩展深度信念网络

基于Hash算法的中文自动分词技术研究

中文自动分词技术是网络搜索引擎的关键技术之一，是中文信息处理中的重要环节，也是智能计算、文献标引、自然语言理解和处理的基础。......

学位

中文自动分词 Hash算法分词词典歧义字段未登录词搜索引擎中文信息处理

基于用户查询的中文未登录词识别技术的研究

随着Internet的快速发展，Web信息的迅速增加，人们越来越依赖使用搜索引擎来获取互联网上有用的信息。中文未登录词的识别和歧义的消......

学位

汉语分词未登录词姓名识别查询日志用户查询逻辑运算符未登录词识别

规则与统计相结合的英语词性标注系统的研究与实现

词性标注是机器翻译过程中的关键环节，其主要作用是确定句子中各单词的词性并加以标注。词性标注研究的重点是如何确定句子中兼类词......

学位

词性标注未登录词机器翻译隐马尔科夫模型英语翻译

基于Web的双语词汇构建关键技术研究

双语词汇的构建是自然语言处理领域一项很基础的工作。双语词汇的好坏直接影响到机器翻译、跨语言检索等自然语言处理系统的性能。......

学位

音译词识别直译词识别基本短语标注译文挖掘翻译对抽取

基于统计的中文文本关键短语自动抽取方法研究

关键词抽取是文本信息处理的重要技术,是在进行文本自动摘要、文本自动分类、主题提取及专利检索分析等文本信息理解工作时,都要应......

学位

关键短语抽取完整短语未登录词左右邻信息决策树小世界网络网络特征值文本特征

综合字典和统计分析的中文分词系统的研究与实现

中文分词技术主要包含以下三个研究方向：理解分词,机械分词以及统计分词。基于理解的分词方法研究尚未成熟,所以,绝大部分中文分词......

学位

词典统计未登录词歧义词

基于语素的汉语词法分析方法研究

作为中文信息处理的关键问题之一,汉语词法分析主要包括分词、词性标注和词义消歧三个子任务。虽然近年来汉语词法分析取得很大进......

学位

汉语词法分析中文分词词性标注词义标注未登录词

基于Web的未登录词翻译技术研究

未登录词(Out of Vocabulary,简写为OOV)的查询翻译是影响跨语言信息检索(Cross-Language Information Retrieval,简写为CLIR)性能......

学位

跨语言信息检索查询翻译未登录词搜索引擎维基百科

一种中文未登录词识别及词典设计新方法

中文分词是中文信息处理领域的一项基础性课题,未登录词识别问题又是中文分词的瓶颈问题之一。为了解决中文分词中的未登录词识别......

学位

未登录词中文分词词频统计核心词典

基于词典和词频分析的论坛语料未登录词识别研究

中文自动分词技术是中文信息处理的一个基础性课题,在中文信息处理中,首先需要对词进行切分,然后才能进行更深层次应用研究,随着信......

学位

未登录词中文分词词频分析核心词典

涉及未登录词的网络舆情多模态数据处理方法研究

网络社区中产生的舆情信息包括大量文本、图片和视频等多种模态数据,其传播方式具有随意性、快速性、便捷性等特点,是社会舆论的聚......

学位

未登录词网络舆情图片文字识别文本处理多模态数据

基于全切分和碎片提取的中文自动分词系统

中文自动分词是中文自然语言处理的一项基础性工作，也是中文信息处理的一个重要问题，在很多领域扮演着非常重要的角色。中文自动分词......

学位

中文自动分词改进全切分碎片提取未登录词自然语言处理

基于微博短文本的大数据分析方法探索与研究

微博使得网络社交常态化、便捷化、实时化,微博热度的上升也使得其逐步变成重大突发事件和热点问题的信息发源地。为了切实建设和......

期刊

互联网大数据微博未登录词文本聚类

藏文信息处理中的自动分词技术所面临的基本问题

分词就是将连续的文字序列按照特定的规范重新组合成词语序列的过程，在藏文信息处理领域分词是不可或缺的基础性工作，也成为智能化藏......

期刊

藏文自动分词分词规范歧义切分未登录词紧缩词

一种有效的实时语音识别确信度判决方法

语音识别系统的确信度判决用于对未登录词(Out-of-Vocabulary,OOV)的拒识.本文提出了一种有效的确信度判决的方法.在本方法中包含......

期刊

语音识别未登录词确信度判决

基于N-GRAM的朝鲜文索引方法与性能评价

在为检索信息而索引朝鲜文时,通常的做法是对语句和词素进行分析后把名词抽取成索引词.但由于分析的模糊性,若在对词素进行分析时......

期刊

朝鲜语 N-gram法未登录词信息检索复合名词词素分析

基于聚类算法的“未登录”敏感信息标注技术研究

0引言随着大数据时代的到来,如何从海量数据中发掘出对我们有用的知识,已经成为摆在相关领域学者面前最迫在眉睫的问题。虽然我们......

期刊

聚类算法信息标注未登录词时代特点语言学规则音视频数据多媒体交互文本信息网络数据挖掘时代课题海量数据自造词假借词大数据知识学者新

面向科技文献神经机器翻译词汇表优化研究

本文通过对荣华二采区10...

期刊

神经机器翻译科技文献未登录词

基于Systran的翻译本地化难点概述

由于汉语与英语有不同的特点,导致机器翻译时把汉语当做源语言要比把英语当做源语言要困难得多。本文试图从汉英机器翻译的角度探......

期刊

计算机翻译 Systran 词语切分未登录词

藏族人名汉译名识别研究

藏族人名汉译名识别属于人名识别的范畴,但现有的人名识别方法并不能完全切合藏族人名命名特点:藏族人名具有浓厚的宗教文化内涵,......

期刊

藏族人名识别未登录词可信度自动分词

看过本文同时还关注