文本预处理相关硕士博士期刊学术论文

文本预处理相关论文

基于NLP的政企类文本智能分类的实现与应用

本文基于深度学习框架及自然语言处理，将政企类文本智能分类过程中的文本预处理、模型构建、分类效果比较等环节进行了实现与分析。......

期刊

深度学习文本预处理 BERT 文本分类预训练模型

面向标准文本的词性标注集设计

围绕标准文本的词性标注，针对通用词性标注集对标准文本标注不适配的问题，基于词性标注任务研究现状，提出一种针对标准文本特点的词性......

期刊

标准文本词性标注文本预处理

中文文本聚类的研究与实现

该文就文本自动聚类技术的发展及现状进行了系统的回顾,然后,针对社科领域的文本聚类进行了较为深入的探讨与研究,实现了两个实验......

学位

文本自动分类文本聚类文本预处理文本表示特征抽取

社交网络博客主题挖掘与应用

Web2．0兴起让越来越多的网络使用者参与到社交网络中，他们热衷于进行资源分享，信息互换，互相之间的交流也越来越多。针对用户产生内容......

学位

社交网络博客主题分类潜在好友推荐语义相似度

基于K-近邻算法的文本自动分类

随着计算机技术的快速发展和Internet的普及与应用，互联网上的电子文档信息急剧增加。面对如此海量的信息，人们迫切需要寻找一条能够......

学位

文本自动分类 K-近邻算法向量模型特征降维分类算法文本预处理

基于统计的机器学习的中文命名实体识别

计算语言学所研究的命名实体是指句子中有确定含义的名词。由于命名实体包含了文本中重要的信息，命名实体识别是信息抽取研究中最有......

学位

命名实体识别统计机器学习规则文本预处理

基于SVM算法的垃圾信息过滤相关技术研究

随着互连网络的迅速发展，人们获得越来越多的网络信息，但同时也带来了很多的负面影响，其中垃圾信息已成为人们日益关注的焦点问题。网......

学位

垃圾信息垃圾信息信息过滤信息过滤支持向量机支持向量机特征选择特征选择文本预处理文本预处理

基于粗糙集的Web文本分类技术研究

随着互联网产业的飞速发展,网络上聚集了海量的数字信息资源,越来越多的研究人员把如何有效处理这些海量数据作为自己的研究课题,......

学位

Web文本分类粗糙集特征提取属性约简

基于自然语言处理的疑似侵权专利智能检索研究

专利文献作为技术信息最有效的载体,囊括了全球90%以上的最新技术成果,对于知识产权的保护起着至关重要的作用。随着目前专利数量......

学位

专利侵权信息抽取词向量相似度计算自然语言处理

面向信息抽取的文本预处理和规则自动学习技术研究

随着Internet技术的快速普及和迅猛发展,网上信息爆炸式增长,如何从中找到真正有用的信息成为人们关注的焦点。作为深层数据挖掘技......

学位

信息抽取文本预处理有限状态自动机规则自动获取归纳逻辑编程

结合机器学习方法的命名实体识别研究

命名实体识别是目前自然语言处理研究的热点问题。MUC(Message Understanding Conferences)对命名实体的定义是:人们感兴趣的专有......

学位

命名实体识别统计和规则机器学习决策树算法

基于潜在语义索引的文本聚类算法研究

随着网络信息的飞速增长和搜索引擎等技术的日趋成熟,人类社会所面临的主要问题已经不再是信息匮乏,而是如何提高信息获取和信息访......

学位

文本聚类潜在语义索引奇异值分解半离散矩阵分解 K-means算法

汉语主客观文本分类及预处理研究

随着互联网的普及,网络已经成为人们获取信息的一个非常重要的手段。但是随着信息爆炸似的增长,人们很难在较短的时间内找到自己所......

学位

文本分类数据挖掘朴素贝叶斯支持向量机非规范语言模式匹配特征抽取

基于文本的互联网敏感视频分析方法研究

随着互联网技术的快速发展和三网融合的大力推进，互联网上的视频数量呈海量增长，对于视频内容的分析和监管也越来越重要。传统对于敏......

学位

网视频监控敏感视频文本预处理关键词提取反馈学习

基于二次特征提取的中文文本抄袭检测方法

近年来,随着信息技术和通信网络的飞速发展,人们获取信息的方式从大量的物质介质转化为网络文档,这种发展给人们带来了方便的同时......

学位

抄袭检测文本预处理二次特征提取文本相似度指纹

基于神经网络的文本倾向性分类研究

互联网是随着时代发展产生的新型信息交流工具,如今已经进入了我们学习生活中的方方面面。与此同时网络上可交流的平台越来越多,在......

学位

倾向性分类文本预处理特征抽取 BP神经网络

中文Web文本聚类研究

文本聚类是文本数据挖掘的重要技术,它是一种非监督学习,可以由计算机自动进行,不需要人工干预。文本聚类通过比较文本的相似性,能......

学位

文本挖掘聚类特征选取遗传算法孤立点

基于模糊聚类的文本挖掘方法研究

随着数据库和Internet技术的发展与应用，大量的文本数据也随之产生。用户很难从这些文本数据中获取自己所需的有价值的信息。因此，文......

学位

模糊聚类文本挖掘文本预处理文本模式提取模糊c均值

数字图书馆的中文网页文本分类器研究

随着计算机和因特网的迅速发展,网上信息的类型越来越丰富,可利用的资源也越来越丰富,这已成为数字图书馆的发展动力。同时网络存......

学位

数字图书馆网页文本分类分类算法分类器

国内基于主题模型的科技文献主题发现及演化研究进展

[目的 /意义]分析中国国内基于主题模型的科技文献主题发现及演化研究进展,以期为相关研究人员提供参考借鉴及研究思路。[方法 /过......

期刊

主题模型主题发现主题演化文本预处理参数估计

Hadoop的SKNN文本分类算法的设计与实现

随着科技的日新月异,信息技术在不断发展,可以说这个时代就是一个信息爆炸的时代.针对海量的信息处理,文本分类技术应运而生,这种......

期刊

Hadoop 文本预处理 SKNN文本分类算法

基于不良文本信息过滤预处理方法的研究

本文主要针对不良内容的敏感信息出现的特征变化,提出一种基于文本内容的不良信息过滤的文本预处理方案,并着重探讨了其结构变化的......

期刊

信息安全信息过滤文本预处理敏感词识别

看过本文同时还关注