基于文献计量和知识图谱的文本挖掘研究主题群识别与趋势分析

来源 :延边大学 | 被引量 : 0次 | 上传用户:sdfcasdvgase
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本挖掘的处理对象为文本数据,主要目的为抽取潜在的有价值的信息和知识,它是一种新兴的知识发现技术,在多个领域具有很高的应用价值,因此对我国文本挖掘技术的研究现状进行梳理显得很有必要。传统的内容分析法需要查找的内容多、耗时长,尽管可以得出结论,但整体研究的效率得以降低。而文献计量法却因为入门简单,结果科学全面而受到研究学者的重用。随着大数据时代的到来,CiteSpace等可视化软件应运而生,再结合SPSS等专业统计分析软件,文献计量法借助这些新兴软件也可以对文本数据进行一个更深层次的挖掘。本文的研究对象是文本挖掘,对中国知网数据库近二十年来以“文本挖掘”为主题的期刊文献进行研究分析。除了传统的计量方法外,本文引入CiteSpace、Ucinet、SPSS、R语言可视化工具,直观清晰地展现文献年代分布、作者之间的合作以及核心期刊构成情况,并通过对论文摘要和关键词中的高频主题词进行聚类与多维尺度分析,直观展示研究热点内容。最后对关键词进行突现词检测,结合文献数量变化进行趋势分析,得到未来发展过程中具备发展潜力的关键技术以及新兴应用领域。通过本文的研究可以帮助相关学者和专家认识到我国文本挖掘技术的研究现状、研究热点的变迁以及发展趋势,为研究和学习文本挖掘的个人和机构提供知识导航,进而推动我国文本挖掘技术的研究。
其他文献
在动力系统中,混沌的研究始于混沌现象的发现,1975年李天岩和Yorke首次给出了混沌的精确数学定义.根据不同的判定规则,人们给出了不同的混沌概念并进行深入的研究.在动力系统的
近些年,图谱理论是图论中一个飞速发展而又极其重要的研究领域.本文在前人的工作基础上,主要围绕赋权双圈图的邻接谱,强连通有向图的距离无符号拉普拉斯谱以及连通图的距离无
Gorenstein同调代数是一种热门的相对同调代数,经过近50年的发展,它已发展到了相当高的水平,取得了丰富的的研究成果.本文主要讨论强Gorenstein同调模的一些推广,其中大部分结论
随着Bezout矩阵理论的不断丰富和在越来越多领域的应用,Bezout矩阵已经成为矩阵与算子理论中的一个重要的研究课题.本文主要研究多个多项式的Bezout矩阵在一般基下的性质及表
设d1,d2,…,dk为k个非负整数。如果可以将图G的顶点集V划分为k个子集V1,V2,…,Vk,使得对于任意的i=1,2,…,k,Vi的点导出子图G[Vi]的最大度数至多为di,则称图G是(d1,d2,…,dk)-可着色的。在
随着旅游产业的不断发展,酒店行业内开始出现转型的现象。五星级酒店若想在激烈的市场竞争中争得一席之地,获得更长远的发展,就应该顺从精细化管理的趋势,从内部管理开始突破