基于MapReduce框架一种文本挖掘算法的设计与实现

来源 :郑州大学学报:工学版 | 被引量 : 0次 | 上传用户:conanyuexin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着文本挖掘在主动信息服务中应用的日益扩展,在文本数据的基础上分析数据的内在特征已经成为目前的研究趋势,本文在Hadoop平台上设计并实现了一种文本挖掘算法,该算法利用MapRe-duce框架按照自然语料中相邻词组出现的频数进行降序输出,从而有助于用户挖掘大量数据中各项集之间的联系,实验结果体现了该算法的有效性和良好的加速比.
其他文献
建筑设备作为近现代建筑中不可缺少的组成部分,对近现代建筑和城市的发展起着重要的作用。文章通过对于近代著名的慎昌洋行贸易及其工程实践的剖析,探讨跨国企业在中国近代建
“双基”,是中小学教学中对各学科基础知识和基本技能的简称,很长时间以来,中小学教学一直强调要“落实‘双基’”。现在实施基础教育课程改革,又兴起一种说法,说新课程“不讲‘双
目的系统评价体外冲击波(ESWT)治疗膝骨性关节炎(KOA)的临床效果。方法检索PubMed、Embase、Web of Science、the Cochrane Library、CNKI、CBM、VIP、WanFang等数据库中有关
文章不仅记录了业主与建筑师针对蒲园陈宅改造项目的一次对话——面对同一项目时的不同身份决定了两人思考与立场的差异,甚至冲突;也是一位人类学者与一位建筑学者的对话——
国际知名语言学家、台语著名专家哈德曼先生,通过跨学科研究台语历史语言及文化取得了令人瞩目的成果,对推动东南亚语言文化发展做出了积极的贡献。同时哈德曼先生在教学方面
调查显示,边疆民族地区意识形态建设取得了可喜的成绩,意识形态工作得到高度的重视,党心民心得到空前的凝聚,意识形态阵地得到有效管控,意识形态话语权明显增强。但是,边疆民