基于MapReduce框架一种文本挖掘算法的设计与实现

来源 :郑州大学学报：工学版 | 被引量 : 0次 | 上传用户：conanyuexin

【摘要】

：

随着文本挖掘在主动信息服务中应用的日益扩展，在文本数据的基础上分析数据的内在特征已经成为目前的研究趋势，本文在Hadoop平台上设计并实现了一种文本挖掘算法，该算法利用MapR

【作者】

：

朱蔷蔷张桂芸刘文龙

【机构】

：

天津师范大学计算机与信息工程学院

【出处】

：

郑州大学学报：工学版

【发表日期】

：

2012年5期

【关键词】

：

HADOOP MAPREDUCE 相邻词组降序输出 Hadoop MapReduce adjacent phrase descending output

【基金项目】

：

国家自然科学基金资助项目（60970060）,天津市教委资助项目（20071328）,天津市科技支撑计划重点项目（09ZCKFGX00500）,天津师大博士基金项目（52LXl7）

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着文本挖掘在主动信息服务中应用的日益扩展，在文本数据的基础上分析数据的内在特征已经成为目前的研究趋势，本文在Hadoop平台上设计并实现了一种文本挖掘算法，该算法利用MapRe-duce框架按照自然语料中相邻词组出现的频数进行降序输出，从而有助于用户挖掘大量数据中各项集之间的联系，实验结果体现了该算法的有效性和良好的加速比．

其他文献

中国近代建筑设备技术的转移以慎昌洋行的建筑实践为例

建筑设备作为近现代建筑中不可缺少的组成部分,对近现代建筑和城市的发展起着重要的作用。文章通过对于近代著名的慎昌洋行贸易及其工程实践的剖析,探讨跨国企业在中国近代建

期刊

中国近代建筑设备技术转移慎昌洋行

新课程的“双基”

“双基”，是中小学教学中对各学科基础知识和基本技能的简称，很长时间以来，中小学教学一直强调要“落实‘双基’”。现在实施基础教育课程改革，又兴起一种说法，说新课程“不讲‘双

期刊

“双基”新课程中小学教学基本技能教学基础知识课改理念课程实施说法新课改学科教师

体外冲击波治疗膝骨性关节炎的meta分析

目的系统评价体外冲击波(ESWT)治疗膝骨性关节炎(KOA)的临床效果。方法检索PubMed、Embase、Web of Science、the Cochrane Library、CNKI、CBM、VIP、WanFang等数据库中有关

期刊

体外冲击波膝骨性关节炎META分析Extracorporeal shock wave therapyKnee osteoarthritisMeta ana

关于建筑与设计的人类学碎片对话蒲园陈宅改造

文章不仅记录了业主与建筑师针对蒲园陈宅改造项目的一次对话——面对同一项目时的不同身份决定了两人思考与立场的差异,甚至冲突;也是一位人类学者与一位建筑学者的对话——

期刊

改造建筑建筑师设计

国际台语教学科研引领人——西南边疆语言文化专家访谈之“哈德曼专访”

国际知名语言学家、台语著名专家哈德曼先生,通过跨学科研究台语历史语言及文化取得了令人瞩目的成果,对推动东南亚语言文化发展做出了积极的贡献。同时哈德曼先生在教学方面

期刊

国际台语总统卓越教学教授跨语言文化international Tai presidential teaching professor cross--lin

边疆民族地区主流意识形态话语权建设的调查与研究

调查显示,边疆民族地区意识形态建设取得了可喜的成绩,意识形态工作得到高度的重视,党心民心得到空前的凝聚,意识形态阵地得到有效管控,意识形态话语权明显增强。但是,边疆民

期刊

边疆民族地区意识形态话语权建设

基于MapReduce框架一种文本挖掘算法的设计与实现

其他学术论文