基于新型异构计算平台的数据挖掘算法研究与实现

来源 :电子科技大学 | 被引量 : 7次 | 上传用户：luochaojie123456

【摘要】

：

大数据时代的到来极大地推动了数据挖掘算法的研究与应用,其中KNN算法和K-means算法作为“十大数据挖掘算法”中分类算法与聚类算法的代表,被广泛应用于文本信息分类、金融预

【作者】

：

彭军

【出处】

：

电子科技大学

【发表日期】

：

2015年01期

【关键词】

：

异构计算 FPGA 数据挖掘算法 OpenCL

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

大数据时代的到来极大地推动了数据挖掘算法的研究与应用,其中KNN算法和K-means算法作为“十大数据挖掘算法”中分类算法与聚类算法的代表,被广泛应用于文本信息分类、金融预测、生物基因工程、图像信息处理等各个领域。然而随着信息和数据的爆炸式增长,KNN算法与K-means算法的快速实现面临着巨大的挑战,基于FPGA的新型异构计算平台为加速此类算法的实现提供了新的解决方案。与大型工作站或计算机集群相比,基于FPGA的新型异构计算平台具有价格更低、体积更小等优势;与GPU平台相比,FPGA平台具有功耗更低、能量效率更高等优势。因此,本文基于FPGA新型异构计算平台,对KNN和K-means两种数据挖掘算法进行OpenCL异构实现研究。首先,本文基于FPGA异构计算平台的特点,设计了KNN算法的异构实现方案KB-KNN。为了充分发挥异构平台的优势,本文将待分类数据进行分组,并采用设备间流水的并行实现方案,使异构系统中的主机与从机同时参与运算,增加硬件资源的利用率。在FPGA加速内核的设计上,本文改进了KNN算法中传统的一维并行排序方案,采用了更易并行,结构更加简单的K并行冒泡实现结构。为了充分利用FPGA的全局内存带宽,本文使用访存聚合等优化方法,提高了系统的吞吐量。其次,本文设计了基于FPGA异构计算平台的K-means算法实现方案FPKmeans。根据算法的特点,采用FPGA与CPU协同计算的实现方案,增加了硬件资源的利用率。对系统的访存行为进行了优化,减少全局内存的访问,并充分利用私有内存与本地内存提高了数据读取与写入的速度。最后,本文基于FPGA+CPU的异构计算平台,采用不同数据集对KB-KNN和PF-Kmeans异构加速方案进行了实现与测试,并分别与现有的基于GPU平台的方案CU-KNN和CU-Kmeans进行对比。测试结果表明,KB-KNN方案与移植到FPGA平台上的CU-KNN方案相比获得了1.7倍的加速比,与原始CU-KNN方案相比获得了1.5倍的能效比。本文设计的PF-Kmeans方案与移植到FPGA平台上的CUKmeans方案相比获得了2.3倍的加速比,与原始CU-Kmeans方案相比获得了2.1倍的能效比。

其他文献

中国国内旅游市场持续高速增长

据新华社报道，国家旅游局日前发布的《2016年中国旅游业统计公报》显示，全国旅游业对GDP的综合贡献为8．19万亿元，占GDP总量的11．01％。公报显示，国内旅游市场持续高速增长，入境旅游市

期刊

持续高速增长国内旅游市场中国旅游业GDP总量入境旅游市场出境旅游市场统计公报国家旅游局

“个案改变中国?”——影响性诉讼中公众意见对司法的影响及其阐释

<正>一、问题引入:"社会问题司法化"背景下的影响性诉讼所谓影响性诉讼,指在一国或一个地区的相关人群普遍知晓,广为关注,可能引起立法和司法变革,引起公共政策的改变,影响公

会议

连续性协同护理模式在COPD稳定期患者肺康复训练中的应用

目的研究连续性协同护理模式在COPD稳定期患者肺康复训练中的应用。方法选取本院2013年3月~2014年3月收治的COPD稳定期患者101例作为研究对象,以不同治疗方案分为对照组50例

期刊

COPD稳定期患者连续性肺康复连续性协同护理模式

李克强同特鲁多举行年度对话

据新华社电2017年12月4日下午，国务院总理李克强在人民大会堂同加拿大总理特鲁多举行第二次中加总理年度对晤。李克强欢迎特鲁多再度访华，积极评价中加关系一年来的发展，充分肯

期刊

战略对话李克强国务院总理人民大会堂国家安全联合声明气候变化清洁能源

压力感知、创意自我效能和大学生创造力的关系研究

本研究引入压力认知激活理论,基于理论的三个核心假定,构建了大学生压力感知对于创造力的影响模型,并在此基础上加入创意自我效能感,探讨三者之间的作用关系。本研究首先梳理

学位

压力感知创意自我效能大学生创造力

对话嘉信力旅运:中国已成全球最大商旅市场新一线城市成都潜力无限

近日,嘉信力旅运(CWT)旗下主营MICE服务版块的CWT会议与活动部(CWT Meetings&Events)发布其2020年亚太地区会议及活动十大城市榜单。其中,中国城市占据近半壁江山,上海坐稳头

期刊

新一线城市CWT商旅市场

地下商业建筑火灾中人的疏散行为研究与设计优化

火灾情况下疏散时间是人员生存的决定因素,因此研究人员在建筑物中的疏散行为及其影响因素具有重要意义。研究采用虚拟现实的方法,构建了地下商业商业建筑虚拟场景,并招募30

期刊

疏散行为个人因素虚拟现实地下空间

螺旋水刀在亲体肝移植供肝切除术中的优势与应用

目的探讨螺旋水刀在亲体肝移植术中应用的优势。方法开腹游离肝周韧带充份暴露肝脏并定位切除线后用螺旋水刀进行断肝，肝内管道采用3-0线进行缝扎，切除后肝断面用止血纱布进行

期刊

螺旋水刀肝切除术亲体肝移植water jet life liver transplantation

提高初中数学课堂教学效率的策略分析

随着社会的高度发展,人们对初中数学教学的关注程度越来越高。而课堂作为初中数学教育教学的主阵地,更是决定着数学教育教学的教学质量,在初中数学教学课堂上,教师对学生进行

会议

新课改初中数学课堂教学

女性强迫性性冲动伴性窒息一例报告

<正> 患者李某,女,二十九岁,初中毕业,农民,已婚,排行老大,性格内向,害羞,胆怯,拘谨,做事聪明能干,不善与人交往。童年时代因妹弟多人(四个妹妹,一个弟弟),家庭经济状况比较

期刊

强迫性性冲动性窒息

基于新型异构计算平台的数据挖掘算法研究与实现

其他学术论文