支持向量机在龙芯平台下SIMD加速和并行化

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:zxzwo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据挖掘、模式识别等领域的发展,机器学习越来越受到人们的重视,作为机器学习领域的一种重要算法,支持向量机由于其优良的性能指标得到了广泛的应用。而对于面向服务器和高性能计算的龙芯3系列平台,并没有专门优化的支持向量机工具包,直接移植的程序往往性能较差,不能充分利用龙芯平台的硬件特性。因此,结合机器学习算法特点研究龙芯平台下的支持向量机优化方法,对于龙芯在数据挖掘和模式识别等领域的应用有着重要意义。  本文以龙芯3B为平台,选择了流行的支持向量机工具包LIBSVM进行优化。针对LIBSVM中密集的点乘操作,本文使用向量指令对其加速,实现了点乘操作的单指令流多数据流计算,提高了基础操作的性能。针对龙芯3B的多核架构,本文提出了基于动态阈值的SMO算法工作集选择并行化方法,充分利用多个处理器核心,又能针对不同的问题规模在串/并行方法间寻求折中。除此之外,本文还利用OpenMP对LIBSVM执行过程中的关键函数进行了并行化,并对不同调度策略和任务粒度进行了对比,选择最优方案。通过并行化,原本在单一处理器核上执行的计算被分配到多个处理器核同时进行,提高了程序的性能。  本文对每种方法的优化效果分别进行了测试。结果表明使用向量指令优化后的基础函数能够获得10%左右的性能提升,而通过并行化手段,能够使程序性能获得成倍的提高。通过以上优化,龙芯平台下支持向量机的训练效率得到大幅提高,有助于基于支持向量机的应用在龙芯平台上的部署。
其他文献
车联网系统旨在通过车车之间(V2V)、车路之间(V2I)的信息交互,有效地降低道路事故率,提高交通效率,并为用户提供高质量的流媒体服务。在行车安全方面,基于短距离通信协议(DSRC)的
随着互联网和办公自动化的日益普及,PDF(Portable Document Format)文档以其丰富的功能、高度的集成与封装以及平台无关的特性迅速成为全球电子文档分发的开放式标准。PDF文档
互联网中的信息聚类与整合是研究人员一直关注和研究的热点问题,由于信息量大,算法需要综合考虑准确率、运行效率和存储开销等问题,存在较大研究难度。本文针对互联网中新闻信息
藏文信息处理的研究已有多年的历史,但直到近几年,主流的操作系统平台才逐渐完善地解决了Unicode国际标准藏文字符集支持问题,但目前仍有多种藏文编码在使用,数据交换和共享仍然
基于位置的服务(Location based Service,LBS)对于人们的生活有着至关重要的作用,而空间定位技术是整个LBS系统得以实现的核心技术。目前,以GPS(GlobalPositioning System)为代表
随着互联网和多媒体技术的快速发展,网络视频服务已经变得越来越流行,互联网上的同一视频需要为不同播放终端和不同网络接入方式的用户提供相同内容的视频服务。由于播放终端的
随着在线社交网络平台的大量涌现以及用户参与度的持续增长,我们已步入在线社交的信息化时代。社交网络中的关键人物处于网络中心或桥节点的位置,一方面,其言论具有代表性,反映了
新材料的开发和生产已经成为一个国家工业化快速发展的制约因素之一。几十年来,先进材料的研发以及利用它们所设计出的新产品使得以美国为代表的发达国家在全球保持了强有力的
近些年来,互联网基础设施发展逐渐陷入僵化形势,通过研究创新促使互联网朝良性方向演化是未来网络发展的唯一出路。未来互联网试验床为下一代互联网体系研究提供了规模可观的试
为了提高室内覆盖质量,满足用户不断增长的业务需求,LTE中引入了家庭基站技术。家庭基站的引入提高了系统容量,增强了网络覆盖,减轻了宏网的流量压力;同时也带来了干扰,频繁切