【摘 要】
:
计算机技术与互联网产业发展迅猛,数据量呈爆炸式的增长,我们进入了大数据时代。海量的数据中蕴含着大量的知识价值,机器学习作为一种可以从海量数据中提取有用信息的关键技
论文部分内容阅读
计算机技术与互联网产业发展迅猛,数据量呈爆炸式的增长,我们进入了大数据时代。海量的数据中蕴含着大量的知识价值,机器学习作为一种可以从海量数据中提取有用信息的关键技术,它的学习成本和使用门槛都比较高。数据分析的业务人员需要具备统计学知识、数据建模能力、算法设计能力和编程能力,为了降低业务人员的使用门槛,我们需要一个通用性强、简单易用、性能优异的针对大数据的分布式处理工具,实现对数据的分析。本论文设计和实现了 一个分布式机器学习算法编排系统,该系统在分布式环境上给用户提供简单易用的机器学习服务,降低了机器学习算法的应用门槛,让用户不用通过编写程序的方式进行数据分析和预测,让用户通过Web界面的简单操作流畅直观的完成数据导入、数据解析、模型训练、预测等操作,通过良好的Web界面交互为开发人员、业务分析师提供了交互式的机器学习服务。本系统以OpenStack云平台作为底层环境,提供了弹性可扩展的计算资源和存储资源,通过Hadoop在云平台上搭建分布式集群,其中 YARN (Yet Another Resource Negotiator)框架提供了并行计算的能力,HDFS (Hadoop Distributed File System)保证了海量数据的存储,上层的Spark为需要迭代的机器学习算法提供了更高效的内存计算能力。在机器学习算法方面,本系统在数据处理层实现了核心算法模块,提供了机器学习领域分类、回归、聚类等经典算法。在算法编排方面,本系统在业务逻辑层实现了工作流管理模块,提供了工作流编排的业务逻辑。在表现层通过交互组件模块实现了用户与网页交互的全部接口。系统测试结果显示本系统能保证所有功能稳定运行,实现简单友好的算法编排操作。同时本系统的算法性能也达到了预期性能要求。
其他文献
就施工企业的自身特点,结合ISO9001质量管理标准要求,具体分析了施工企业如何确认和控制特殊过程,并提出了具体的措施。
从天然气汽车及其上下游产业的国内外现柢国内市场空间、政策导向等若干方面。综合分析了我国天然气汽车产业发展中应重点把握的问题。
[摘要] 目的 找出33例左束支传导阻滞患者左心室不同步节段。 方法 应用组织多普勒(TDI)分别测量左心室心尖四腔、二腔及三腔切面的基底6个节段的主动脉瓣开放(AVO)至收缩速度达峰(S’)间期,应用组织同步成像技术(TSI)帮助确定TDI曲线中的矫正S’的测量点,通过最短AVO-S’间期来确定不同步节段。 结果 某节段的延迟间期大于正常对照者延迟间期上线时,认为是不同步节段,与正常对照组比较,
3月29日《阳泉晚报》有一则这样的新闻,“城区金三角社区邀请4名原居委会干部到社区参观,为新入职的社区工作人员讲述社区工作的特点,并传授工作经验。通过‘传帮带’的方式,对新
供暖散热器作为供暖系统的末端装置,与热源、热媒输送管道一起组成供暖系统,将热媒携带的热量传递给房间的空气,以补偿房间的热耗。供暖散热器因为系统运行与管理水平较低、
ISO“道路车辆”技术委员会(ISO/TC 22)成立于1947年,目前下设22个分技术委员会(SC)和85个工作组(WC),秘书国为法国(AFNOR)。迄今为止已制定发布了600多个标准,其中100多个标准是2005年
今年4月1日起,第一批"噪音小、零排放、零污染"的26辆崭新纯电动公交车在青浦区上线投入运营,此举标志着青浦区又向绿色公交新时代迈进了坚实一步。已运营的纯电动公交车除绿色
机械真空技术因其即开即得、可精确控制、运行可靠、节能环保,正在逐步成为大型真空脱气系统的首选。介绍了宝钢特钢以合同能源管理模式实施机械真空节能改造,用机械真空泵替
目的:对利多卡因和恩丹西酮减轻异丙酚注射痛的效果进行比较,选出较佳的方案供临床使用.方法:择期手术患者89例,ASA Ⅰ~Ⅱ级,按随机、双盲、对照法将患者分为三组,利多卡因组3