深入浅出大数据分析

来源 :2016第七届中国数据库技术大会 | 被引量 : 0次 | 上传用户:a282952061
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大数据分析三个指标:易理解、分析能力、扩展性,数据分析常用方案:第三方统计服务、业务数据库写SQL、基于日志写统计脚本。
其他文献
针对目前性能管理及优化服务现存的众多问题,必须采取相应且有效的措施予以解决。目前采用的方案为充分利用云服务、发挥工具的作用、采用基于中心化的服务模式等,经过实践具有不错效果。
本文介绍MongoDB在58同城的使用情况,分析MongoDB在58同城的架构设计与实践,研究针对业务场景在MongoDB中如何设计库和表,介绍数据量增大和业务并发,遇到典型问题及其解决方案。
本文阐述作者十年风雨数据路从Oracle DBA到ACE总监的成长之路,包括D BA成长篇和创业维艰篇,包括团队、资源借力、激发潜能、做Leader不做Boss、选人用人的艺术、愿景、团队、人脉、执行力、创业者独白。
智能预测分析平台针对业务用户,不用编程数据挖掘工作可以轻松完成,针对专业用户,可以通过R语言创建定制的算法(支持R语言加密),完全库内运算,无需传输数据支持50万以上的变量,在数字化核心的基础上将整个,价值链数字化作为业务创新与最佳化平台。
通过全面的数据采样与分析,进行数据整合规划,容量评估,安全和高可用评估;结合业务现状、数据库现状、软硬件资源现状,为用户制定数据整合方案;指导用户实施数据整合和集中。通过整合模型,进行科学的容量规划和性能推演,制定了科学的整合方案;将客户现有的数十套数据库,整合为1,2,3套数据库环境;降低了70%-80%的总体成本,大大改善了用户的运维管理。
按照ServerPool的Importance顺序,依次填充每个ServerPool,填充至Min个服务器。如果还有剩余机器,则进入到下一步。再按照ServerPool的Importace顺序,依次填充每个ServerPool,填充至Max个服务器,如果还有剩余的机器,则进入到下一步。再剩下来的机器进入到Free Pool中。
TDProcess流式处理核心需求:基于消息的流式处理,分布式(方便线性扩展,应对数据的爆炸那曾长计算),实时(数据消费计算延时毫秒级)。特色功能:服务级功能抽象、统一的资源管理、多种编程接口。
智能预测分析平台,针对业务用户,不用编程数据挖掘工作可以轻松完成,针对专业用户,可以通过R语言创建定制的算法(支持R语言加密),完全库内运算,无需传输数据支持50万以上的变量。
本文阐述了百度分布式Redis平台挑战与方案:近地域多机房解决方案、1分钟整机房切主、基于服务混部的Auto Scaling、MySQL&Redis融合方案。
本文主要介绍了并发写一致性、数据冗余一致性、主从库一致性、数据库与缓存一致性实践,保证数据的可用性。