论文部分内容阅读
随着数据流量的指数增长,大数据成为当前计算设备超乎预期的负担.近年来大数据的降维倍受关注,应用降维技术对原始数据进行核心信息提取,可以大幅降低数据存储空间占用.本文提出一种大数据用户偏好信息全局降维算法,该算法主要面向解决分布式大数据降维中的三类核心问题:大数据聚合、降维算法和分布式计算的架构设计.理论分析表明,所提算法可以有效减少数据存储所需空间、提升数据转换效率,且对计算能力配置的需求有明显降低.