基于坐标下降邻域选择的高斯图模型结构并行估计

来源 :第三届CCF大数据学术会议 | 被引量 : 0次 | 上传用户:y871655121
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  在许多机器学习问题中,往往需要研究高维数据中各个特征之间的统计相关性。稀疏高斯图模型作为解决这一问题的有效方法之一,广泛应用于数据挖掘、生物信息、金融分析等应用问题中。由于模型参数量是数据维度的平方量级,基于高维数据的稀疏高斯图模型的参数估计一直是统计机器学习研究中的挑战性问题之一。本文针对该问题提出了一种新颖的基于坐标下降优化的稀疏高斯图模型并行估计算法。该方法的核心思想是根据高斯图模型结构估计等价于每个变量的稀疏近邻选择这一基本结论,采用坐标下降来求解每个近邻选择子问题。通过将样本矩阵进行分布式存储,在MPI框架下实现了这些子问题的并行求解。实验结果表明,本文的算法具有良好的并行运算性能,在保证结构估计精度的同时,能够大幅度提升运算速度。
其他文献
霍乱弧菌既是自然水生环境中的常著菌也是引起人类腹泻疾病霍乱的病原体。霍乱弧菌的主要致病因子有ctxAB基因编码的霍乱毒素CT; TCP致病性岛,它编码TCP菌毛,该菌毛是霍乱弧菌在宿主肠道的定殖因子,也是CTXφ的受体;toxR,一个基本的毒力调节基因,编码CT和TCP的基因都受ToxR调控。本文以霍乱弧菌LZV608为研究对象,通过质粒pSC123上的Mariner转座子的随机插入构建突变子文库
  水上交通模式是进行异常发现、贸易分析等态势感知的基础,其中最重要的是船舶密度和交通密度信息,分别反映了单位面积的船舶数量和单位面积单位时间通行的船次.本文提出
会议
中职机械制图课程应按够用、实用的原则制定教学要求,精选教学内容,将理论教学与实践活动融为一体,注重将综合素质教育贯穿于教育教学全过程,全面提高学生的就业能力。 Seco
  分布式计算应用在数据的混洗传输阶段产生巨大的流量,令数据中心的东西向网络资源成为瓶颈,严重影响应用性能。网络和计算资源联合实现网内关联性流量的聚合,能够极大降低对
会议
今年春节刚过不久,接到《收藏界》高社长为中国名家收藏委员会主办的“第2届影响中国收藏界经典人物艺术造象”创作国画《梁思成》的邀约,便爽快答应。因吾对梁公,向来景仰有
小麦白粉病是一种由布氏白粉菌小麦专化型(Blumeria graminis f. sp. tritici Bgt)引起的世界范围内的小麦叶部病害。培育和利用抗白粉病品种是控制该病害最为有效的措施。具有丰富遗传变异的小麦地方品种是小麦白粉病抗性重要遗传资源。经过抗性鉴定,发现小麦地方品种小红皮对白粉病免疫。经典遗传分析表明小红皮含有两个隐性抗白粉病基因,但分子标记分析结果表明小红皮携带了一个隐性抗白
  子图查询是图数据库研究中的一个重要问题,许多方法基于"过滤-验证"策略进行子图查询,算法研究的重点为快速找到有效的特征集.通过对特征模式在数据图集中的嵌入信息进行
会议
  在车联网的应用实践中,我们将分析车辆数据的任务运行在流式计算系统中。在运行分析中发现,这些任务具有运行周期长、处理延迟低、任务有状态等需求和特点,并且计算过程中需
会议
煤焦油中,沸点高于360℃的重组分物质(如沥青)组分含量高,大约可占煤焦油总量的50%。在热解实验中,该部分重质组分极易沉积,会导致装备中灰尘的夹带,进而堵塞和污染下游设备(如管道、
  基于列族的数据存储面向诸如RDF数据等无结构或半结构数据.人们通常从频繁的相关列中抽取列族.对相关列进行关联挖掘会使得列族之间会出现覆盖,这是列族存储的新趋势.在传
会议