Boosting算法理论与应用研究

来源 :第三届CCF大数据学术会议 | 被引量 : 0次 | 上传用户:cc023061227
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  作为机器学习领域最经典算法之一, Boosting是一种集成学习算法,并广泛应用于机器学习与模式识别各领域.Boosting的理论研究分为可学习理论和统计学两个角度.Boosting最初从弱可学习理论角度阐明了由弱到强的提升算法,从理论上证明了一组优于随机猜测的弱学习器通过集成,可提升为在训练集上任意精度的强学习器.从统计学的角度看,Boosting是一种叠加模型,理论上二者的等价性已经证明.本文首先从可学习的角度出发,回顾了Boosting算法弱可学习理论,并提出面临的问题及挑战,包括对高维数据的有效性及Margin理论.随即说明Boosting算法理论研究分支,并详细回顾了当前最为流行的几种经典Boosting算法,及在Boosting理论框架下的新应用.最后,在探讨Boosting算法未来研究趋势的基础上总结全文.
其他文献
  伴随大数据的涌现,云存储和计算技术近年得到长足发展。大图计算作为大数据分析应用的典型代表,正成为云端负载的重要组成部分。目前,高可扩展性的图计算主要依赖于高性能计
会议
  根据微博平台开放性、低门槛以及微博数据充斥大量噪音的特点,同时结合条件随机场在词性标注特征提取的优势,提出对微博数据降噪,然后使用CRFs对未登录词词性标注,并利用谐音
  随着大数据计算支撑系统日趋复杂,软件错误、软件兼容性、管理失误甚至恶意入侵等导致的拜占庭故障对系统可用性的影响日趋严重。由于拜占庭故障节点可以采用含糊行为欺
会议
本文从教学实践出发,探讨问题一探究教学模式的操作要义,分析该模式的特点,并指出其存在的不足.
  本文提出一种经由定制关系网络,改进基于矩阵分解的社会化推荐模型来缓解数据稀疏性和冷启动问题并进一步改善可扩展性(scalability)问题。在模型中,关系网络的社会影响力
会议
  随着带有GPS定位功能的智能手机越来越普遍,人们喜欢分享他们的地理位置或者通过评论某个地方的商品从而留下用户的足迹,这引发了以共同的兴趣点(POIs)为中心,基于地理位置
会议
  网格中参与者的信誉是经济模型与网格技术结合的服务选择的一个重要指标。传统的信誉评价模型忽略了经济因素,包括网格中的交易量和交易时间。这些因素对参与者的信誉的建
目前,国内外普遍使用流态化焙烧氧化处理复杂金精矿,处理后的尾渣中的金品位仍然较高,有的甚至高达5g/t以上,同时还含有其它有价元素。针对焙烧后经氰化浸金后的氰化尾渣,经过制粒
阿尔茨海默病(Alzheimers Disease,AD)是一种严重威胁老年人生命健康的以记忆力下降为特征的神经退行性疾病,脑内病理特征主要表现为由β-淀粉样蛋白(β-amyloid,Aβ)在神经元细胞
本论文的工作分为两个部分:(1)组蛋白组蛋白去乙酰酶抑制剂(HDACI)的计算机辅助设计;(2)双膦酸盐的计算机辅助研究.目前,用组蛋白去乙酰酶抑制剂治疗癌症是分子生物学研究的