面向大规模数据双向抽样的异常识别方法

来源 :第三届CCF大数据学术会议 | 被引量 : 0次 | 上传用户：wubin811030

【摘要】

：

　　异常识别具有重要的研究价值，并广泛应用在诸多领域。随着大数据时代的到来，数据样本量和维度呈现爆炸式增长趋势，传统的异常识别方法已不足以应对如此大规模数据的异常识别

【作者】

：

邓波张玉超刘洪甫包阳

【机构】

：

北京系统工程研究所/北京航空航天大学

【出处】

：

第三届CCF大数据学术会议

【发表日期】

：

2015年10期

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

　　异常识别具有重要的研究价值，并广泛应用在诸多领域。随着大数据时代的到来，数据样本量和维度呈现爆炸式增长趋势，传统的异常识别方法已不足以应对如此大规模数据的异常识别问题。本文以基于密度的异常识别方法为基础，利用无监督式的双向抽样组合策略，将大规模数据集异常识别问题转化为任务独立的若干小数据集的异常识别问题。通过理论推导、实验验证证明了在抽样率满足一定条件时，应用双向抽样组合方法开展面向大规模数据的异常识别，能有效解决其面临的样本量大和维度高的问题，不仅可扩展性较强，而且具有重要的参考价值。

其他文献

Prophylactic and therapeutic effects of two human monocional antibodies against H7N9 influenza virus

　　The avian-originated H7N9 influenza virus first emerged in 2013 in eastern China.Infection of H7N9 could induce severe pulmonary disease and even lead to de

会议

磷脂酶C和D在木聚糖酶诱导的水稻悬浮细胞抗病反应中的作用

本文以水稻悬浮培养细胞为材料,研究磷脂酶C和磷脂酶D在木聚糖酶(Xylanase)诱导的水稻细胞抗病反应中的作用。我们用Xylanase(100μg/ml)处理继代3-5天的水稻悬浮培养细胞,细胞浓度(0.05g/ml),发现PLDa和PLDβ的活性在处理初期都被迅速激活,并在1h内达到峰值。但是PLDα的活性在2h时又再次被激活,出现第二个峰值,而后活性下降,趋于对照值；而PLDβ的活性在1h出

学位

激发子PLDPLC活性氧过敏性细胞死亡细胞凋亡樱花素

嘌呤核苷发酵过程多尺度问题及其优化研究

生物反应器中的发酵过程是在分子水平的基因特性、细胞水平的代谢调控和反应器水平的传递混合三个层次上同时发生的,因而决定了发酵过程优化的实质应该是代谢流分析为核心的

学位

嘌呤核苷发酵过程代谢流迁移

Protective Immunity of a Pichia pastoris Expressed Recombinant Iridovirus Major Capsid Protein in th

会议

HIV候选疫苗rFPVHg-Hp的免疫原性及安全性研究

会议

HIV候选疫苗免疫原性

皮肤组织工程胶原海绵支架材料的研究