面向大规模数据双向抽样的异常识别方法

来源 :第三届CCF大数据学术会议 | 被引量 : 0次 | 上传用户:wubin811030
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  异常识别具有重要的研究价值,并广泛应用在诸多领域。随着大数据时代的到来,数据样本量和维度呈现爆炸式增长趋势,传统的异常识别方法已不足以应对如此大规模数据的异常识别问题。本文以基于密度的异常识别方法为基础,利用无监督式的双向抽样组合策略,将大规模数据集异常识别问题转化为任务独立的若干小数据集的异常识别问题。通过理论推导、实验验证证明了在抽样率满足一定条件时,应用双向抽样组合方法开展面向大规模数据的异常识别,能有效解决其面临的样本量大和维度高的问题,不仅可扩展性较强,而且具有重要的参考价值。
其他文献
  The avian-originated H7N9 influenza virus first emerged in 2013 in eastern China.Infection of H7N9 could induce severe pulmonary disease and even lead to de
会议
本文以水稻悬浮培养细胞为材料,研究磷脂酶C和磷脂酶D在木聚糖酶(Xylanase)诱导的水稻细胞抗病反应中的作用。我们用Xylanase(100μg/ml)处理继代3-5天的水稻悬浮培养细胞,细胞浓度(0.05g/ml),发现PLDa和PLDβ的活性在处理初期都被迅速激活,并在1h内达到峰值。但是PLDα的活性在2h时又再次被激活,出现第二个峰值,而后活性下降,趋于对照值;而PLDβ的活性在1h出
生物反应器中的发酵过程是在分子水平的基因特性、细胞水平的代谢调控和反应器水平的传递混合三个层次上同时发生的,因而决定了发酵过程优化的实质应该是代谢流分析为核心的
会议
该文研究了添加壳聚糖、硫酸软骨素和肝素等添加剂,以及经过高温、戊二醛和EDC等方法交联处理后,胶原海绵理化性质和生物相容性的变化规律.实验结果表明,三种添加剂均能改善
本研究以新疆耐盐小麦品种新冬26为受体材料,采用花粉管通道转基因法将1Dx5基因转入受体植株,获得转基因T0代小麦,在对其T1代种子的检测中发现有部分种子内源1Dx2基因没有表
脂肪酶是工业生产中一种重要的酶类,其分离纯化研究具有重大的应用价值,本论文利用十六烷基三甲基溴化铵(CTAB)反胶团对两种工业脂肪酶(扩展青酶PF868和lipase M)进行萃取分
会议
会议