B2B平台的反欺诈问题研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:a285074984
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
B2B电商平台上的欺诈问题一直困扰着电商平台的经营者,数据挖掘技术的出现,为电商平台的反欺诈工作带来了很大的帮助,然而数据挖掘技术在解决B2B电商平台的问题上,仍然存在一些不足:第一,在线欺诈问题描述性的研究较多,提出实际解决方案的比较少;第二,缺乏用来进行实验的真实数据;第三,以往研究很少考虑到类别不平衡问题与代价敏感问题。为了能够有效解决B2B平台上的欺诈问题,本研究选择了一个集成的分类算法-EasyEnsemble。EasyEnsemble分类算法在解决类别不平衡问题分类的过程包括两个步骤。第一步利用随机下采样的方法,将大类分成多个子集,每个子集与小类的样本是平衡的,并且每个大类的子集与小类样本结合起来作为训练集得到多个分类器;第二步使用AdaBoost集成技术将这些分类器集合起来。本文所用的数据来自于国内一家大型B2B电子商务平台公司的真实数据,选取2011年和2012年两年的用户信息数据共2760条,其中非欺诈的记录2500条,欺诈的记录260条。然后我们使用这些数据进行实验,通过将EasyEnsemble算法与常用的分类算法进行实验对比,发现EasyEnsemble算法的确是解决数据类别不平衡性问题的一个有效的算法,该方法解决了类别不平衡的分类问题,提高了分类的精确性,降低了误分类的比例,进而也解决了代价敏感问题。最后我们对EasyEnsemble算法处理样本数据得到的实验结果进行了深入的商业分析,这为电商平台的反欺诈工作提供了重要支持。本研究的贡献在于:首先,使用EasyEnsemble算法,有效地解决了类别不平衡问题,提高了分类正确率,降低了两类误判率,并同时解决了代价敏感问题,为今后的研究提供了一种新的思路。第二,本文使用的数据是B2B平台的真实数据,分类的效果更有说服力,实验结果更有商业意义。第三,使用有效算法对真实数据进行处理,并对结果进行了深入的分析,这给国内电商平台网站进行反欺诈的工作提供了实际的指导建议,而且为这些企业更好的进行电子商务给予了重要帮助。
其他文献
北京市水利规划设计研究院副总工程师邓卓智$$ “减渗”是维持永定河地表水量必然的选择$$ “减渗”是由永定河的自然条件决定的,是维持永定河地表水量必然的选择。$$
报纸
随着计算机网络的普及和网络用户数量的急剧增长,用户在计算机设备上存储的账号、密码等机密信息也越来越多,以窃取用户机密文件和个人隐私为目的的间谍软件已经超过传统意义上
目的:经静脉留置针持续输注盐酸胺碘酮注射液,观察兔耳缘静脉静脉炎发生情况、早期静脉炎组织形态学改变及C-反应蛋白的变化趋势,探讨胺碘酮注射液的持续输注时间与发生静脉
双因素理论是美国心理学家赫兹伯格提出的有关激发职工积极性的激励因素与保健因素,简称双因素理论。他认为造成职工不满意的主要原因是工资报酬、工作条件、人际关系等,这些因
目的:调查美沙酮维持治疗者滥用苯二氮卓类药物的发生率及相关因素。方法:对参加美沙酮维持治疗的海洛因依赖者进行尿苯二氮卓及吗啡检测,将苯二氮卓尿检结果与患者性别、婚姻
进入21世纪,医院的管理和建设水平迅速提高,清洗、消毒、灭菌的管理已进入科学化、规范化的轨道,医院消毒供应室已发展成为消毒供应中心。随着人们对医院感染的认识和研究逐步深
目的:探讨经外周置管的中心静脉导管在早产儿静脉输液中的应用及临床护理体会。方法:对24例胎龄26~34周的早产儿采用外周置管的中心静脉导管进行静脉输液。结果:24例早产儿均置管
目的:提高乳腺癌患者术后患肢功能康复效果。方法:将216例乳腺癌术后患者按就诊时间分为实验组和对照组各108例,对照组予传院护理方法,实验组患者实施PDCA循环护理,成立质量管
在在代电力系统中,电力电缆的应用越来越普遍。电缆的优点明显,但随着应用规模的扩大,所面临的问题也愈发突出。本文从国内外关于电力电缆爆炸的研究现状出发,综合分析了发生