在线广告的点击欺诈问题研究

来源 :中国科学院研究生院 中国科学院大学 | 被引量 : 0次 | 上传用户:gaorongqing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在线广告已经成为了最为重要的营销工具之一。而按点击付费(Cost-perclick,CPC)广告由于具备计量准确性、效果相关性等特点,占据了在线广告市场超过60%的市场份额。但是,CPC广告按照广告点击数量付费的特点,导致了点击欺诈(Click Fraud)问题的产生。点击欺诈是指在CPC广告中那些不因广告兴趣而产生的,以增加广告费用为目的,模仿正常用户的广告点击行为。目前,点击欺诈问题每年给CPC广告市场造成数以亿计的巨大损失,已经成为了危害在线广告市场生态环境的严、重问题。   本文结合了经济博弈理论分析、实证数据验证、计算实验方法和统计机器学习方法,对点击欺诈行为的产生和演化规律、点击欺诈对在线广告市场的影响以及市场因素对点击欺诈的作用等问题进行了深入的分析,并对点击欺诈的计算实验方法和检测方法进行了研究,对于点击欺诈的预防和应对具有重要意义。以下简要介绍本文的主要结论和贡献:   (1)在发布者的膨胀性欺诈研究中,与现有研究将发布者欺诈行为作为市场外生因素不同,本文将发布者欺诈行为作为内生的竞争策略,并在博弈框架下对其进行了研究。分析结果表明,当市场上仅有一个发布者时,并不会出现欺诈行为。而当发布者间的竞争出现后,进行欺诈是竞争中的均衡策略。在市场均衡状态下,发布者会根据自己市场规模的不同选择相应的欺诈策略。其中,市场规模较大的发布者在均衡状态中会得到低于无欺诈市场的收益,而市场规模较小的发布者在均衡状态下的收益可能高于无欺诈市场。因此,欺诈侵害了大规模发布者的利益,也损害了市场的效率。   (2)在广告主的竞争性欺诈研究中,本文设计了一个广告主两阶段博弈模型,并分析了该博弈的子博弈完美纳什均衡的分布和性质。研究发现,广告主竞争性欺诈行为受到广告主预算、欺诈者点击价值以及市场惩罚力度的共同影响。另外,竞价机制中的保留价不仅能够降低竞争性欺诈产生的可能性,也能降低欺诈的程度。当竞争性欺诈出现后,正常广告主的投资回报率会随之降低。而当竞争性欺诈成为潜在威胁存在时,会导致广告位拍卖中无效率均衡的出现,并降低了广告主和搜索引擎的收益。因此,相比于发布者膨胀性欺诈所造成的直接影响,广告主的竞争性欺诈威胁对市场效率和收益的危害更为持久且难以察觉。   (3)结合博弈理论分析和实证数据验证,本文还对点击欺诈和市场因素的关系进行了分析。首先,本文比较了“固定价格”和“实时竞价”两种不同的广告定价模式对于点击欺诈行为的影响。理论分析结果表明,在市场均衡状态下,在固定价格模式中的点击欺诈比例更高,而发布者的总收益更低。并且,对真实点击数据的分析结果也发现了两种模式下点击欺诈率的前述差异。此外,针对统计数据中点击欺诈率的大幅波动问题,本文结合理论分析结果和对实际数据的计量分析,证实了广告费用的变化会导致市场点击欺诈率的正向变化。   (4)为克服传统分析方法中建模尺度、分析能力和实验评估方面的约束,本文基于关键字广告竞价实验平台,针对市场竞争对发布者欺诈的影响问题,通过对市场参与者行为建模,设计了相应的点击欺诈实验场景并进行了计算实验。计算实验结果表明,发布者竞争导致了欺诈的产生,并且随着竞争激烈程度的上升,欺诈比例会逐渐升高,而广告主竞争的加剧也会导致发布者欺诈比例的升高。本文的计算实验拓展了理论分析,并且还通过对非收敛投标策略的实验,评估了分析结果的鲁棒性。   (5)针对实际欺诈点击检测中面临的无标注数据和不同性质欺诈行为适用性的问题,本文提出一种基于用户异常行为的半监督欺诈点击检测方法,并将隐马尔科夫模型作为该方法的建模技术。本文使用真实数据集对该方法的检测效果进行了初步的评估,并与传统的重复检测方法进行了对比,结果表明所提出的欺诈点击检测方法有效的克服了数据标注问题,并具备对不同欺诈形式较好的可拓展性和对个体复杂欺诈行为的适应性。
其他文献
人类已经进入信息时代,随着互联网的快速发展,网络上的信息呈几何指数增长。然而,面对不断膨胀的海量资源,人们却很难找到需要的信息。虽然随着信息检索技术的发展,人们已经能够通
缺省逻辑是非单调性推理的一种重要方法。基于命题缺省逻辑的推理问题的计算复杂度在多项式分层的第二层上,因此它可以用来描述很多具有相同复杂度的问题。判断聚合理论是社会
近年来国内外对地观测的分辨率愈来愈高,空间任务产生的数据量也随之增加,这就要求空间卫星通信链路在保证较低的误码率的同时,需要具有更高的通信速率;同时随着新的数字信号处理
本文针对初中生几何证明解题困难,例如在开始接触几何证明题的学生觉得几何证明题困难,在学习几何证明的过程中,无法有效的进行图形、文字、符号三种语言的转换,在解题时不会
星载计算机是卫星数据管理系统中的关键部件,负责各种数据的采集、处理、存储、转发等工作。随着航天任务复杂度的提高,星载计算机的性能也需要越来越高。上世纪80年代,我国的星
随着高性能计算机系统规模的增大,系统的可靠性问题也越来越突出。目前高性能计算机系统容错大都采用检查点技术,通过周期性地将系统的状态写入磁盘。但随着高性能计算机系统
由于航天任务的高风险和高投入,越来越多的航天器在一次使命设计中提出探测多个天体或空间目标的需求,这就对访问多个目标的轨道设计提出了要求。多目标探测轨道设计需要确定天
以SaaS方式交付的软件服务正成为越来越多企业的选择。多租户技术,作为SaaS应用其中一项核心技术,该技术的运用使得多个租赁相同或类似软件服务的租户可以共用一个软件实例,提高
近地空间环境中的电场和空间天气有着密切的关系,而航天器发射中需要考虑的重要的参量也包括空间电场的强度,空间电场强度对于预报太阳活动、雷暴活动、地震活动以及大气污染有
学位