【摘 要】
:
广告点击率(Click-through Rate, CTR)预估是在线广告推荐中的一项重要研究任务,它旨在预测用户在广告显示中点击广告的可能性。最近,随着神经网络在很多领域都取得了不错的成绩,越来越多的研究人员提出了基于神经网络的模型用于CTR预估任务中。这些基于神经网络的CTR预估模型一般只通过原始特征去学习低阶和高阶特征交互。然而,原始特征通常都是高维稀疏的这使得神经网络模型很难在大量参数下学
论文部分内容阅读
广告点击率(Click-through Rate, CTR)预估是在线广告推荐中的一项重要研究任务,它旨在预测用户在广告显示中点击广告的可能性。最近,随着神经网络在很多领域都取得了不错的成绩,越来越多的研究人员提出了基于神经网络的模型用于CTR预估任务中。这些基于神经网络的CTR预估模型一般只通过原始特征去学习低阶和高阶特征交互。然而,原始特征通常都是高维稀疏的这使得神经网络模型很难在大量参数下学习到有效的特征交互。有些学者提出利用特征工程增加有效稠密的特征来提高模型性能,但特征工程需要有一定的领域知识和大量的人力,这通常是昂贵的而且引入特征工程会使得模型在其他领域或任务上的迁移变得困难。因此,我们有必要去设计一种能自动生成更多稠密特征的模型,建立更有效神经网络模型,来解决这个问题。在此,我们提出了一种更高效,准确的基于神经网络的量子启发模型用于CTR预估任务中。本文结合基于密度矩阵表达方式和卷积神经网络的优点,设计了一种基于密度矩阵的卷积神经网络模块用于自动提取稠密有效特征。将一个输入实例构建成一个用密度矩阵表示的量子系统,然后利用卷积神经网络提取密度矩阵中的特征交互。之后,构建了一个CTR预估模型DMCNN(Density Matrix Based Convolutional Neural Network)。这个模型将原始特征归一化后和基于密度矩阵表示的卷积神经网络模块中抽取的特征拼接后送入一个神经网络中做点击率预测。本文提出的DMCNN模型在多个著名公开数据集上取得了较好成绩证明了本模型的有效性。我们将量子理论的语言表达优势与传统神经网络相结合应用于CTR预估任务中,这为CTR预估任务的发展提供了新颖的思路,具有一定的科学意义。
其他文献
语音不仅传达着语义信息而且也传达着情感信息。计算机使它的使用者能够通过自然的交互,高效高质量地完成既定的任务。随着语音情感挖掘工作的不断发展,对社会服务、医学、安全、工业控制等相关领域都有实际的应用,但是由于情感定义的不确定性和缺乏统一的建立标准的数据库以及情感特征的模糊性,使得语音情感识别技术成为了一个难题,还存在许多有待攻克的难关。为了解决语音情感识别中识别率不高和还不能做到迁移学习且鲁棒性较
随着大数据时代的飞速发展,数字图像在互联网上的应用和传输已经比过去普遍得多。因此,图像的加密和压缩技术对公共网络上的实时传输和存储至关重要,具体分为两个阶段,第一阶段防止信息泄漏,第二阶段减少信息数据量。传统的分组密码DES、AES最初是为加密文本数据而设计的,并且被发现不适合于具有高像素相关性和冗余特征的数字图像加密。现今,研究人员已经注意到混沌系统的基本特征具有较为理想的密码属性,可以作用于图
近年来对数据安全的要求逐渐提高,密码系统的安全性变得尤为重要。混沌系统因其伪随机性、对初始条件极为敏感等优良特征被应用于密码学中。混沌密码系统的安全性一般通过经典的统计学测试来进行评估,例如SP 800-22测试,雪崩测试等,对混沌密码系统的攻击也主要使用数学手段。然而密码系统运行时会泄露能耗、电磁、声音等旁路信息,这些信息往往和密码系统所处理的数据有关。旁路攻击利用密码系统所处理的中间数据和旁路
随着大数据和人工智能的不断发展,网络系统的设备数量增加,网络系统部署工作量和难度越来越大。运维人员和现场网络配置人员在配置过程中,经常需要做一些重复性的配置工作。传统的网络配置一般需要接口配置、相应链路速度以及网络协议等。在小型网络中,这种情况可以简单容易的实现且基本不会发生错误,一旦发生错误也可较高效的对问题做到解决。但在大型网络中,这显然是一个很繁琐的过程。本文在原有Python技术支持下提出
码分多址(CDMA)系统是一种干扰受限系统,其主要干扰为码间干扰和多址干扰(MAI).随着用户数的增加或信号功率差异的增大,由于各用户的扩频序列很难实现完全正交,信号间的相关性不为零,由此产生的多址干扰就成为CDMA通信系统的一个主要干扰.多址干扰严重限制了系统容量的提高.因此抑制多址干扰就成为码分多址蜂窝移动通信系统的一项重要任务.多用户检测(MUD)是宽带CDMA通信系统中抗多址干扰的关键技术
冲击地压是在煤岩开采过程中发生的动力破坏现象,由于复杂的地质条件和多样的开采方式使冲击地压具有较强地模糊性、非线性。冲击地压灾害的发生往往会造成较大的人员伤亡和财产损失,因此精准地预测冲击地压对于煤岩安全稳定开采具有重要意义。 论文首先分析了煤岩冲击地压前兆特征信号中的声发射信号、应力信号和红外辐射信号的变化规律。针对单一的前兆特征参量不能完整的表征冲击地压发生状态等问题,提取声发射振铃计数和信
随着互联网的不断普及与发展,越来越多的用户选择互联网作为获取信息的第一渠道。与此同时,随着全面小康时代的到来,人民对精神文化娱乐的需求日益增强促进着电影文化产业蓬勃发展。面对互联网中海量的电影及评论数据,利用情感分析技术对评论数据进行分析,挖掘评论文本中隐含的情感倾向与价值趋向,一方面为消费者作出消费决策时提供参考意见,另一方面可以帮助电影创作者了解观众喜好与市场需求,从而创造出更加优秀的电影作品
“一带一路”政策的推行掀起了“汉语热”的狂潮,然而,不少把中文作为第二语言的外国学习者都遇到了汉语学习难的问题。如传统汉语学习模式单一,教学资源缺乏以及语言差异等。人类感知交流是一个多感官过程,视听多模态信息可以有效促进语言的理解与学习。智能辅助语言学习,就是通过为学习者提供有关发音器官运动的指导,增强学习者对发音的理解,更准确地掌握发音规律,从而在一定程度上有效解决了汉语学习难的问题。 考虑到
轻度认知障碍(MCI)是阿尔兹海默症(AD)的前驱阶段,对轻度认知障碍所处阶段的精确诊断具有重要意义。本文旨在通过对静息态功能磁共振成像(rs-fMRI)信号进行直接分析建立诊断不同阶段(早期和晚期)的轻度认知障碍的分类框架,并通过总正确率,特异性(晚期MCI的正确率)和敏感性(早期MCI的正确率)评价其分类性能。 通过应用解剖自动标记(AAL)模板,将受试者的所有fMRI图像分割为116个感兴
差分隐私是一种严格的、可证明的隐私保护方法。与其他隐私模型相比,差分隐私可以成功抵御大多数隐私攻击并为数据集中的单条数据提供隐私保护。信息的实时发布使得越来越多的在线系统挖掘和分析个人的信息,讨论并设计更先进的差分隐私在线学习算法具有非常广泛的实践意义。但现有的差分隐私在线学习方法在适用范围上有很大的局限性,且算法的准确性较低。针对该问题,本文提出一种更通用、更准确的差分隐私在线学习方法。主要内容