基于技术变量数据的L1惩罚二元泊松模型与足球赛果预测

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:crr0808
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着足球竞彩市场的快速发展,我们获取的数据也不再局限于比赛结果,同时还可获得每场比赛的球队技术变量数据,但对于较高维度的技术变量尤其是对进球有重要影响的技术变量与进球数的量化关系目前还未有研究、本文采用变量选择方法,通过剔除多余的变量给出最优的预测变量,从而得到简洁的足球赛果模型.自Tibshirani(1996)提出Lasso惩罚方法以来,基于惩罚思想的变量选择方法就得到广大统计学家的认可.施加惩罚方法能够在选择变量的同时得到参数的估计,尤其对于相关性很大的变量,Lasso通常会选择一个而忽略其他.因此惩罚变量选择方法在解决我们的足球预测实际问题时有比传统变量选择方法无可比拟的优越性。  本研究对于二元泊松模型施加L1的惩罚项,针对欧洲五大联赛的数据进行变量选择.通过坐标下降算法(Coordinate Decent)对该高维变量选择问题进行凸优化。同时针对在实际预测过程中Lasso所选择的预测变量不可观测和高方差的问题。提出构造参数“技术能力”,针对球队主客场不同表现,每队共四个‘技术能力’参数.并通过内点法估计有约束的极大似然函数,得到改进后的Laaso选择模型的系数以及每个队的“技术能力”参数。对于改进的Lasso选择模型,我们采取一系列投注策略分别投注市场庄家和Dixon和Coles(1997)提出的模型,并得到不同的收益.本文针对Lasso选择模型拟合,预测以及对赌策略中的数据都是2009-2014赛季英超联赛数据。
其他文献
同一个二维景物,摄像机在不同地点、从不同角度拍摄,得到的图像的几何形状不同.任意两幅图像间的几何变形可用射影变换来描述;当摄像机与景物之间的距离远远地大于景物的尺寸
叶圣陶先生曾经说过:“教是为了不教。”教,一方面是指教师在教学过程中充分发挥主导作用,引导学生学习语文知识;另一方面是教师教给学生求得这些知识的方法,使学生逐渐摆脱
学位
序列密码作为三大密码体制之一,在密码学中有着重要的地位。与分组密码和公钥密码相比,序列密码具有加解密速度快、实现规模小,功耗低等优点。早期序列密码主要被用于部队、政府
该文分为两部分:第一部分是关于组合网格法的研究;第二部分是对非结构化网格自动生成的研究.第一部分的组织结构如下:首先介绍有限元方法的数学理论基础,包括Sobolev空间理论
该文讨论直线上分形的定位及其Hausdorff测度的计算问题.定义了一类Cantor结构,并指出由广义Cantor结构所确定的分形,即广义Cantor集,的s维Hausdorff测度即为该分形直径的s次
多项式优化在凸优化,代数几何和图论等领域具有广泛的应用.多项式优化问题可以松弛为基于矩量矩阵的半正定规划问题序列.这个半正定规划问题序列称为矩量矩阵松弛序列。矩量矩
该文研究了地下水水流有限元模型与GIS的集成问题,采用国产GIS工具软件MAPGIS的二次开发技术和VC++编程完成了一个地下水水流模拟的MAPGIS平台环境的构造.集成软件根据模拟工
高通量生物实验技术,例如基因芯片、质谱分析、二代测序等,已经成为了生物医学研究中不可或缺的工具。这些高通量实验的后续分析通常会产生一个基因集作为输出结果,这个集合中的
《西游记》是一部经典的小说,因其故事情节的曲折离奇,人物角色设定的精彩独特而被读者所爱好,这部小说以唐僧师徒四人经历九九八十一难去西天取得真经为主线,描绘了一部堪称