论文部分内容阅读
随着足球竞彩市场的快速发展,我们获取的数据也不再局限于比赛结果,同时还可获得每场比赛的球队技术变量数据,但对于较高维度的技术变量尤其是对进球有重要影响的技术变量与进球数的量化关系目前还未有研究、本文采用变量选择方法,通过剔除多余的变量给出最优的预测变量,从而得到简洁的足球赛果模型.自Tibshirani(1996)提出Lasso惩罚方法以来,基于惩罚思想的变量选择方法就得到广大统计学家的认可.施加惩罚方法能够在选择变量的同时得到参数的估计,尤其对于相关性很大的变量,Lasso通常会选择一个而忽略其他.因此惩罚变量选择方法在解决我们的足球预测实际问题时有比传统变量选择方法无可比拟的优越性。 本研究对于二元泊松模型施加L1的惩罚项,针对欧洲五大联赛的数据进行变量选择.通过坐标下降算法(Coordinate Decent)对该高维变量选择问题进行凸优化。同时针对在实际预测过程中Lasso所选择的预测变量不可观测和高方差的问题。提出构造参数“技术能力”,针对球队主客场不同表现,每队共四个‘技术能力’参数.并通过内点法估计有约束的极大似然函数,得到改进后的Laaso选择模型的系数以及每个队的“技术能力”参数。对于改进的Lasso选择模型,我们采取一系列投注策略分别投注市场庄家和Dixon和Coles(1997)提出的模型,并得到不同的收益.本文针对Lasso选择模型拟合,预测以及对赌策略中的数据都是2009-2014赛季英超联赛数据。