论文部分内容阅读
随着移动互联网、物联网等的飞速发展,人们生产生活中产生的数据量呈指数级增长,数据中隐藏的巨大价值使得大数据成为社会各界关注的热点。数据资源的流通共享是大数据应用的关键,而数据流通的前提是对其进行合理的定价。考虑到当前大数据定价方法忽视数据自身价值以及用户利益等的不足,本文研究了基于效用的大数据定价方法,通过机器学习模型建立数据效用函数,以此来量化数据价值,同时关注用户利益,构建了基于斯塔克伯格博弈的大数据定价模型,最后以二手房评估数据作为案例数据对该定价方法进行应用研究。本文主要的研究内容包括:
(1)梳理了大数据定价相关理论和方法。分析了影响数据价值的因素,提出了大数据价值评估模型;定义了数据效用函数和用户效用函数;分析了数据定价过程中数据产品提供商和数据用户双方的利益博弈;分析对比了当前大数据定价方法的优势与劣势,在此基础上提出基于效用的大数据定价方法。
(2)建立了基于机器学习的数据效用函数。分析总结了大数据知识发现和价值提取过程,在此基础上提出基于机器学习模型的数据效用度量方法;定义了基于回归的机器学习模型;阐述了数据效用的度量方法,以模型的准确度来反映数据的效用,给出了数据效用函数的表达式。
(3)构建了基于斯塔克伯格博弈的大数据定价模型。由于大数据价值的不确定性,本文以用户效用来度量用户购买数据产品所获得的效用,建立了数据用户的效用函数,同时,建立数据产品提供商的利润函数;通过斯塔克伯格博弈模型确定了同时满足提供商利润最大化和用户效用最大化的最优数据定价,经过推导分析证明,该数据产品价格为全局最优解。
(4)基于效用的大数据定价方法应用研究。选用随机森林模型作为度量数据效用的机器学习模型,利用通过房地产网站等收集的二手房数据进行案例分析。分析结果表明,本文设定的数据效用函数显著,能够较好地反映数据的价值;将数据效用函数代入数据定价模型进行计算,得到博弈的均衡价格,即为数据产品的最优定价。
(1)梳理了大数据定价相关理论和方法。分析了影响数据价值的因素,提出了大数据价值评估模型;定义了数据效用函数和用户效用函数;分析了数据定价过程中数据产品提供商和数据用户双方的利益博弈;分析对比了当前大数据定价方法的优势与劣势,在此基础上提出基于效用的大数据定价方法。
(2)建立了基于机器学习的数据效用函数。分析总结了大数据知识发现和价值提取过程,在此基础上提出基于机器学习模型的数据效用度量方法;定义了基于回归的机器学习模型;阐述了数据效用的度量方法,以模型的准确度来反映数据的效用,给出了数据效用函数的表达式。
(3)构建了基于斯塔克伯格博弈的大数据定价模型。由于大数据价值的不确定性,本文以用户效用来度量用户购买数据产品所获得的效用,建立了数据用户的效用函数,同时,建立数据产品提供商的利润函数;通过斯塔克伯格博弈模型确定了同时满足提供商利润最大化和用户效用最大化的最优数据定价,经过推导分析证明,该数据产品价格为全局最优解。
(4)基于效用的大数据定价方法应用研究。选用随机森林模型作为度量数据效用的机器学习模型,利用通过房地产网站等收集的二手房数据进行案例分析。分析结果表明,本文设定的数据效用函数显著,能够较好地反映数据的价值;将数据效用函数代入数据定价模型进行计算,得到博弈的均衡价格,即为数据产品的最优定价。