【摘 要】
:
考虑到动态定价是一个非固定性的多摇臂(Multi-Armed Bandit,MAB)问题,即厂商的利润会随时间变化,因此在相关研究基础上,研究了需求不确定情况下考虑时变奖励的置信区间上界(
【基金项目】
:
国家自然科学基金重大研究计划-培育项目(91646115)。
论文部分内容阅读
考虑到动态定价是一个非固定性的多摇臂(Multi-Armed Bandit,MAB)问题,即厂商的利润会随时间变化,因此在相关研究基础上,研究了需求不确定情况下考虑时变奖励的置信区间上界(Upper Confidence Bound,UCB)算法在动态定价问题上的应用。将商品定价问题描述为一个多摇臂问题,并构建利润最大化模型求得最优解。仿真结果表明,通过将考虑时变奖励的置信区间上界算法与基础的多摇臂算法进行对比分析,所提出的算法学得的奖励更加接近真实奖励,收敛速度更快。相较于前人研究,该模型考虑了时变因素
其他文献
图像风格迁移技术可以自动地赋予图像不同的风格。现有的研究大多针对图像的整体或者图像中的单一区域进行风格迁移,在实际应用中难免存在局限性。在风格迁移过程中引入内容图像的语义信息,提出一种针对图像不同区域进行的差异风格化的方法。将内容图像经过语义分割后引入VGG损失网络,从而限定图像的风格化区域。分别在每个区域上计算各自的格拉姆矩阵,并在反向传播阶段将梯度传播限定在各语义区域上,得出针对图像不同区域的
针对遥感图像中飞机目标检测精度低、检测速度慢、背景复杂等问题,提出了一种基于深度学习的改进YOLOv4目标检测算法。改进YOLOv4的主干特征提取网络,保留高分辨率的特征层,去除了用于检测大目标的特征层,减少语义丢失。在卷积神经网络中使用DenseNet(密集连接网络)加强对飞机目标的特征提取,减少梯度消失问题。对数据集使用K-means算法得到效果最佳的先验框数量和尺寸。在RSOD(Remote
针对如何为高铁站旅客即时提供高效的个性化服务问题,将上下文信息引入到服务推荐过程中,对用户上下文信息按照时间、空间、用户、应用四个方面进行数据分析处理,采用改进FP-
稳定同位素分析技术已成为生态学中营养来源研究的重要手段,但前提需获得动物对不同饵料中稳定同位素的富集效应数据。该实验以从红树林和邻近滩涂收集的犬牙珠鰕虎鱼(Acentr
我国推进绿色发展的内在要求在于积极寻求经济增长与环境保护的协调.长江经济带是生态文明建设先行示范区和创新驱动区,因此推动长江经济带建设对实现长江经济带发展战略布局
为研究长丰鲢(Hypophthalmichthys molitrix)形态特征对生长发育的影响,文章采用主成分分析和通径分析对其常规形态和框架结构进行了研究。结果表明,不同月龄长丰鲢各形态性
为了评估区域农业旱灾的脆弱性,基于S型效用函数对河南省农业旱灾脆弱性进行评估.采用粗糙集理论属性约简的方法剔除不相关的脆弱性因素,对于初始选取的指标进行优化;针对农
利用长江口邻近水域2016年春季的仔稚鱼分层调查数据,分析了仔稚鱼的种类数、丰度、多样性和优势种的分层变化特征及其与温、盐度的关系。结果表明,共捕获仔稚鱼1548尾,平均
热加工是一种传统的食品加工技术,热煮是其中的重要方式之一。鱼肉经过热煮处理会产生组织脆弱化、结构松散等问题,对其食用品质造成负面影响,因此提高鱼肉的耐煮性是开发水
金枪鱼围网鲣(Katsuwonus pelamis)主要作业渔场位于中西太平洋热带海域,厄尔尼诺事件对其分布有显著影响。文章基于中国大陆地区渔船围网鲣渔捞日志数据及环境因子,构建最大