论文部分内容阅读
本文以电子市场智能定价问题为研究背景,提出了基于模糊推理的多智能体强化学习算法(FI-MARL)。在马尔科夫博弈学习框架下,将领域知识初始化为一个模糊规则集合,智能体基于模糊规则选择动作,并采用强化学习来强化模糊规则。该方法有效融合了应用背景的领域知识,充分利用了样本信息并降低了学习空间维数,从而增强了在线学习性能。在电子市场定价的对比实验中,智能体在合作还是竞争的问题上表现出较为长远的智能行为,提高了平均定价收益。