论文部分内容阅读
提出了一种基于Q学习的动态切换策略,用于最大化用户体验(QoE)。基于Q学习的动态切换策略选择最佳网络,不仅利用当前网络状态还利用了未来网络状态和用户终端状态。不同于其他动态规划算法,该算法不需要获取无线网络环境的信息,而是通过利用用户终端过去经验来学习最优策略。仿真结果显示,该动态切换策略能以较少网络间切换次数来接近甲骨文优化算法性能,从而使用户体验得到更优质的网络音频服务。