论文部分内容阅读
为了完成一个聪明、自动化的自我管理网络,动态政策配置和选择,被需要。某个政策仅仅适合到某个网络环境。如果网络环境变化,某些政策不适合更多。从而,基于政策的管理应该也让类似的“自然选择”处理。有用政策将被保留,并且失去了他们的有效性的政策被消除。一个政策优化方法基于进化学习被建议。在不同射击时间,当有低率的政策有更低的优先级,和长期的没有射击政策时,有高射击时间的政策的优先级被改进将休眠。因此,为适者生存的策略被认识到,并且度在政策管理自我学习被改进。