基于强化学习Actor-Critic算法的音乐生成

来源 :计算机应用与软件 | 被引量 : 2次 | 上传用户:caochangzheng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出一种利用强化学习Actor-Critic(A-C)训练神经网络生成音乐的方法。常规的LSTM音乐生成网络在生成音乐时并没有考虑到实际的作曲情况,只是通过先前训练保存的策略来选择下一个音符,所以生成的音乐稳定性差、风格模糊。引入一个经过训练的Critic网络,该网络能够评估LSTM网络输出音符的价值,以此更新LSTM网络的生成策略。这形成了一个更接近生成阶段的训练过程,并允许优化特定的音乐风格,所以生成的音乐结构稳定,更具风格。对该方法生成的音乐进行验证,证明了其有效性。
其他文献
在经济日益全球化的今天,矿产资源的全球性竞争是必然之事.大型跨国矿业公司为发达国家占领世界矿业市场发挥了极其重要的作用.认真的研究发达国家的成功经验,对于我国参与世
介绍了钢筋混凝土施工的程序及应注意的问题和处理方法.
流动性过剩已经成为我国经济运行过程中存在的一个严重问题。从分析流动性过剩的现象入手,剖析我国流动性过剩与通货膨胀的关系以及此类通货膨胀的特点,并有针对性的提出对策
文章对新准则中固定资产定义、后续支出核算、个别业务初始计量、折旧计提及盘盈固定资产处理进行了分析。提出了自己的观点和会计处理改进完善的建议。
本文通过对我国积极财政政策的宏观经济分析,量化给出了1998年~2000年实施积极财政政策对我国宏观经济的利弊影响和实际效果.
现有基于音频的自适应信息隐藏算法采取固定分帧,与音频信号非平稳特征关联较差,且大多隐藏容量小,计算复杂。提出一种基于时域掩蔽效应的小波变换(DWT)域语音自适应隐藏算法。结合能零比检测和m序列自相关运算动态选取合适的信息隐藏位置,实现动态分帧;采用不等距的量化索引调制(QIM)方法检测时域掩蔽效应强弱,自适应调整DWT域嵌入强度和隐藏量;结合QIM和多重容错处理方法,消除盲提取时嵌入强度检测误差。
引入劳动力市场价位,充分发挥劳动力资源配置的基础作用,进一步搞活企业内部分配制度改革,是建立现代企业制度的要求.文章作者在阐述了引入劳动力市场价位重要性的基础上,重