论文部分内容阅读
自主定位和面向目标导航能力对于动物和自主移动机器人至关重要。机器人能通过特定的传感器或环境中的一些先验信息来确定其当前所处空间位置信息。与机器人相比,动物和人类的优势是在没有任何先验知识的情况下能够通过来自于感官的不完整空间信息总可以迅速地定位自己当前所处位置。随着大鼠脑中与环境认知相关条纹细胞、网格细胞、位置细胞的陆续发现,对深入理解动物和人类迅速在所处空间环境中的自我定位过程提供了可能性。基于鼠脑海马结构有关生理学研究发现,课题组对鼠脑海马结构环境认知机理进行相关研究,并将其应用于导航中。本文的主要研究工作包括:(1)基于网格细胞生理学放电机制,提出一种新型网格细胞网格野模型,即基于路径积分的网格细胞网格野模型。根据网格细胞生物学研究发现,假设内嗅皮层中存在有许多不同的路径积分器模块,每个路径积分器模块都具有3个矢量方向,3个方向的矢量大小相同。不同路径积分器模块具有不同的矢量方向和矢量大小。大鼠自运动信息由大鼠头朝向和运动速度构成。路径积分器首先整合大鼠的自运动信息来计算大鼠的当前位置。然后计算沿着路径积分器各个矢量方向的位移量,根据实验所设定网格细胞网格野间距及网格野大小参数值来判断大鼠在当前位置时网格细胞是否被激活。最后整合路径积分器模块三个矢量方向输出,得到了与生物学研究发现相一致的网格细胞网格野模型。仿真实验结果表明该模型所得网格细胞网格野与内嗅皮层中背腹侧不同位置所记录到的网格细胞放电特征相一致。(2)依据海马结构中内嗅皮层到海马区之间信息传递机理,构建一种新型位置细胞模型,即一种网格细胞到位置细胞的高斯分布激活函数模型。针对生物学研究所发现的采用简单线性叠加数学模型不能表达啮齿类动物大脑皮层中多个激活网格细胞网格野输入到单一位置细胞位置野输出特征映射关系这一难题,引入高斯分布激活函数滤除掉低激活率位置细胞位置野。仿真实验结果得到了与生物学研究发现相一致的单一位置细胞位置野。(3)基于(2)中所构建位置细胞模型,提出一种构建鼠脑海马认知地图的方法。即随着大鼠连续自由探索其所处空间环境,会不断形成在各个位置点的位置细胞放电特征,最终形成大鼠脑内对其所处空间环境的表达-海马地图。仿真实验结果表明伴随大鼠自由运动,大鼠脑内会逐渐产生对于外部空间环境的内在表达-海马地图。(4)生物学研究发现,仅凭海马地图并不能够正确预测大鼠未来运动方向,大脑腹侧被盖区主要是与奖励预测误差信号相关的多巴胺能神经元,多巴胺能神经元将信息投射至伏隔核,伏隔核输入主要来自于海马,前额叶皮层和伏隔核之间存在有双向神经纤维投射。即伏隔核一方面从海马接收大鼠所处空间环境信息,另一方面从大脑腹侧被盖区接收相关奖励预测误差信息,然后再通过与前额叶皮层相互作用来正确预测大鼠未来运动方向。大脑前额叶皮层中主要是与运动相关的神经元-动作细胞,而海马中主要是位置细胞。大鼠面向目标导航任务的神经生理学依据是与奖励预测误差信号相关的海马位置细胞与动作细胞之间的突触调节。在连续状态空间和动作空间之间通过强化学习来实现大鼠面向目标导航任务,此处的连续状态空间指的是位置细胞放电活动,即大鼠脑内“海马地图”。基于此,构建一个包含有输入层、位置细胞层、动作细胞层和输出层的前馈神经网络模型,采用Q学习算法来实现大鼠面向目标导航任务。仿真实验结果表明当大鼠经过一段时间学习后,能够从第9轮实验开始快速找到起始位置到目标位置的最短路径,快速实现面向目标位置导航,充分表明了本文所构建模型能够快速实现大鼠面向目标导航任务。