论文部分内容阅读
视频中的人群计数在智能监控领域具有重要价值.由于摄像机透视效果、图像背景、人群密度分布不均匀和行人遮挡等干扰因素的制约,基于底层特征的传统计数方法准确率较低.本文提出一种基于序的空间金字塔池化(Rank-based spatial pyramid pooling,RSPP)网络的人群计数方法.该方法将原图像分成多个具有相同透视范围的子区域并在各个子区域分别取不同尺度的子图像块,采用基于序的空间金字塔池化网络估计子图像块人数,然后相加所有子图像块人数得出原图像人数.提出的图像分块方法有效地消除了摄像机透视效