论文部分内容阅读
验证码识别算法的研究有助于发现其设计缺陷,从而找到改善验证码设计的方法,使网络安全性进一步得到提高。验证码识别算法的研究成果可以推广到图像处理、模式识别、机器学习等多个领域。因此,该课题具有很强的理论意义和应用价值。 本文主要从验证码图像预处理、字符分割、字符识别三个方面研究验证码识别算法,主要工作如下: 1)研究了验证码预处理过程中常用的算法,包括灰度化、二值化、噪声去除等。 2)针对粘连字符的验证码分割困难问题,提出了基于改进滴水算法的粘连字符分割方法。该方法使用均分点和垂直投影极小值点作为滴水算法的起始分割点,用改进的滴水算法进行预分割构造出多条分割线,最后通过BP神经网络筛选出最优分割线。 3)在研究卷积神经网络和特征矢量匹配算法基础上,设计和实现了改进卷积神经网络字符识别算法。该方法融合了卷积神经网络和特征矢量匹配字符识别方法,提高了识别率。针对卷积神经网络规模大,收敛速度慢问题,设计了一种字符粗分类算法,提高了收敛速度,降低了训练难度。 4)采用MFC和OPENCV类库设计和实现了验证码识别系统软件。选取豆瓣、新浪微博、百度3种典型验证码进行了识别测试,针对不同的验证码,制定了不同的识别方案,分别取得了75.4%、62.4%、54.2%的识别率,高于特征矢量匹配和改进前卷积神经网络识别方法的识别率。