论文部分内容阅读
验证码是一种区分计算机和人类的安全技术,现在被大部分网站应用最多的是基于文本的图形验证码。正当很多基于文本的图形验证码被成功破解时,空心验证码作为最新颖的验证码设计之一,现已被各大网站应用到其用户登陆,邮箱注册,论坛评论等功能中,如雅虎、腾讯、新浪、中国移动和百度。空心验证码的一个主要特点是使用轮廓线形成连接的空心字符,同时达到了提高安全性和可用性的目标。现在的验证码破解技术很难分割和识别字符粘连的验证码,但是实心的字符粘连验证码会对人类的识别产生干扰,使用户的体验下降。而空心验证码,字符依旧是粘连的,但当人类识别时,却没有产生负面影响。在本文中,我们初步分析了空心验证码“健壮性”。介绍了一种简单而新颖的破解方法,使用颜色填充算法得到空心字符内部的笔画碎片,再将字符碎片重新组合,使用卷积神经网络对碎片组合成的字符进行识别并且得到相似度,最后使用图搜索的方法得到最优的碎片组合结果,从而成功的破解了空心验证码。本文中的验证码破解方法突破了传统的预处理、切分、识别的验证码破解三大步骤,在预处理之后,将切分和识别结合起来,以识别的相似度作为切分的依据,这在验证码破解领域是革命性的创新。本文中的方法可以成功地破解各类空心验证码,包括那些已经被大型网站应用的空心验证码,对雅虎、腾讯、新浪、中国移动和百度的空心验证码识别成功率分别达到36%、89%、59%、66%和51%。对当前空心验证码设计的安全性提出了质疑,除此之外,通过分析空心验证码的安全性得到经验教训,本文为设计出更好的验证码提出了的一些建议和意见。