基于神经网络的验证码识别技术研究与实践

版权申诉

5星 · 超过95%的资源 81 浏览量更新于2024-06-26 1 收藏 1.45MB PDF 举报

Python数据挖掘项目开发实战_用神经网络破解验证码_编程案例解析实例详解课程教程本章节主要介绍了如何使用神经网络技术破解验证码，并且对验证码的设计理念和数据挖掘领域中的图像检测和理解算法进行了详细的解释。首先，图像检测和理解算法已经相当成熟，许多厂商使用这些算法研制的监测系统已经投入商用，用来处理实际问题。这些系统能够理解和识别视频画面中的人类和物体。然而，从图像中抽取有用信息非常困难。图像包含大量原始数据，图像的标准编码单元——像素——提供的信息量很少。图像——特别是照片——可能存在一系列问题，比如模糊不清、离目标太近、光线很暗或太亮、比例失真、残缺、扭曲等，这会增加计算机系统抽取有用信息的难度。验证码的设计初衷是便于人类理解，而不易被计算机识破。验证码的英文名叫作CAPTCHA，它取自以下短语中几个单词的首字母“CompletelyAutomatedPublicTuringtesttotellComputersandHumansApart”，意思是能够区别计算机和人类的全自动的公共图灵测试。在本章节中，我们将介绍如何使用神经网络技术来破解验证码。首先，我们需要创建验证码和字母数据集，然后使用scikit-image库处理图像数据。接着，我们将使用PyBrain神经网络库来训练神经网络模型，并使用神经网络进行更大规模的分类任务。最后，我们将使用后处理技术来提升效果。神经网络算法最初是根据人类大脑的工作机制设计的。然而，该领域近年所取得的进展主要得益于数学而不是生物学。神经网络由一系列相互连接的神经元组成。每个神经元都是一个简单的函数，接收一定输入，给出相应输出。神经元可以使用任何标准函数来处理数据，比如线性函数，这些函数统称为激活函数（activation function）。一般来说，神经网络学习算法要能正常工作，激活函数应当是可导（derivable）和光滑的。常用的激活函数有逻辑斯谛函数、tanh函数等。逻辑斯谛函数的函数表达式如下： fx(x) = 1 / (1 + e^(-kx)) 其中，x为神经元的输入，k和L通常为1，这时函数达到最大值。在神经网络中，我们可以使用不同的激活函数来处理数据，并且可以使用不同的优化算法来训练神经网络模型。例如，我们可以使用梯度下降算法来最小化损失函数，并使用反向传播算法来计算神经网络的梯度。本章节主要介绍了如何使用神经网络技术破解验证码，并且对验证码的设计理念和数据挖掘领域中的图像检测和理解算法进行了详细的解释。

130 第8 章用神经网络破解验证码

start_x, start_y, end_x, end_y = region.bbox

用这两组坐标作为索引就能抽取到小图像（image对象为numpy数组，可以直接用索引值），

然后，把它保存到

subimages列表中。代码如下：

subimages.append(image[start_x:end_x,start_y:end_y])

最后（循环外面），返回找到的小图像，每张（希望如此）小图像包含单词的一个字母区域。

没有找到小图像的情况，直接把原图像作为子图返回。代码如下：

if len(subimages) == 0:

return [image,]

return subimages

使用刚定义的这个函数，就能从前面生成的验证码中找到小图像。

subimages = segment_image(image)

还可以像下面这样查看每张小图像。

f, axes = plt.subplots(1, len(subimages), figsize=(10, 3))

for i in range(len(subimages)):

axes[i].imshow(subimages[i], cmap="gray")

结果如下。

图像切割效果还不错，但是你可能注意到，每张小图像都多少带有相邻字母的一部分。

8.2.3 创建训练集

使用图像切割函数就能创建字母数据集，其中字母使用了不同的错切效果。然后，就可以训

练神经网络分类器来识别图像中的字母。

首先，指定随机状态值，创建字母列表，指定错切值。这里几乎没有新内容，

numpy的arange

函数你可能没用过，它跟Python的range函数类似——只不过arange函数可以和numpy的数组一

起用，步长可以使用浮点数。代码如下：

from sklearn.utils import check_random_state

random_state = check_random_state(14)

8.2 创建数据集 131

letters = list("ABCDEFGHIJKLMNOPQRSTUVWXYZ")

shear_values = np.arange(0, 0.5, 0.05)

再来创建一个函数（用来生成一条训练数据），从我们提供的选项中随机选取字母和错切值。

代码如下：

def generate_sample(random_state=None):

random_state = check_random_state(random_state)

letter = random_state.choice(letters)

shear = random_state.choice(shear_values)

返回字母图像及表示图像中字母属于哪个类别的数值。字母A为类别0，B为类别1，C为类别

2，以此类推。代码如下：

return create_captcha(letter, shear=shear, size=(20, 20)),

letters.index(letter)

在上述函数体的外面，调用该函数，生成一条训练数据，用pyplot显示图像。

image, target = generate_sample(random_state)

plt.imshow(image, cmap="Greys")

print("The target for this image is: {0}".format(target))

调用几千次该函数，就能生成足够的训练数据。把这些数据传入到numpy的数组里，因为数

组操作起来比列表更容易。代码如下：

dataset, targets = zip(*(generate_sample(random_state) for i in

range(3000)))

dataset = np.array(dataset, dtype='float')

targets = np.array(targets)

我们共有26个类别，每个类别（字母）用从0到25之间的一个整数表示。神经网络一般不支

持一个神经元输出多个值，但是多个神经元就能有多个输出，每个输出值在0到1之间。因此，我

们对类别使用一位有效码编码方法，这样，每条数据就能得到26个输出。如果结果像某字母，使

用近似于1的值；如果不像，就用近似于0的值。代码如下：

from sklearn.preprocessing import OneHotEncoder

onehot = OneHotEncoder()

y = onehot.fit_transform(targets.reshape(targets.shape[0],1))

我们用的库不支持稀疏矩阵，因此，需要将稀疏矩阵转换为密集矩阵。代码如下：

y = y.todense()

8.2.4 根据抽取方法调整训练数据集

得到的数据集跟即将使用的方法有较大出入。数据集每条数据都是一个恰好为20像素见方的

字母。我们所使用的方法是从单词中抽取字母，而这可能会挤压图像，使图像偏离中心或者引入

剩余37页未读，继续阅读

好知识传播者

粉丝: 1684
资源: 4133

基于神经网络的验证码识别技术研究与实践

Python机器学习项目开发实战_深度神经网络_编程案例解析实例详解课程教程.pdf

Python版数据挖掘实验6报告：用神经网络破解验证码.pdf

Python数据挖掘项目开发实战_大数据处理_编程案例解析实例详解课程教程.pdf

Python机器学习项目开发实战_图像内容分析_编程案例解析实例详解课程教程.pdf

Python项目开发实战_10个机器学习组合算法案例_编程案例解析实例详解课程教程.pdf

Python项目开发实战_人工智能Iris经典爱丽丝数据集_编程案例解析实例详解课程教程.pdf

深度学习项目开发实战_面部生成与标签缺失处理_编程案例解析实例详解课程教程.pdf

深度学习项目开发实战_数据建模实战-泰坦尼克号示例_编程案例解析实例详解课程教程.pdf

Python人工智能项目开发实战_视频字幕应用_编程案例实例详解课程教程.pdf

Python机器学习项目开发实战_建立图像相似度的引擎_编程案例实例详解课程教程.pdf

最新资源