吴语港的TensorFlow CAPTCHA识别实验报告

需积分: 0 111 浏览量更新于2024-06-30 收藏 9.85MB DOCX 举报

"吴语港学生的AI实验报告，2019年10月23日在思贤楼301303实验室进行，实验内容是基于TensorFlow的CAPTCHA注册码识别。实验中，吴语港使用Python编程生成训练数据集，包括使用PIL库创建图像，numpy进行数值操作，random生成随机数，以及string处理字符串。验证码类（generateCaptcha）用于生成指定宽度、高度、字符数和字符集合的验证码。" 实验报告详细解析：该实验旨在使用TensorFlow构建一个能够识别CAPTCHA（Completely Automated Public Turing test to tell Computers and Humans Apart，全自动区分计算机和人类的图灵测试）注册码的模型。CAPTCHA是一种安全机制，常用于防止恶意机器人自动执行任务，例如注册账户或发送垃圾邮件。实验的核心是生成训练数据集，这通常涉及以下几个步骤： 1. **图像生成**：使用`ImageCaptcha`库创建图像，这里结合了Python Imaging Library (PIL) 来处理图像。`ImageCaptcha`是一个用于生成不同类型的验证码的库，可以自定义验证码的宽度、高度、字符数量和可选字符集。 2. **字符集定义**：验证码由数字（string.digits）、大写字母（string.ascii_uppercase）和小写字母（string.ascii_lowercase）组成，总共62个可能的字符。`classes`变量表示这些字符类别，用于后续的One-Hot编码。 3. **数据结构**：训练数据`X`被定义为形状为[batch_size, height, width, 1]的数组，代表每批训练数据的图像，其中`batch_size`是每次迭代中使用的样本数量，`height`和`width`是图像尺寸，而`1`表示单通道灰度图像。同时，标签数据`Y`的形状为[batch_size, class]，它对每个验证码中的每个字符进行One-Hot编码，由于有4个字符和62个可能的字符类别，所以`class`的大小为4 * 62。 4. **数据填充**：使用`numpy.zeros`预先分配内存，确保数据在处理时具有正确的形状。 5. **随机生成**：`random`模块用于生成随机验证码，确保训练数据的多样性，帮助模型学习不同的字符组合和图像噪声。 6. **字符生成**：通过随机选择字符集合中的字符，生成验证码字符串。每个验证码包含4个字符，长度固定。 7. **图像噪声**：为了增加模型的泛化能力，通常会在验证码图像上添加一些噪声，如扭曲、旋转或模糊等，模拟真实世界中的不确定性。在实验的后续部分，吴语港可能使用这些生成的训练数据来训练一个深度学习模型，例如卷积神经网络（CNN），以识别不同的CAPTCHA注册码。模型的训练通常涉及前向传播、损失计算、反向传播和权重更新等步骤。训练完成后，模型将被评估，以确定其在未见过的CAPTCHA上的性能。

# 这个总体的无限循环是一个训练集的生成器，执行此代码后，会在最后的

yield 语句返回训练集 X 和 Y，

# 然后循环结束。下次再想生成验证码训练集时，会从 yield 语句（最后一

句）开始，回到开头再执行一次循环。

while True:

for i in range(batch_size):

# 生成一个验证码字符串的随机变量，self.characters 为 62 位的

字符串（0~9A~Za~z），self.char_num=4（生成 4 个字符）。

captcha_str = ''.join(random.sample(self.characters,sel

f.char_num))

# 使用的是 ImageCaptcha 类的内置方法，将字符串变为图片。

convert(‘L’)：表示生成的是灰度图片，就是通道数为 1 的黑白图片。

img = image.generate_image(captcha_str).convert('L')

# Returns the contents of this image as a sequence obje

ct containing pixel values. The sequence object is flattened, so that v

alues for line one follow directly after the values of line zero, and s

o on.

# 将此图像的内容作为包含像素值的序列对象返回。Sequence 对象是

新的，因此第一行的值直接跟随在零行的值之后，依此类推。

img = np.array(img.getdata())

# 每个像素值都要除以 255，这是为了归一化处理，因为灰度的范围

是 0~255，这里除以 255 就让每个像素的值在 0~1 之间，目的是为了加快收敛速度。

X[i] = np.reshape(img,[self.height,self.width,1])/255.0

# 用以生成对应的测试集 Y，j 和 ch 用以遍历刚刚生成的随机字符

串，j 记录 index（0~3，表示第几个字符），ch 记录字符串中的字符。找到 Y 的第 i 条

数据中的第 j 个字符，然后把 62 长度的向量和 ch 相关的那个置为 1。

for j,ch in enumerate(captcha_str):

Y[i,j,self.characters.find(ch)] = 1

Y = np.reshape(Y,(batch_size,self.char_num*self.classes))

# yield 是一个类似 return 的关键字，迭代一次遇到 yield 时就返回

yield 后面(右边)的值。重点是：下一次迭代时，从上一次迭代遇到的 yield 后面的代码

(下一行)开始执行。return 的作用：如果没有 return，则默认执行至函数完毕，返回

的值一般是 yield 的变量。

yield X,Y

def decode_captcha(self,y):

y = np.reshape(y,(len(y),self.char_num,self.classes))

return ''.join(self.characters[x] for x in np.argmax(y,axis = 2

)[0,:])

剩余16页未读，继续阅读

Crazyanti

粉丝: 26
资源: 302

吴语港的TensorFlow CAPTCHA识别实验报告

"基于RNN-LSTM CTC的变长字符串识别实践报告

TensorFlow网络模型压缩：量化与剪枝实践

SMP2019_ECISA：语言处理技术的语料库

AI2019_SA19225404_吴语港_Lab3_TF1.x1

哈工大人工智能实验_hit_ai_lab.zip

哈尔滨工业大学计算机学院人工智能实验_HIT_AI_Lab.zip

introduce_AI_infra_knowledges.___人工智能系统基础架构知识库_awesome-ai

SYSU_RYH_人工智能实验_2019-Fall-AI-LAB.zip

80-pe986-1_t_sa8155_sa8150_sa8155p_sa8150p_device_specification

人工智能作业_国际跳棋AI__draughtAI.zip

最新资源