vb.net+VBA+JS网络图片OCR识别：解决验证码难题

需积分: 0 102 浏览量更新于2024-06-17 1 收藏 253KB DOCX 举报

本文将深入探讨如何利用vb.net、VBA和JavaScript结合ddddocr技术进行网络图片OCR（Optical Character Recognition，光学字符识别）识别。作者首先赞赏网友【wodewan】的开源文章《带带弟弟OCR，纯VBA本地获取网络验证码整体解决方案》，该文章提供了一个基础且高效的验证码识别框架，其特点是代码开源，对多种验证码图片类型具有高识别率，达到了90%以上。文章的核心内容分为四个步骤： 1. **网络验证码图片获取**：作者强调，尽管对专业术语如“跨域”和“同源策略”了解有限，但目标明确，即实现验证码图片的下载和抓取，不管技术细节，关键在于功能实现。通过使用cefsharp（Chromium内核）的64位浏览器控件，作者确保了对Windows 7和10的支持，同时避免了xp的不兼容问题。 2. **识别验证码图片中的字符**：重点在于识别图片中的文本字符，特别是针对“字符”类型的验证码，对于其他复杂类型（如相似图、拉动效果）则暂不考虑。通过OCR技术，将图片中的文字转换为可编辑文本，方便后续操作。 3. **自动填写表单**：文章提到，利用识别出的文字，自动化填写包含准考证号、身份验证、验证码等内容的网络表单，并在用户点击查询按钮后执行此操作。这部分内容并未详述编程细节，而是指出在技术层面，获取查询结果和分析数据并不构成挑战。 4. **编程环境**：作者的工作环境包括Windows Server 2022操作系统，Visual Studio 2022作为主要开发工具，支持vb.net和C#，以及Office Excel 2022中的VBA。选择cefsharp的原因是为了兼容性和特定网站的需求，而WebBrowser控件受限于某些网站的兼容性。 5. **技术实现思路**：在vb.net Form界面中，引入必要的IO和Runtime库，以及cefsharp控件，作者利用这些工具构建了一个能够在VB.NET环境中工作的OCR解决方案。代码的简洁性和效率是次要考虑，首要目标是解决问题并满足功能需求。总结来说，这篇文章关注的是将图像识别技术与vb.net、VBA和JavaScript结合，以实现在网络环境下自动处理验证码的实用工具，着重于解决实际问题而非追求极致的技术细节。通过逐步实施，作者解决了验证码识别的关键步骤，为用户在日常任务中提高效率提供了有力支持。

4、可以逐步添加【准考码、身份码、密码】防错机制

5、有的网站网络验证码，并不是放在网页的 img 元素中，而是

放在 div 等容器中，实现图片提取过程无非就是先提取 div 的背景

图片网址，然后新建一个 img 放入页面中，然后就可以了。

当然，也可以通过直接截取 div 等元素的图片方式获取到图

片，实现过程也不复杂，无非就是定位元素获取图片。

六、ddddocr 识别库简单介绍

对（jpg、png）等各种类型的图片，ddddocr 识别率相当高，

经过测试，实际识别率 90%以上。

不需要对获取的图片进行处理，在直接获取到的彩色图片模式

下的识别率就足以了，所以也就省略了那些黑白化、二值化、分割

的过程。

* vb.net 代码的过程实现

参考了诸多网友的 c#代码，就不一一感谢了。都是开源共享

的。本来想将全部代码改写为 vb.net 语言，无奈水平所限，暂时没

有实现。

一、获取网页中的验证码图片

Private Async Sub Button1_Click(sender As Object, e As EventArgs) Handles Button1.Click

'---------------------------------------------------------------------------------

'1、获取ID元素图片URL

Dim ID关键词 As String = "valiCode" '图片验证码，元素的ID

剩余34页未读，继续阅读

qq_32231369

粉丝: 48
资源: 2

vb.net+VBA+JS网络图片OCR识别：解决验证码难题

vb.net+cefsharp+VBA+js+ddddocr混合编程网络图片ocr识别

VB.NET+SQLITE简单的成绩管理系统编程

用vb.net +sql编写的学生管理系统

vb.net+抓取网页

vb.net+mssql示例源码

vb.net语音识别

vb.net 利用API实现OCR文字识别

Tesseract OCR vb.net

VB.NET 使用 JavaScript

如何在VB.NET编程环境中利用Aspose.OCR库将图片转换为文本文件（TXT格式）？

最新资源