ocr文字识别 springboot
时间: 2023-10-01 22:03:01 浏览: 100
OCR文字识别可以使用开源的Tesseract OCR引擎。在Spring Boot中可以使用tess4j库来集成Tesseract OCR引擎。以下是一个简单的示例代码:
1. 添加依赖
在pom.xml文件中添加以下依赖:
```
<dependency>
<groupId>net.sourceforge.tess4j</groupId>
<artifactId>tess4j</artifactId>
<version>4.5.4</version>
</dependency>
```
2. 编写Controller
在Controller中编写一个处理图片并返回识别结果的方法:
```
import net.sourceforge.tess4j.Tesseract;
import net.sourceforge.tess4j.TesseractException;
import org.springframework.web.bind.annotation.PostMapping;
import org.springframework.web.bind.annotation.RequestParam;
import org.springframework.web.bind.annotation.RestController;
import org.springframework.web.multipart.MultipartFile;
import java.io.File;
import java.io.IOException;
@RestController
public class OCRController {
@PostMapping("/ocr")
public String ocr(@RequestParam("file") MultipartFile file) throws IOException, TesseractException {
File convFile = new File(file.getOriginalFilename());
file.transferTo(convFile);
Tesseract tesseract = new Tesseract();
tesseract.setDatapath("/usr/share/tesseract-ocr/4.00/tessdata");
tesseract.setLanguage("chi_sim");
String result = tesseract.doOCR(convFile);
return result;
}
}
```
在上面的代码中,我们通过RequestParam注解获取前端上传的图片文件,然后将其转换为File对象。然后使用Tesseract对象对图片进行识别,并返回识别结果。
3. 启动应用
启动Spring Boot应用,访问http://localhost:8080/ocr,上传一张图片进行识别即可。
阅读全文