使用 Swift + Tesseract OCR 解析验证码

编程语言 2025-04-08 12:16:52 阅读次数: 0

1. 环境准备
1.1 安装 Swift
macOS 自带 Swift，可以在终端中检查是否已安装：

swift --version
如果 Swift 未安装，可通过 Xcode 或 brew 进行安装：

brew install swift
1.2 安装 Tesseract OCR
在 macOS 上，使用 Homebrew 安装：

brew install tesseract
安装完成后，验证 Tesseract 是否可用：

tesseract --version
1.3 创建 Swift 项目

mkdir CaptchaOCR
cd CaptchaOCR
swift package init --type executable
1.4 添加 Tesseract 依赖
编辑 Package.swift，添加 SwiftyTesseract：

// swift-tools-version:5.7
import PackageDescription

let package = Package(
name: "CaptchaOCR",
dependencies: [
.package(url: "https://github.com/SwiftyTesseract/SwiftyTesseract.git", from: "2.0.0")
],
targets: [
.target(
name: "CaptchaOCR",
dependencies: ["SwiftyTesseract"]
)
]
)
然后运行：

swift package update
2. 代码实现
在 Sources/CaptchaOCR/main.swift 中编写如下代码：

import Foundation
import SwiftyTesseract
import AppKit

/// 进行 OCR 识别
func recognizeCaptcha(imagePath: String) {
let tesseract = SwiftyTesseract(languages: [.english])

// 读取验证码图像
guard let image = NSImage(contentsOfFile: imagePath) else {
print("无法加载图片")
return
}

// 进行 OCR 解析
tesseract.performOCR(on: image) { result in
switch result {
case .success(let text):
print("识别出的验证码: \(text)")
case .failure(let error):
print("OCR 识别失败: \(error)")
}
}
}

// 运行 OCR 识别
let imagePath = "captcha.png" // 你的验证码图片路径
recognizeCaptcha(imagePath: imagePath)
3. 代码解析
3.1 加载 Tesseract

let tesseract = SwiftyTesseract(languages: [.english])
这里使用 SwiftyTesseract 作为 OCR 引擎，加载 eng 语言模型。

3.2 读取图像

guard let image = NSImage(contentsOfFile: imagePath) else {
print("无法加载图片")
return
}
NSImage(contentsOfFile:) 读取本地验证码图片。

3.3 OCR 解析

tesseract.performOCR(on: image) { result in
switch result {
case .success(let text):
print("识别出的验证码: \(text)")
case .failure(let error):
print("OCR 识别失败: \(error)")
}
}
使用 performOCR 进行验证码解析，返回识别的文本。

4. 运行 OCR 识别
编译并运行：

swift run
终端将输出识别的验证码内容。

5. 提高 OCR 识别率
5.1 预处理验证码
可以使用 CoreImage 进行二值化处理，提高识别率：

import CoreImage

func preprocessImage(image: NSImage) -> NSImage? {
let ciImage = CIImage(data: image.tiffRepresentation!)
let filter = CIFilter(name: "CIColorControls")!
filter.setValue(ciImage, forKey: kCIInputImageKey)
filter.setValue(0.0, forKey: kCIInputSaturationKey) // 转灰度
filter.setValue(2.0, forKey: kCIInputContrastKey) // 增强对比度

let context = CIContext()
if let output = filter.outputImage,
let cgImage = context.createCGImage(output, from: output.extent) {
return NSImage(cgImage: cgImage, size: image.size)
}
return nil
}
5.2 设置合适的 PSM 模式
Tesseract 的页面分割模式（PSM）可以提高验证码识别率：

tesseract.setVariable(.tesseditPagesegMode, "6")
PSM 6 适用于单行验证码解析。

猜你喜欢

转载自blog.csdn.net/asfdsgdf/article/details/146483766

使用 Swift + Tesseract OCR 解析验证码

在 Swift 中使用 Tesseract OCR 解析验证码

使用 Swift 和 Tesseract OCR 解析验证码

使用 Swift 和 Tesseract OCR 实现验证码识别

使用 Swift 结合 Tesseract OCR 进行验证码识别

Swift 结合 Tesseract OCR 解析验证码

使用 Python 结合 Tesseract OCR 解析验证码

使用 Rust + Tesseract OCR 解析验证码

使用 Rust 解析验证码：结合 Tesseract OCR

使用 Rust 和 Tesseract OCR 解析验证码

用 Swift 解析验证码：结合 Tesseract OCR 实现文本识别

Rust + Tesseract OCR 解析验证码

使用tesseract-ocr破解网站验证码

Tesseract-ocr视觉学习-验证码识别及使用

python使用tesseract-ocr完成验证码识别

使用Tesseract OCR识别简单的验证码

使用 PHP 和 Tesseract OCR 进行验证码识别

使用 Ruby 和 Tesseract OCR 实现验证码识别

使用 Kotlin 和 Tesseract OCR 实现验证码识别

使用 Rust 结合 Tesseract OCR 进行验证码识别

使用 Swift 结合 Tesseract 进行验证码识别

Python + Tesseract OCR：验证码识别全流程解析

Rust 结合 Tesseract OCR 解析验证码

用 Rust + Tesseract OCR 解析验证码

使用 C 语言和 Tesseract OCR 实现验证码识别

Tesseract-OCR的使用

OCR之Tesseract使用

【tesseract-ocr】tesseract-ocr下载、安装、提取图片验证码

tesseract-ocr 传统验证码识别

selenium 验证码登录之Tesseract-OCR 安装

今日推荐

Electron中的关于静态资源加载问题解决方案

《Cursor-AI编程》基础篇-界面指南

《Cursor-AI编程》基础篇-Tab代码智能补充

《Cursor-AI编程》基础篇-Composer功能详解

《Cursor-AI编程》基础篇-Chat功能详解

《Cursor-AI编程》进阶篇-自定义模型

《Cursor-AI编程》进阶篇-上下文详解

【大模型系列篇】最强检索增强技术GraphRAG基本原理详解

【大模型系列篇】基于Ollama和GraphRAG v2.0.0快速构建知识图谱

解释什么是迁移学习？在 CNN 中如何应用？（面试题200合集，高频、关键）

解释数据增强（Data Augmentation）的概念和方法（（面试题200合集，高频、关键））

揭秘大模型“魔法”：Function Calling 让 AI 不止会说，更能“做”！

周排行

ConfigurationClassParser类的parse方法源码解析

基础大讲堂-java 位运算符

ConsecutiveInteger判断给定的整数n能否表示成连续的m(m>1)个正整数之和

多项式问题之六——多项式快速幂

Spring Security技术栈开发企业级认证与授权（四）RESTful API服务异常处理

Linux基础命令---apachectl

MATLAB中的线性插值

Unity编辑器拓展之十七：NGUI ComponentSelector增加搜索框

SqlServer 备份还原教程

[Unity动画]01.

每日归档

2025-04-12(10529)

2025-04-11(9561)

2025-04-10(1213)

2025-04-09(10354)

2025-04-08(12998)

2025-04-07(0)

2025-04-06(0)

2025-04-05(0)

2025-04-04(0)

2025-04-03(0)