pytesseract psm 옵션 매개 변수에 대한 자세한 설명

페이지 분할 모드 :

0 방향 및 스크립트 감지 (OSD) 전용.

1 OSD를 통한 자동 페이지 분할.

2 자동 페이지 분할 (OSD 또는 OCR 없음).

3 완전 자동 페이지 분할, OSD 없음. (기본)

4 다양한 크기의 텍스트 열 하나를 가정합니다.

5 세로로 정렬 된 텍스트의 단일 블록을 가정합니다.

6 단일 텍스트 블록을 가정합니다.

7 이미지를 단일 텍스트 줄로 처리합니다.

8 이미지를 한 단어로 취급합니다.

9 이미지를 원 안의 한 단어로 취급합니다.

10 이미지를 단일 문자로 취급합니다.

11 희소 한 텍스트. 특정 순서없이 가능한 한 많은 텍스트를 찾습니다.

12 OSD가있는 희소 텍스트.

13 원시 라인. 이미지를 단일 텍스트 줄로 취급하고,

Tesseract와 관련된 해킹을 우회합니다.

다음은 여러 매개 변수가있는 image_to_string의 샘플 사용입니다.

target = pytesseract.image_to_string(image, lang='eng', boxes=False, \

config='--psm 10 --oem 3 -c tessedit_char_whitelist=0123456789')

추천

출처blog.csdn.net/qq_36786467/article/details/108428667