Explicación detallada de los parámetros de la opción psm de pytesseract

Modos de segmentación de páginas:

0 Orientación y detección de guiones (OSD) únicamente.

1 Segmentación automática de páginas con OSD.

2 Segmentación automática de páginas, pero sin OSD ni OCR.

3 Segmentación de páginas totalmente automática, pero sin OSD. (Defecto)

4 Suponga una sola columna de texto de tamaños variables.

5 Suponga un solo bloque uniforme de texto alineado verticalmente.

6 Suponga un solo bloque de texto uniforme.

7 Trate la imagen como una sola línea de texto.

8 Trate la imagen como una sola palabra.

9 Trate la imagen como una sola palabra en un círculo.

10 Trate la imagen como un solo carácter.

11 Texto escaso. Busque la mayor cantidad de texto posible sin ningún orden en particular.

12 Texto escaso con OSD.

13 Línea cruda. Trate la imagen como una sola línea de texto,

evitando los hacks que son específicos de Tesseract.

A continuación, se muestra un uso de muestra de image_to_string con varios parámetros.

target = pytesseract.image_to_string(image, lang='eng', boxes=False, \

config='--psm 10 --oem 3 -c tessedit_char_whitelist=0123456789')

Supongo que te gusta

Origin blog.csdn.net/qq_36786467/article/details/108428667
Recomendado
Clasificación