[tesseract] Linux環境インストールtesseractチュートリアル(1)

1. 依存関係のインストール:

1. CentOSのバージョンを確認する

#cat /etc/redhat-release
CentOS release 6.5 (Final)

2. make、gcc、g++ のバージョンを確認する

#gcc --version
#g++ --version
gcc的当前版本编译tesseract4.1会出错,需要gcc更高的版本

3. make、gcc、g++ をインストールします。

由于我的环境是内网环境,软件下载、安装步骤详见,[离线安装Linux包](https://blog.csdn.net/zhuan_long/article/details/126120770?spm=1001.2014.3001.5502)

4. 依存パッケージをインストールする

必要な依存パッケージは次のとおりです: autoconf automake libtool libjpeg-devel libpng-devel libtiff-devel zlib-devel leptonica (1.67 以上)

  • 依存パッケージが .rpm 形式の場合は、次のコマンドを使用してインストールします。
rpm -ivh 包名
  • 依存パッケージが圧縮パッケージ形式である場合は、最初に解凍する必要があります
# 解压
tar -zxvf 文件名 
# 进入包文件夹
cd 文件名
# 执行以下命令,进行程序编译,安装
./autogen.sh
./configure
make
make install

5.環境変数にleptonicaを追加します

# 修改profile
vim /etc/profile
# 添加信息
export LD_LIBRARY_PATH=/usr/local/lib
export LIBLEPT_HEADERSDIR=/usr/local/include
export PKG_CONFIG_PATH=/usr/local/lib/pkgconfig
# 保存
# 刷新配置
source /etc/profile

6.tesseractをインストールする

tar -xzvf 4.1.0.tar.gz
cd tesseract-4.1.0
./autogen.sh 
./configure
make
sudo make install 或make install

7. tesseract環境変数を設定する

vim /etc/profile
# 添加以下字段:
PATH=$PATH:/usr/local/tesseract/bin
export PATH
export TESSDATA_PREFIX=/root/tessdata
export PATH=$PATH:$TESSDATA_PREFIX
# 刷新配置
source /etc/profile

8. インストール後にtesseractのバージョンを確認する

# 查看tesseract版本
tesseract --version
# 可执行文件路径:
which tesseract 
/usr/local/bin/tesseract

# 语言包的路径(目前空空如也):
/usr/local/share/tessdata

9.tessdataディレクトリをコピーします。

ソフトウェアのインストール ディレクトリの下にある tessdata ディレクトリを /usr/local/share/tessdata ディレクトリにコピーします。

10.tesseract言語パックをダウンロードする

tesseract 言語パックをダウンロードし、言語パックを /usr/local/share/tessdata ディレクトリに置きます。
これを体験するときは、英語と簡体字中国語の言語パック (eng.traineddata、chi_sim.traineddata、chi_sim_vert) をダウンロードするだけで済みます。 .traineddata

11. テッセラクト認識初体験

  • まずは英語の認識を体験してください。eng_test.jpg は用意した英語テキストの画像、eng_result.txt は出力結果です:
    #tesseract eng_test.jpg eng_result --psm 7

  • もう一度中国語認識を体験してください。chi_sim_test.jpg は用意した中国語テキスト画像、chi_sim_result.txt は出力結果です:
    #tesseract chi_sim_test.jpg chi_sim_result -l chi_sim --psm 7

  • 以下に、一般的に使用されるパラメータを簡単に紹介します。

-l参数表示要用的语言包,chi_sim表示简体中文语言包,默认为英文;
--psm参数可以简单理解成图片中的文字的布局方式,默认为:3
0 = Orientation and script detection (OSD) only.
1 = Automatic page segmentation with OSD.
2 = Automatic page segmentation, but no OSD, or OCR.
3 = Fully automatic page segmentation, but no OSD. (Default)
4 = Assume a single column of text of variable sizes.
5 = Assume a single uniform block of vertically aligned text.
6 = Assume a single uniform block of text.
7 = Treat the image as a single text line.
8 = Treat the image as a single word.
9 = Treat the image as a single word in a circle.
10 = Treat the image as a single character.
  • 注:
    1. 画像の解像度と gpi が要件を満たしていない場合は、次の警告が返されます:
    Tesseract オープン ソース OCR エンジン v4.1.0 と Leptonica
    警告: 無効な解像度 0 dpi。代わりに 70 を使用します。
    解決策: 画像の gpi を変更し、解像度については、テスト画像 test_picture3.jpg を参照してください。

おすすめ

転載: blog.csdn.net/zhuan_long/article/details/126123012