たTesseractシリーズ(3) - 研修たTesseract

tessractトレーニングjTessBoxEditorと呼ばれるツールがあります

1は、jTessBoxEditorはJavaで書かれている、あなたは最初のJava環境をインストールする必要があります。

      JDK-8u191-窓-x64.exe私は公式サイトからダウンロードしたいのですが、来てそこから直接Javaの同僚に従事するために失敗したこと。

 

      バーレーンの後、いくつかの環境変数を設定するには:

 

 

 

システム環境変数 - 「パス---」新 

 

 

 

 

その後、コンピュータを再起動します。

 

2、インストールjTessBoxEditor:

     ダウンロード:https://sourceforge.net/projects/vietocr/files/jTessBoxEditor/

 

3、jTessBoxEditorを起動します。

 

 

 [画面]をダブルクリックし:

     

 

 

 

そして、ツールマージTIFにクリック 

あなたがモデルTIF形式に参加する場合は、直接TIFを見つけることができます。

あなたはPNG画像フォーマットに参加した場合で、

 

 

 

 

、numは、独自の定義であるnum.font.exp0.tif、たTesseractのディレクトリに保存する画像:修正ファイルフォーマットに参加し、保存・インターフェースを表示するように、ファイルを保存するために、[開く]をクリックします。

 

たTesseractディレクトリにcmdを、コマンドを実行しtesseract.exe num.font.exp0.tif num.font.exp0 batch.nochop makebox 

コマンドの構文解析、

たTesseract [LANG]。[フォント名] .EXP [NUM]。TIF [ラング]。[フォント名] .EXP [NUM] batch.nochop makebox

langは言語名、フォント名のフォント名で、numはシリアル番号である場合には、それらを簡単に定義することができます。

その後:

 

 

num.font.exp0.tifの上に保存されたファイルを開くには、[開く]をクリックします

 

 

これは私のデモの写真です。

 

 各チャーと左側に対応しなければなりません。あなたは11点の変化に対応していない場合は、上記のすべてを置くが、すべて再利用下の操作ボタンに精通していることを示唆している、それは実際には非常に簡単です。

変更の保存後に[保存]をクリックします。

 

カスタムフォントのプロフィール。font_propertiesのフォント特性のファイル名を作成します。font_propertiesはBOMヘッダが含まれていない次のように、ファイル形式のコンテンツです。

<フォント名> <イタリック> <太字> <固定> <セリフ> <フラクトゥール>  

どこフォント名、フォント名、必見[LANG]。一貫性の[フォント名]の.exp [NUM]■は名前。<イタリック> 1または0の、<太字>、<固定>、<セリフ>、<フラクトゥール>値は、フォントは、これらの特性を有するかどうかを示します。

ここでは、オープンコンテンツで次のように入力するために、メモ帳を使用して、サンプル画像のディレクトリにfont_propertiesファイルの名前を作成されます。

フォント0 0 0 0 0

 

ここでは0の完全な値は、フォントは、太字、斜体などではないことを示しています。

その後、単にそのたTesseract font_propertiesの新しいディレクトリ内の手段、TXT、および内容を書き込む:フォント0 0 0 0 0

 

次のコマンドは、ディレクトリたTesseract、ダブルクリックして実行中に置かバットにバッチファイルを保存します。

トレーニングのためのエコーを実行したTesseract ..

tesseract.exe num.font.exp0.tif num.font.exp0 NOBATCH box.train

 

エコー計算文字セット..

unicharset_extractor.exe num.font.exp0.box

mftraining -F font_properties.txt -U unicharset -O num.unicharset num.font.exp0.tr

 

エコークラスタリング..

cntraining.exe num.font.exp0.tr

 

エコー名前の変更ファイル...

リネームnormprotoのnum.normproto

名前変更inttemp num.inttemp

pffmtable num.pffmtableの名前を変更

shapetable num.shapetableの名前を変更

 

エコーTessdataを作成します。..

combine_tessdata.exe NUM。

休止

 

コマンドウィンドウのエラー・ソリューションを参照して、多少の誤差があるでしょう。

ポータルます。https://www.cnblogs.com/132818Creator/p/11811841.html

 

します。https://blog.csdn.net/sylsjane/article/details/83751297から何か

 

 

 

 

    

 

おすすめ

転載: www.cnblogs.com/132818Creator/p/11819174.html