pythonたTesseract OCR-

OCR技術

OCR(光学式文字認識、OCR)は、電子デバイス(例えば、スキャナやデジタルカメラ)を意味する形状に変換するために、その形状を決定暗い、明るいモードを検出することにより、紙に印刷された文字を確認し、文字認識コンピュータ光学的に紙文書の白黒原稿のドットイメージにロードされたテキスト、および認識ソフトウェアによってテキスト形式に文字画像を変換し、さらに編集するためのワードプロセッサを使用して印刷するためのプロセステキストおよびフォント加工技術。

Pythonでは、ORCモジュールは、その主な原理OCRエンジンは、モジュールの機能により画像を認識呼び出すことで、OCR認識エンジンは、プログラムに結果を返す導入する例をpyocrするpytesser3とpyocrを有するサポート。窓に取り付けPyocrはCMDでピップを使用してインストールすることができます。

pyocrをインストールするPIP

インストールpyocrモジュールは依存認識pyocrモジュールを完了するために、画像処理のために設計されたモジュールであるPILモジュールをインストールするためにさらに必要になった後、PIPは、以下をインストールします。

枕をインストールするPIP

PILモジュールpyocrインストールした後と、最終的には、OCRエンジンのインストールは、主に画像認識OCRエンジンによって、エンジンpyocrは唯一の役割コールを演じます。

たTesseract OCR-は、フリーでオープンソースのOCRエンジンであり、読者は、ウィンドウシステム、OCRエンジン(たTesseract-OCR)パッケージがインストール.exeファイルでインストールすることができ、インターネット検索からダウンロードしてインストールして自由です。インストールプロセス中に追加のオプションがあることは注目に値します。

            図1-1 OCRのインストールオプション

 

    図1-2言語を選択するために使用される数式をチェックするパケットと中国語(簡体字)

次のようにインストールが完了した後、あなたは、Pythonで実装OCR認識pyocrを使用することができます:

      図1-3 test.png画像が認識されます

 コードは以下の通りであります:

PILインポートイメージから
pyocrインポートたTesseractから
#PILを使って画像を開きます。
輸入OS

os.chdir( "C://ユーザー//八尾//デスクトップ")
# 改变当前工作目录

im=Image.open("test.png")
#OCR识别
code=tesseract.image_to_string(im)
print(code)

运行结果如下图所示:

                        图1-4 识别结果

在实际使用时,验证码图片不会是一张白底黑字的图片,往往会掺入很多干扰因素,这样会导致识别出来的结果与实际相差甚大,为了提高准确率,可以使用PIL模块对图片进行简单的处理。

不同的图片有不同的处理方法,其目的是提高OCR识别的准确率。除此之外,提高OCR准确率还可以对OCR引擎进行训练和学习。但两者已经属于人工智能的领域。

おすすめ

転載: www.cnblogs.com/1328497946TS/p/11318517.html