· 

PythonでOCR(Tesseract)(3)

v5.0.1ってやつで何やら修正されたっぽいので試してみる。インストールはPythonでOCR(Tesseract)(1)と同じ。今回はインストールもうまくいった。

では、例題です。

こちら、ちょっとしたブームになっているとある製品の使用方法です。読むほどになぞが深まる、味のある秀逸な文章です。

では、コマンドプロンプトで、

 

>"C:\Program Files\Tesseract-OCR\tesseract.exe" example.png outbase -l jpn

 

とやってみるとoutbase.txtができます。中を見てみると、、、

1 : 使用部位に対し本体(放電部)を垂直に当て、操作押外 (押しボタン) を押す。

2 : 1つの部位に対し操作ボタンを 1 0 回から 2 0 回ほど押し、他の部位に移ります。

(1 秒に 1 回ほどのペースで打ち続けます。)

3 : 肩こりの軽重により2の動作を数回繰り返す。

連続使用は 1 日 100 回ぐらいまで。

(1 日の使用回数が多いと早期に発電装置が弱くなります。)

上記使用にて発電装置の寿命は約 2 万回前後です。

なんと、間違いは一箇所だけです。レイアウトが簡単なので、レイアウト間違いがないってのもあります。「釦」って漢字を知らないんですかね、、、これを教える方法があるのかどうか、後で調べるかもしれないし調べないかもしれない。

 

では、いちおうPythonでやるのが目標なので、PythonでTesseractを使ってみます

いつも通りVSCodeから「ターミナルを開いて」

 

<Pythonのディレクトリ>/scripts/pip3 install pyocr proxy=http://<proxyサーバ>:<ポート番号>/

 

pyocrがインストールされるようです。いつものような大量の友連れは無し。

import os
import pyocr
from PIL import Image

path_tesseract = "C:\Program Files\Tesseract-OCR"
if path_tesseract not in os.environ["PATH"].split(os.pathsep):
    os.environ["PATH"] += os.pathsep + path_tesseract

tools = pyocr.get_available_tools()
tool = tools[0]
 
img = Image.open("example.png")
 
builder = pyocr.builders.TextBuilder(tesseract_layout=6)
text = tool.image_to_string(img, lang="jpn", builder=builder)
 
print(text)

とりあえずこれだけでいいらしい。

5~7行目はtesseractの実行ディレクトリにPATHを通しています。Windowsの環境変数のダイアログからもアプローチできますが、まぁPythonで実現できるので、こちらの定型句で行こうと思います。

あとは、ネットのあちこちに書いてある通り。

で出力はこうなります。

まぁ、当然ですが、コマンドプロンプトでやったときと同じ結果が得られています。

やっとスタート地点です。(いつまでもスタート地点、、、)