v5.0.1ってやつで何やら修正されたっぽいので試してみる。インストールはPythonでOCR(Tesseract)(1)と同じ。今回はインストールもうまくいった。
では、例題です。
こちら、ちょっとしたブームになっているとある製品の使用方法です。読むほどになぞが深まる、味のある秀逸な文章です。
では、コマンドプロンプトで、
>"C:\Program Files\Tesseract-OCR\tesseract.exe" example.png outbase -l jpn
とやってみるとoutbase.txtができます。中を見てみると、、、
1 : 使用部位に対し本体(放電部)を垂直に当て、操作押外 (押しボタン) を押す。
2 : 1つの部位に対し操作ボタンを 1 0 回から 2 0 回ほど押し、他の部位に移ります。
(1 秒に 1 回ほどのペースで打ち続けます。)
3 : 肩こりの軽重により2の動作を数回繰り返す。
連続使用は 1 日 100 回ぐらいまで。
(1 日の使用回数が多いと早期に発電装置が弱くなります。)
上記使用にて発電装置の寿命は約 2 万回前後です。
なんと、間違いは一箇所だけです。レイアウトが簡単なので、レイアウト間違いがないってのもあります。「釦」って漢字を知らないんですかね、、、これを教える方法があるのかどうか、後で調べるかもしれないし調べないかもしれない。
では、いちおうPythonでやるのが目標なので、PythonでTesseractを使ってみます
いつも通りVSCodeから「ターミナルを開いて」
<Pythonのディレクトリ>/scripts/pip3 install pyocr proxy=http://<proxyサーバ>:<ポート番号>/
pyocrがインストールされるようです。いつものような大量の友連れは無し。
import os import pyocr from PIL import Image path_tesseract = "C:\Program Files\Tesseract-OCR" if path_tesseract not in os.environ["PATH"].split(os.pathsep): os.environ["PATH"] += os.pathsep + path_tesseract tools = pyocr.get_available_tools() tool = tools[0] img = Image.open("example.png") builder = pyocr.builders.TextBuilder(tesseract_layout=6) text = tool.image_to_string(img, lang="jpn", builder=builder) print(text)
とりあえずこれだけでいいらしい。
5~7行目はtesseractの実行ディレクトリにPATHを通しています。Windowsの環境変数のダイアログからもアプローチできますが、まぁPythonで実現できるので、こちらの定型句で行こうと思います。
あとは、ネットのあちこちに書いてある通り。
で出力はこうなります。
まぁ、当然ですが、コマンドプロンプトでやったときと同じ結果が得られています。
やっとスタート地点です。(いつまでもスタート地点、、、)
コメントをお書きください