PythonでOCRをやってみる。まぁ流行りなので。TesseractというGoogleが作ったOCRエンジンを使うらしい。
まずはTesseractをインストールする。
googleでTesseractを検索すると。
ここを紹介されます。読み進めると、ここにpre-built binary packageがある風な記述があります。で、こちらも読み進めると、ここにWindows Binaryがある風な記述があります。ということでInstallerつきのバイナリにとうちゃーく。最初から「Tesseract Windows」でぐぐってれば、だいたいいろんな人が紹介しています。
では、ありがたく
tesseract-ocr-w64-setup-v5.0.0.20211201.exe
をダウンロードして実行!
こう出る。外国語はさっぱりなのですが、しょうがないのでEnglishでおk
こういう一択のダイアログはマジうっとおしい。、、、すみません。心がすさんでいるだけです。
Installおすと途中で、エラーが出まくる。
終わったというけど、嘘っぱちなので迷わずアンインストール。このあと、インストール先を変えたり32bit版を試したりしたけどだめ。でv4.1.0でやったらうまくいったので、そっちで進めることにする。この記事はクソ記事として残しておく。
コメントをお書きください