英語で書かれた文字の存在する画像を読み込み、文字認識を行う
画像の読み込み
画像を読みこむにはダイアログボックスというものを出現させなければなりません。
ダイアログボックスはこちらの記事が参考になります。[1]
ダイアログボックスを利用するには、wxというモジュールが必要になります。
そして、ダイアログボックスはAnacondaのSpyder上ではうまく起動できません。
したがって、ターミナル上で
$ python 実行したいファイル名
と入力すれば実行できます。
今回作ったプログラムはこちら
ファイル名:pic_readFromDialogBox.py
#########新しいコード######### import wx app = wx.App() # 選択可能なファイルを制限する filter = "png file(*.png)|*.png" dialog = wx.FileDialog(None, u'ファイルを選択してください', '', '', filter) # ファイル選択ダイアログを表示 dialog.ShowModal() #########新しいコード###ここまで### import pytesseract from PIL import Image # 選択したファイルパスを取得する url_img = dialog.GetPath() img = Image.open(url_img) text = pytesseract.image_to_string(img, lang="eng") print(text)
・ターミナルに入力する画面
・実行結果
・ダイアログボックス
・OCRの結果
参考
[1]
python-minutes.blogspot.com
[2]
qiita.com