週末副業記

土日は副業エンジニアのブログです。副業に関することを投稿します。

OCRツール作成【画像の読み込み】【python】


f:id:ml_begin:20180610224429j:plain

英語で書かれた文字の存在する画像を読み込み、文字認識を行う

 

画像の読み込み

画像を読みこむにはダイアログボックスというものを出現させなければなりません。
ダイアログボックスはこちらの記事が参考になります。[1]

ダイアログボックスを利用するには、wxというモジュールが必要になります。
そして、ダイアログボックスはAnacondaのSpyder上ではうまく起動できません。

したがって、ターミナル上で

$ python 実行したいファイル名

と入力すれば実行できます。

今回作ったプログラムはこちら
ファイル名:pic_readFromDialogBox.py

#########新しいコード#########
import wx

app = wx.App()

# 選択可能なファイルを制限する
filter = "png file(*.png)|*.png"
dialog = wx.FileDialog(None, u'ファイルを選択してください', '', '', filter)

# ファイル選択ダイアログを表示
dialog.ShowModal()
#########新しいコード###ここまで###

import pytesseract
from PIL import Image

# 選択したファイルパスを取得する
url_img = dialog.GetPath()
img = Image.open(url_img)
text = pytesseract.image_to_string(img, lang="eng")
print(text)

・ターミナルに入力する画面
f:id:ml_begin:20180610223937p:plain
・実行結果
 ・ダイアログボックス
f:id:ml_begin:20180610224015p:plain

 ・OCRの結果
f:id:ml_begin:20180610224058p:plain

参考
[1]
python-minutes.blogspot.com

[2]
qiita.com