週末副業記

土日は副業エンジニアのブログです。副業に関することを投稿します。

Python初心者が二値化【画像処理】


f:id:ml_begin:20180521231605p:plain

OCRの精度を高めるには画像処理が重要
OCR(Optical Character Recognition/Reader、光学的文字認識)
・画像処理:二値化
OCRのライブラリをanaconda navigatorに入れられなかったのでとりあえず二値化

プログラム

def main():
    import cv2
    im = cv2.imread('sample.jpg')
    im_gray = cv2.cvtColor(im, cv2.COLOR_BGR2GRAY)
    im_blur = cv2.GaussianBlur(im_gray, (5, 5), 0)
    th1 = cv2.adaptiveThreshold(im_blur, 255, 
        cv2.ADAPTIVE_THRESH_GAUSSIAN_C,
        cv2.THRESH_BINARY, 11, 2)
    cv2.imwrite("th1.jpg", th1)

if __name__ == "__main__":
    main()

結果

元画像

f:id:ml_begin:20180521230935j:plain

二値後

f:id:ml_begin:20180521230950j:plain


参考
pythonでOCRがしたい