Python 街景英文數字偵測 識別 Text Detection and Recognition

前言:
若電腦上已經有NVIDIA顯卡,可以依照我之前的文章安裝驅動與PYTHON虛擬環境(參考裡面有連結)

做完後就可以照著我這篇給的程式碼(文章最後會放載點)搭配webCam來識別現實生活中的英文與數字囉


程式檔案解說:
所有的檔案都放在文章的參考裡,簡單述說檔案修改過的部分

python package list.txt 這個檔案裡面寫了PYTHON虛擬環境所有的安裝的LIB
比較主要的有:
torch                                     1.3.1
tensorflow-gpu                     1.12.0
opencv-contrib-python         3.4.2.17 
opencv-python                      3.4.2.17

其他就看缺什麼請自行安裝至虛擬環境(pip install *)

1. 資料夾EAST-master
單純抓取影像中的英數並框出來顯示在螢幕上
執行eval_Nathan.py就可以了(原始執行範例是eval.py)
(ps: 程式碼裡會匯入model.jsonEAST_IC15+13_model.h5這兩個檔案,請注意自己的路徑是否正確)

2. 資料夾MORAN_v2-master
抓取影像中的英數字並識別出來顯示在螢幕上
執行demo_Nathan.py就可以了(原始執行範例是demo.py
(ps1: 程式碼裡會匯入frozen_east_text_detection.pbdemo.pth這兩個檔案,請注意自己的路徑是否正確)
(ps2: frozen_east_text_detection.pb的作用跟EAST-master一樣可以框出在面畫裡出現在文字,但效果不彰,常常會框出一些跟文字無關的東西。)

3. 資料夾TextDetection_and_Recognition
將EAST-master與MORAN_v2-master的實作結合,框出文字位置並且識別文字(英數)

執行RealDetection_and_Recognition.py就行了

會匯入model.jsonEAST_IC15+13_model.h5demo.pth三個檔案

執行結果圖:


參考 reference:

程式碼連結(code)
https://drive.google.com/open?id=10b-S5TCpFhDENOFRPznb-6A7ifRgSg2S

EAST-master
https://github.com/kurapan/EAST

MORAN_v2-master
https://github.com/Canjie-Luo/MORAN_v2

原理介紹
https://mp.weixin.qq.com/s/XbT_t_9C__KdyCCw8CGDVA

UBUNTU RTX 2080TI 驅動418與CUDA10.1 + CUDNN 7.5
https://ubuntu1804.blogspot.com/2019/04/ubuntu-rtx-2080ti-418cuda101-cudnn-75.html

UBUNTU 安裝ANACONDA, 虛擬PYTHON環境, TENSORFLOW GPU VERSION
https://ubuntu1804.blogspot.com/2018/12/ubuntu-anaconda-python-tensorflow-gpu.html


留言

熱門文章