Python 街景英文數字偵測 識別 Text Detection and Recognition
前言:
若電腦上已經有NVIDIA顯卡,可以依照我之前的文章安裝驅動與PYTHON虛擬環境(參考裡面有連結)
做完後就可以照著我這篇給的程式碼(文章最後會放載點)搭配webCam來識別現實生活中的英文與數字囉
程式檔案解說:
所有的檔案都放在文章的參考裡,簡單述說檔案修改過的部分
python package list.txt 這個檔案裡面寫了PYTHON虛擬環境所有的安裝的LIB
比較主要的有:
torch 1.3.1
tensorflow-gpu 1.12.0
opencv-contrib-python 3.4.2.17
opencv-python 3.4.2.17
其他就看缺什麼請自行安裝至虛擬環境(pip install *)
1. 資料夾EAST-master
單純抓取影像中的英數並框出來顯示在螢幕上
執行eval_Nathan.py就可以了(原始執行範例是eval.py)
(ps: 程式碼裡會匯入model.json跟EAST_IC15+13_model.h5這兩個檔案,請注意自己的路徑是否正確)
2. 資料夾MORAN_v2-master
抓取影像中的英數字並識別出來顯示在螢幕上
執行demo_Nathan.py就可以了(原始執行範例是demo.py)
(ps1: 程式碼裡會匯入frozen_east_text_detection.pb跟demo.pth這兩個檔案,請注意自己的路徑是否正確)
(ps2: frozen_east_text_detection.pb的作用跟EAST-master一樣可以框出在面畫裡出現在文字,但效果不彰,常常會框出一些跟文字無關的東西。)
3. 資料夾TextDetection_and_Recognition
將EAST-master與MORAN_v2-master的實作結合,框出文字位置並且識別文字(英數)
執行RealDetection_and_Recognition.py就行了
會匯入model.json、EAST_IC15+13_model.h5與demo.pth三個檔案
執行結果圖:
參考 reference:
程式碼連結(code)
https://drive.google.com/open?id=10b-S5TCpFhDENOFRPznb-6A7ifRgSg2S
EAST-master
https://github.com/kurapan/EAST
MORAN_v2-master
https://github.com/Canjie-Luo/MORAN_v2
原理介紹
https://mp.weixin.qq.com/s/XbT_t_9C__KdyCCw8CGDVA
UBUNTU RTX 2080TI 驅動418與CUDA10.1 + CUDNN 7.5
https://ubuntu1804.blogspot.com/2019/04/ubuntu-rtx-2080ti-418cuda101-cudnn-75.html
UBUNTU 安裝ANACONDA, 虛擬PYTHON環境, TENSORFLOW GPU VERSION
https://ubuntu1804.blogspot.com/2018/12/ubuntu-anaconda-python-tensorflow-gpu.html
若電腦上已經有NVIDIA顯卡,可以依照我之前的文章安裝驅動與PYTHON虛擬環境(參考裡面有連結)
做完後就可以照著我這篇給的程式碼(文章最後會放載點)搭配webCam來識別現實生活中的英文與數字囉
程式檔案解說:
所有的檔案都放在文章的參考裡,簡單述說檔案修改過的部分
python package list.txt 這個檔案裡面寫了PYTHON虛擬環境所有的安裝的LIB
比較主要的有:
torch 1.3.1
tensorflow-gpu 1.12.0
opencv-contrib-python 3.4.2.17
opencv-python 3.4.2.17
其他就看缺什麼請自行安裝至虛擬環境(pip install *)
1. 資料夾EAST-master
單純抓取影像中的英數並框出來顯示在螢幕上
執行eval_Nathan.py就可以了(原始執行範例是eval.py)
(ps: 程式碼裡會匯入model.json跟EAST_IC15+13_model.h5這兩個檔案,請注意自己的路徑是否正確)
2. 資料夾MORAN_v2-master
抓取影像中的英數字並識別出來顯示在螢幕上
執行demo_Nathan.py就可以了(原始執行範例是demo.py)
(ps1: 程式碼裡會匯入frozen_east_text_detection.pb跟demo.pth這兩個檔案,請注意自己的路徑是否正確)
(ps2: frozen_east_text_detection.pb的作用跟EAST-master一樣可以框出在面畫裡出現在文字,但效果不彰,常常會框出一些跟文字無關的東西。)
3. 資料夾TextDetection_and_Recognition
將EAST-master與MORAN_v2-master的實作結合,框出文字位置並且識別文字(英數)
執行RealDetection_and_Recognition.py就行了
會匯入model.json、EAST_IC15+13_model.h5與demo.pth三個檔案
執行結果圖:
參考 reference:
程式碼連結(code)
https://drive.google.com/open?id=10b-S5TCpFhDENOFRPznb-6A7ifRgSg2S
EAST-master
https://github.com/kurapan/EAST
MORAN_v2-master
https://github.com/Canjie-Luo/MORAN_v2
原理介紹
https://mp.weixin.qq.com/s/XbT_t_9C__KdyCCw8CGDVA
UBUNTU RTX 2080TI 驅動418與CUDA10.1 + CUDNN 7.5
https://ubuntu1804.blogspot.com/2019/04/ubuntu-rtx-2080ti-418cuda101-cudnn-75.html
UBUNTU 安裝ANACONDA, 虛擬PYTHON環境, TENSORFLOW GPU VERSION
https://ubuntu1804.blogspot.com/2018/12/ubuntu-anaconda-python-tensorflow-gpu.html
留言
張貼留言