tesseract-ocr是一個支持中文識別的引擎,小編為您帶來了tesseract-ocr3.02版本,還附帶上了簡體中文的語言包,你可以用來開發(fā)識別圖片中文的項目!
tesseract-ocr介紹
Tesseract是一個開源的OCR(Optical Character Recognition,光學字符識別)引擎,可以識別多種格式的圖像文件并將其轉換成文本,目前已支持60多種語言(包括中文)。 Tesseract最初由HP公司開發(fā),后來由Google接盤。
tesseract-ocr安裝步驟
1、運行exe安裝程序
2、點擊接受許可協(xié)議
3、點擊下一步
4、選擇安裝目錄
5、一直點下一步,然后點安裝,安裝完成!
測試tesseract-ocr識別效果
首先,建立在桌面建立一個test文件夾,里面放一張有中文的圖片tset.png
cd到這個目錄,輸入tesseract tset.png output_1 -l chi_sim
運行成功,進入test文件夾查看效果
多了一個output_1.txt文件,里面有東坡下載四個字,完美識別了test.png里面的文字。
- PC官方版
- 安卓官方手機版
- IOS官方手機版