PaddleOCR GitHub源碼,PaddleOCR是一款簡單方便的開源OCR文字識(shí)別工具,提供于GitHub上面,可以在這里查看源碼數(shù)據(jù),可以自行編輯使用。本站帶來最新的PaddleOCR源碼數(shù)據(jù)資源下載,下面給出了詳細(xì)特性說明,感興趣的朋友們可以下載體驗(yàn)。
PaddleOCR介紹
PaddleOCR旨在打造一套豐富、領(lǐng)先、且實(shí)用的OCR工具庫,助力使用者訓(xùn)練出更好的模型,并應(yīng)用落地。
PP-OCR是一個(gè)實(shí)用的超輕量OCR系統(tǒng)。主要由DB文本檢測、檢測框矯正和CRNN文本識(shí)別三部分組成。該系統(tǒng)從骨干網(wǎng)絡(luò)選擇和調(diào)整、預(yù)測頭部的設(shè)計(jì)、數(shù)據(jù)增強(qiáng)、學(xué)習(xí)率變換策略、正則化參數(shù)選擇、預(yù)訓(xùn)練模型使用以及模型自動(dòng)裁剪量化8個(gè)方面,采用19個(gè)有效策略,對(duì)各個(gè)模塊的模型進(jìn)行效果調(diào)優(yōu)和瘦身,最終得到整體大小為3.5M的超輕量中英文OCR和2.8M的英文數(shù)字OCR。
PaddleOCR特性
1、PPOCR系列高質(zhì)量預(yù)訓(xùn)練模型,準(zhǔn)確的識(shí)別效果
超輕量ppocr_mobile移動(dòng)端系列:檢測(2.6M)+方向分類器(0.9M)+ 識(shí)別(4.6M)= 8.1M
通用ppocr_server系列:檢測(47.2M)+方向分類器(0.9M)+ 識(shí)別(107M)= 155.1M
超輕量壓縮ppocr_mobile_slim系列:檢測(1.4M)+方向分類器(0.5M)+ 識(shí)別(1.6M)= 3.5M
2、支持中英文數(shù)字組合識(shí)別、豎排文本識(shí)別、長文本識(shí)別
3、支持多語言識(shí)別:韓語、日語、德語、法語
4、支持用戶自定義訓(xùn)練,提供豐富的預(yù)測推理部署方案
5、支持PIP快速安裝使用
6、可運(yùn)行于Linux、Windows、MacOS等多種系統(tǒng)