百度通用文字識別小工具(可識別整個(gè)文件夾)是一款excel識別/身份證/銀行卡/截圖文字識別/網(wǎng)圖識別/支持監(jiān)視剪貼板免費(fèi)OCR文字識別軟件,軟件會生成config.ini文件來保存用戶的一些配置,軟件會創(chuàng)建"圖片"和"文字識別結(jié)果"兩個(gè)文件夾,來保存截圖文件和txt結(jié)果文件。
軟件介紹
運(yùn)行環(huán)境
系統(tǒng):windows WIN10 64位機(jī)編寫且測試完美運(yùn)行,其他windows系統(tǒng)請自測
網(wǎng)絡(luò):需要網(wǎng)絡(luò)運(yùn)行,不支持離線運(yùn)行
編寫語言
易語言編寫-無殼,有可能會報(bào)毒,添加信任即可。
關(guān)于百度OCR的access_token
首次使用會通過API Key和Secret Key獲取access_token,并保存在ini文件中
再次打開時(shí)候,或判斷access_token是否失效,如果失效則再次獲取access_token
支持識別哪些功能?
銀行卡、身份證、辦公文檔、營業(yè)執(zhí)照、手寫文字、帶邊框的EXCEL表格:本地圖片、網(wǎng)絡(luò)圖片
支持截圖文字識別(點(diǎn)擊后,選擇區(qū)域截圖,識別指定區(qū)域)
支持文件夾中4種圖片格式識別(建議使用自己的key)
支持監(jiān)視剪貼板url(只要復(fù)制url就會識別,識別過之后再次復(fù)制本條url不識別,重新打開軟件后)
設(shè)置區(qū)的一些介紹
識別接口
標(biāo)準(zhǔn)版:https://ai.baidu.com/ai-doc/OCR/zk3h7xz52
高精度版:https://ai.baidu.com/ai-doc/OCR/1k3h7y3db
二者必選其一(PS:點(diǎn)擊2個(gè)模式進(jìn)入文檔)
這里需要注意的是:
高精度版每天只有500次免費(fèi)調(diào)用量
標(biāo)準(zhǔn)版每天有5萬次免費(fèi)調(diào)用量
識別模式
功能演示
這個(gè)是免key的一個(gè)免費(fèi)接口,但是調(diào)用的次數(shù)不能過快。
這個(gè)接口無法識別身份證和銀行卡
【不用注冊百度就能識別的白嫖】
我自己有key
這個(gè)就是注冊過百度OCR的用戶使用了,相對于功能演示來說,更加穩(wěn)定,快速,QPS
spi key和secret key
申請key的地址:https://console.bce.baidu.com/ai/?fromai=1#/ai/ocr/overview/index
這里的雙key是需要申請的,選擇功能演示版的用戶,無需填寫key
矯正圖片后再識別
如字面意思,勾選后如果圖片角度不正,會先矯正后識別
監(jiān)視剪貼板url
開啟后,只要復(fù)制鏈接就會自動識別。(如果不使用的時(shí)候,盡量不要開啟,免的到時(shí)候識別一下吾愛 -_-)
選擇本機(jī)圖片和選擇網(wǎng)絡(luò)圖片
單圖片識別選一個(gè)運(yùn)行即可
身份證識別和銀行卡識別
雙證都支持選擇本地圖片和網(wǎng)絡(luò)圖片(這里要說下:我用了一個(gè)時(shí)鐘修改信息框的標(biāo)題,點(diǎn)擊后開始檢測,修改完之后會停止)
純屬性
這個(gè)選項(xiàng),開啟后只返回識別到的內(nèi)容,舉例:6212XXXXXXX6835,關(guān)閉后會在前面添加“銀行卡:”的字樣
辦公文檔、營業(yè)執(zhí)照、手寫文字說明
辦公文檔
經(jīng)測試,辦公文檔識別和普通識別結(jié)果相差不多。
營業(yè)執(zhí)照識別
手寫文字識別
支持演示和key模式,支持網(wǎng)絡(luò)和本地圖片2種模式。
EXCEL表格識別-沒有功能演示
注:此模式識別返回的是excel文件,識別成功后需要下載。
注:整個(gè)模式只能用自己的KEY,提交的圖片種是需要帶邊框的,不帶邊框可能出現(xiàn)排版超級混亂的問題
注:僅支持表格的識別,如果提交的是word,只會識別圖中的表格,如下圖:
截圖識別
截圖識別簡介
這里的截圖和QQ和微信的截圖一樣操作。
保存截圖是默認(rèn)開啟的,會在運(yùn)行目錄創(chuàng)建一個(gè)“圖片”的文件夾來存放截圖。
怎樣取消截圖:
在非截圖右鍵單擊“取消”即可
怎樣完成截圖
在截圖區(qū)域內(nèi)雙擊即可
怎樣重新截圖
兩種方法
①在非截圖區(qū)域左鍵單擊
②右鍵取消后重新截圖
識別整個(gè)文件夾怎么使用
①、首先選擇好需要識別的圖片的格式。(當(dāng)然了,也可以全選)
②、設(shè)置好延遲,默認(rèn)為200,越大越不會出現(xiàn)QPS限制的問題
③、點(diǎn)擊“識別整個(gè)文件夾”,后等待識別完成即可。
④、搭配保存txt之類的都可以。
輸出分割線
開啟后右側(cè)會輸出識別的是哪個(gè)網(wǎng)址,或者是哪個(gè)圖片文件
窗口置頂
開啟后窗口會置頂,取消后恢復(fù)常規(guī)。
保存識別結(jié)果為txt文件的設(shè)置方法
①、需要開啟“保存結(jié)果為txt”,才會保存,會自動在運(yùn)行目錄創(chuàng)建“文字識別結(jié)果”的文件夾保存txt
②、txt文件的編碼,這個(gè)就不多說了。選哪個(gè)生成的就是哪個(gè)
③、識別文件夾的結(jié)果遞增保存:一般用于識別整個(gè)文件夾,例如1-7個(gè)png,想要1+2+3+...+7所有的識別結(jié)果生成在一起的時(shí)候開啟這個(gè)功能。(PS:一共會生成7個(gè)txt,最后一個(gè)是完整的和)
④、時(shí)間戳:為了防止txt文件名被占用,所以文件名增加一個(gè)10位數(shù)時(shí)間戳
⑤、符號:自定義文件名的符號,保存文件的時(shí)候, 符號 + 時(shí)間戳 + .txt。
⑥、類型:開啟后保存文件時(shí)添加,例如“手寫文字”或“辦公文檔”。不開啟改選項(xiàng)則不加類型。
識別整個(gè)文件夾的所有指定格式的圖片
其他識別運(yùn)行結(jié)果
更新日志
新增>身份證批量識別+銀行卡批量識別+手寫文字批量識別+辦公文檔批量識別+營業(yè)執(zhí)照批量識別[感謝@YS123456 提議]
修復(fù)>營業(yè)執(zhí)照本地圖片用key不識別的問題
優(yōu)化>部分代碼邏輯/縮減代碼行數(shù)