WPS mac版2022最新版V5.0.0 官方正式版中文 / 469M
騰訊會議mac版v3.10.7.413 官方版中文 / 175M
Outlook mac版15.8最新版中文 / 337.8M
iWork for mac2015官方免費版中文 / 914.4M
微信企業(yè)版mac版v4.0.16.90619 官方最新版中文 / 443M
紛享逍客Mac版v2.0.12 官方最新版中文 / 78.3M
蘋果思維導(dǎo)圖軟件(Mind Vector)v1.1 官方最中文 / 7M
mac PDF文檔編輯器(Wondershare PDF Editor英文 / 24.3M
iText是一款免費的ocr文字識別軟件,這款軟件可以直接選取圖片上的文字并識別保存為文檔內(nèi)容,軟件還支持翻譯功能,可以直接截圖選取想要翻譯的內(nèi)容,軟件會自動轉(zhuǎn)換翻譯。每月可免費識別 20 次,訂閱 iText 高級版即可無限次識別。
使用場景:
- 從掃描版 PDF 中提取文字
- 從朋友發(fā)來的圖片中識別文字
- 從任意圖片中識字
取圖方便:
- 自帶截圖功能,截圖即識字
- 拖拽圖片至菜單欄圖標(biāo)識字
- 選擇圖片文件識字
- 連續(xù)識別時,自動拼接文字
識別精準(zhǔn):
- 騰訊、百度、Google 三引擎,文字識別精準(zhǔn)可靠
- 自動識別段落,優(yōu)化排版
- 亦可預(yù)覽原圖,方便校對
自動翻譯:
- Google、百度雙引擎
- 支持 100+ 種語言
簡潔高效:
- 不占用 Dock、僅存在于菜單欄
- 多種快捷鍵,操作方便
1. 選取圖片方便
iText 支持多種方式選擇圖片,操作非常便利。
1.1 截圖即識字
iText 自帶截圖功能,只需按下 ⇧⌘1 快捷鍵、截取屏幕任意位置,即可提取該圖片中的文字。
小提示:識別后的文字已經(jīng)復(fù)制到系統(tǒng)剪貼板,直接粘貼即可。
1.2 拖拽圖片至菜單欄圖標(biāo)識字
比如,當(dāng)你在電腦上使用微信、QQ 時,好友發(fā)了張圖片(比如手機拍攝的快遞單),你想識別其中的文字(比如快遞單號),只需將該圖片拖拽至 iText 菜單欄圖標(biāo)即可。
1.3 選擇圖片文件識字
當(dāng)然,也可以在對話框中選擇圖片文件。不過,個人還是建議你直接把該圖片文件拖拽至 iText 菜單欄圖標(biāo),操作直觀高效。
1.4 支持連續(xù)識別
比如,連續(xù)截取 PDF 不同位置的圖片,iText 將依次識別其中的文本,并自動將結(jié)果拼接在一起。
2. 文字識別精準(zhǔn)
你有沒有這種經(jīng)歷:你想從一張圖片中提取文字,結(jié)果發(fā)現(xiàn)識別的文字中有一些錯誤。結(jié)果,手動修改這些錯誤的時間,比自己直接在電腦上碼字的時間還要長。是不是很尷尬?
可見,識別的準(zhǔn)確性非常重要,也是我非常在意的一點。
2.1 騰訊、百度、Google 三引擎
首先,我排除了離線的識別庫,因為離線注定了這些庫的識別能力是死的,不會自己增強。接下來,在一票在線 OCR 服務(wù)中,我對比了百度、騰訊、微軟、Google 這些四家大廠的產(chǎn)品,最后選擇了國內(nèi)使用騰訊及百度、國外使用 Google 的組合。
如果你有 Google 信仰、或者需要識別日文等其他語言,可以右擊 iText 菜單欄圖標(biāo),手動選擇使用騰訊、百度或 Google OCR 服務(wù)。不過,從實測和目前優(yōu)化的情況來看,中文還是建議使用騰訊;大家可以自行測試。
那么,到底識別準(zhǔn)不準(zhǔn)呢?這么說吧:
對于一般的自然語言,比如書中的一段話、新聞稿,識別效果是驚人的準(zhǔn)確,甚至可以達到 100%
對于排版復(fù)雜、尤其有特殊字符的文字,比如程序代碼、選擇題,識別效果就不太理想,需要手動對識別后的結(jié)果進行修正
比如,單純地給一個豎線,機器是無法區(qū)分到底是小寫的 l、還是大寫的 I(順便問一下,你看出二者的區(qū)別了嗎?);與之相對,機器是需要根據(jù)上下文進行判斷和優(yōu)化的。而像程序代碼這種非自然語言,機器目前是很難進行語義識別的
到底準(zhǔn)不準(zhǔn)?歡迎你來試試。
2.2 獨創(chuàng)算法,進一步優(yōu)化識別結(jié)果
OCR 服務(wù)完成最好的是字符的識別;但更進一步的識別,目前還不是很好,比如段落的識別、全角半角符號等等,這就需要程序后期進行優(yōu)化。
目前,iText 主要完成了這些部分的優(yōu)化:
自動識別段落
中文環(huán)境使用全角標(biāo)點符號
中文與英文字母、數(shù)字間增加空格
刪除中文字符間、英文字符與標(biāo)點符號間的多余空格
英文首字母大寫
如果你發(fā)現(xiàn)優(yōu)化的不好的地方,歡迎把圖發(fā)給我,我會相應(yīng)地優(yōu)化算法,先謝。
2.3 預(yù)覽原圖,方便校對
在目前 OCR 技術(shù)不能始終達到 100% 的情況下,預(yù)覽原圖、并進行修正,還是有必要的。在 iText 中,你可以這樣:
將識別后的窗口拖到圖片附近
調(diào)用 iText 識別結(jié)果的 雙欄模式:左側(cè)展示圖片、右側(cè)展示識別后的文字
可使用快捷鍵 ⇧⌘R 快速調(diào)出識別結(jié)果窗口
這樣,就可以很方便地對照原圖進行手動優(yōu)化識別后的文字。
2.4 自動隱藏識別結(jié)果
由于 iText 的識別結(jié)果已經(jīng)非常準(zhǔn)確,且已經(jīng)復(fù)制到剪貼板,因此識別后并不需要編輯或復(fù)制文本。此時,你可以如上圖所示,開啟「自動隱藏」選項,識別結(jié)果窗口將會在 3s 后自動隱藏,非常方便。
并且,如果臨時需要編輯某次識別結(jié)果,只要將鼠標(biāo)移至結(jié)果窗口,則會暫時忽略自動隱藏功能。另外,開啟「總在最前」選項后,窗口將不會自動隱藏。
3. 識別后自動翻譯
比如,對于英文版的 PDF、未翻譯的字幕、未漢化的游戲,直接用 iText 截圖,自動翻譯為中文。
集成 Google、百度雙引擎(優(yōu)先選用 Google,當(dāng)無法訪問 Google 時使用百度),支持 100+ 種語言。
特別說明
聲明:西西軟件園為非贏利性網(wǎng)站 不接受任何贊助和廣告