西西軟件園多重安全檢測下載網(wǎng)站、值得信賴的軟件下載站!
西西首頁常用軟件軟件下載安卓軟件游戲下載安卓游戲MAC應(yīng)用驅(qū)動下載安卓電視
系統(tǒng)工具網(wǎng)絡(luò)工具媒體工具圖形圖像社交軟件殺毒軟件辦公軟件驅(qū)動軟件學(xué)習(xí)教育閱讀工具其他軟件
當(dāng)前位置:首頁MAC軟件Mac辦公軟件 → Mac文字識別軟件iText v1.6.6 官方版

Mac文字識別軟件iText

Mac文字識別軟件iText
  • 更新:2020-02-21 12:13
  • 大。6.1M
  • 版本:v1.6.6 官方版
  • 語言:中文
  • 類型:Mac辦公軟件
  • 平臺:Mac
本類排行
  • 應(yīng)用介紹
  • 應(yīng)用截圖
  • 下載地址
  • 網(wǎng)友評論

iText是一款免費的ocr文字識別軟件,這款軟件可以直接選取圖片上的文字并識別保存為文檔內(nèi)容,軟件還支持翻譯功能,可以直接截圖選取想要翻譯的內(nèi)容,軟件會自動轉(zhuǎn)換翻譯。每月可免費識別 20 次,訂閱 iText 高級版即可無限次識別。

功能特色:

使用場景:

- 從掃描版 PDF 中提取文字

- 從朋友發(fā)來的圖片中識別文字

- 從任意圖片中識字

取圖方便:

- 自帶截圖功能,截圖即識字

- 拖拽圖片至菜單欄圖標(biāo)識字

- 選擇圖片文件識字

- 連續(xù)識別時,自動拼接文字

識別精準(zhǔn):

- 騰訊、百度、Google 三引擎,文字識別精準(zhǔn)可靠

- 自動識別段落,優(yōu)化排版

- 亦可預(yù)覽原圖,方便校對

自動翻譯:

- Google、百度雙引擎

- 支持 100+ 種語言

簡潔高效:

- 不占用 Dock、僅存在于菜單欄

- 多種快捷鍵,操作方便

使用說明:

1. 選取圖片方便

iText 支持多種方式選擇圖片,操作非常便利。

1.1 截圖即識字

iText 自帶截圖功能,只需按下 ⇧⌘1 快捷鍵、截取屏幕任意位置,即可提取該圖片中的文字。

小提示:識別后的文字已經(jīng)復(fù)制到系統(tǒng)剪貼板,直接粘貼即可。

1.2 拖拽圖片至菜單欄圖標(biāo)識字

比如,當(dāng)你在電腦上使用微信、QQ 時,好友發(fā)了張圖片(比如手機拍攝的快遞單),你想識別其中的文字(比如快遞單號),只需將該圖片拖拽至 iText 菜單欄圖標(biāo)即可。

1.3 選擇圖片文件識字

當(dāng)然,也可以在對話框中選擇圖片文件。不過,個人還是建議你直接把該圖片文件拖拽至 iText 菜單欄圖標(biāo),操作直觀高效。

1.4 支持連續(xù)識別

比如,連續(xù)截取 PDF 不同位置的圖片,iText 將依次識別其中的文本,并自動將結(jié)果拼接在一起。

2. 文字識別精準(zhǔn)

你有沒有這種經(jīng)歷:你想從一張圖片中提取文字,結(jié)果發(fā)現(xiàn)識別的文字中有一些錯誤。結(jié)果,手動修改這些錯誤的時間,比自己直接在電腦上碼字的時間還要長。是不是很尷尬?

可見,識別的準(zhǔn)確性非常重要,也是我非常在意的一點。

2.1 騰訊、百度、Google 三引擎

首先,我排除了離線的識別庫,因為離線注定了這些庫的識別能力是死的,不會自己增強。接下來,在一票在線 OCR 服務(wù)中,我對比了百度、騰訊、微軟、Google 這些四家大廠的產(chǎn)品,最后選擇了國內(nèi)使用騰訊及百度、國外使用 Google 的組合。

如果你有 Google 信仰、或者需要識別日文等其他語言,可以右擊 iText 菜單欄圖標(biāo),手動選擇使用騰訊、百度或 Google OCR 服務(wù)。不過,從實測和目前優(yōu)化的情況來看,中文還是建議使用騰訊;大家可以自行測試。

那么,到底識別準(zhǔn)不準(zhǔn)呢?這么說吧:

對于一般的自然語言,比如書中的一段話、新聞稿,識別效果是驚人的準(zhǔn)確,甚至可以達到 100%

對于排版復(fù)雜、尤其有特殊字符的文字,比如程序代碼、選擇題,識別效果就不太理想,需要手動對識別后的結(jié)果進行修正

比如,單純地給一個豎線,機器是無法區(qū)分到底是小寫的 l、還是大寫的 I(順便問一下,你看出二者的區(qū)別了嗎?);與之相對,機器是需要根據(jù)上下文進行判斷和優(yōu)化的。而像程序代碼這種非自然語言,機器目前是很難進行語義識別的

到底準(zhǔn)不準(zhǔn)?歡迎你來試試。

2.2 獨創(chuàng)算法,進一步優(yōu)化識別結(jié)果

OCR 服務(wù)完成最好的是字符的識別;但更進一步的識別,目前還不是很好,比如段落的識別、全角半角符號等等,這就需要程序后期進行優(yōu)化。

目前,iText 主要完成了這些部分的優(yōu)化:

自動識別段落

中文環(huán)境使用全角標(biāo)點符號

中文與英文字母、數(shù)字間增加空格

刪除中文字符間、英文字符與標(biāo)點符號間的多余空格

英文首字母大寫

如果你發(fā)現(xiàn)優(yōu)化的不好的地方,歡迎把圖發(fā)給我,我會相應(yīng)地優(yōu)化算法,先謝。

2.3 預(yù)覽原圖,方便校對

在目前 OCR 技術(shù)不能始終達到 100% 的情況下,預(yù)覽原圖、并進行修正,還是有必要的。在 iText 中,你可以這樣:

將識別后的窗口拖到圖片附近

調(diào)用 iText 識別結(jié)果的 雙欄模式:左側(cè)展示圖片、右側(cè)展示識別后的文字

可使用快捷鍵 ⇧⌘R 快速調(diào)出識別結(jié)果窗口

這樣,就可以很方便地對照原圖進行手動優(yōu)化識別后的文字。

2.4 自動隱藏識別結(jié)果

由于 iText 的識別結(jié)果已經(jīng)非常準(zhǔn)確,且已經(jīng)復(fù)制到剪貼板,因此識別后并不需要編輯或復(fù)制文本。此時,你可以如上圖所示,開啟「自動隱藏」選項,識別結(jié)果窗口將會在 3s 后自動隱藏,非常方便。

并且,如果臨時需要編輯某次識別結(jié)果,只要將鼠標(biāo)移至結(jié)果窗口,則會暫時忽略自動隱藏功能。另外,開啟「總在最前」選項后,窗口將不會自動隱藏。

3. 識別后自動翻譯

比如,對于英文版的 PDF、未翻譯的字幕、未漢化的游戲,直接用 iText 截圖,自動翻譯為中文。

集成 Google、百度雙引擎(優(yōu)先選用 Google,當(dāng)無法訪問 Google 時使用百度),支持 100+ 種語言。

下載地址

下載地址

特別說明

同類推薦

發(fā)表評論

昵稱:
表情: 高興 可 汗 我不要 害羞 好 下下下 送花 屎 親親
查看所有(0)條評論 > 字數(shù): 0/500