BabelPad Unicode文本編輯器是一個免費(fèi)的Windows支持適當(dāng)?shù)某尸F(xiàn)最復(fù)雜的腳本,并允許您指定不同的字體,不同的腳本為了方便多腳本文本編輯。它還提供了很多有用的特性和特殊的實(shí)用程序,如下所述。BabelPad支持最新版本的Unicode標(biāo)準(zhǔn)——Unicode 7.0.0(2014-05-16發(fā)布)。
用戶界面
編輯模式和瀏覽器之間的交換模式:
編輯模式允許任意大小的文檔是在純文本格式編輯。
瀏覽器模式允許當(dāng)前文檔查看在Internet Explorer瀏覽器窗口。
用戶界面菜單和其他文本元素可以被顯示在下列語言:
英語
中文(簡體)
中文(繁體)
BabelPad的多個實(shí)例可以平鋪的(水平、垂直或拼湊)、級聯(lián)、最小化、最大化、恢復(fù)
使用說明:
(一)打開超大文件快:
本軟件的最大優(yōu)勢就是打開超大文本速度快。經(jīng)測試,打開90MB的“漢語大詞典_百度云分享”,比其它文本編輯器的速度都要快。打開《現(xiàn)代漢語詞典》、《康熙字典》等5-10MB的txt文本,也比cnbook的速度快得多。
(二)滾動瀏覽形式:
本軟件的滾動瀏覽形式和其它文本編輯器不同,無論是用指針拖動滾動條,還是用鼠標(biāo)滾輪滾動,它都是按文本實(shí)際行首滾動的。
而其它文本編輯器,則是按自動換行后的行依次顯示的。
(三)基本設(shè)置:
1、在“視圖”菜單,只勾選“顯示主工具欄”和“顯示狀態(tài)欄”。
2、主工具欄的自定義設(shè)置:
依次為:①F(字體)位于“打印”按鈕后,選擇“綜合字體”;②(字型)呈灰色,不可選擇;③(字型大。16;④(行距)1-1.5。其它不動。
3、點(diǎn)“字體菜單/設(shè)置綜合字體”,在彈出的“設(shè)置綜合字體”對話框里,進(jìn)行使用顯示字體的設(shè)置。①設(shè)置方法和“BabelMap字符映射表”完全相同。②也可以把原先導(dǎo)出的綜合字體配置文件“CompositeFont.xml”導(dǎo)入進(jìn)來,還原原先的配置。③綜合字體設(shè)置好后,在文本編輯和使用字符映射表時(shí),便都可以使用綜合字體了。能顯示“BabelMap字符映射表”中全部的可見字符。
4、用戶設(shè)置信息在C盤操作系統(tǒng)內(nèi),其中綜合字體設(shè)置配置文件夾路徑為:C:\Documents and Settings\Administrator\Application Data\BabelStone\BabelPad ,但目前是空文件夾。
其它自定義設(shè)置配置和打開文件歷史紀(jì)錄,尚不知文件目錄所在。
(四)能識別CJK全部字符。
1、在編輯區(qū),把光標(biāo)定位在某一字符前,在狀態(tài)欄里,則會依次顯示:①該字符的U+編碼;②該字符的Unicode名稱;③該(漢)字的漢語拼音。
2、選擇綜合字體后,能在編輯區(qū)顯示由“Symbola”字體顯示的圖形文字。
(五)自動識別編碼不行:
1、只能自動識別“UTF-8”和“UTF-16”編碼。不能自動識別“ANSI/OEM - 簡體中文 GBK”編碼,需要手動選擇。
2、切換編碼:①點(diǎn)“文件菜單/重新打開文件”,在彈出的《打開文件》對話框最下面的“Encoding”欄里,重新選擇編碼。②將“ANSI/OEM - 簡體中文 GBK”編碼文件,重新打開文件/選擇使用“GB18030”,可消除亂碼。
3、如果源文件為GBK,由本軟件再編輯后直接保存,會依然是GBK編碼。但用本軟件重新打開時(shí),會依然呈亂碼狀態(tài)。
4、由本軟件直接保存的“GB18030”編碼新文件,和“GBK DOS”是兼容的,因此用cnbook打開時(shí),不出現(xiàn)亂碼情況(TP轉(zhuǎn)換的“GB18030”,用cnbook打開時(shí)亂碼)。
(六)自動換行:
工具欄里的“自動換行”按鈕位置太后,使用不太方便?晒催x(或不勾選)“布局菜單/自動換行”,來設(shè)置自動換行。
(七)工作區(qū)(編輯欄):
1、在工作區(qū)的右鍵菜單里, 有“轉(zhuǎn)換菜單”中的全部內(nèi)容。
2、在工作區(qū)的右鍵菜單里,另外還有:①重復(fù)前面的字:重復(fù)光標(biāo)前面的一個字。② 文字反序:可將選中的文字變成反序。
(八)“查找替換”對話框:
本軟件雖然沒有正則表達(dá)式工具,但“查找替換”對話框要比普通模式強(qiáng)大。可以界定“行首、行尾、詞首、詞尾”等特定位置。
(九)“編輯菜單/批量替換”:
1、批量替換功能強(qiáng),經(jīng)測試,執(zhí)行30多萬條的替換表都很輕松。
(十)內(nèi)置的字符映射表:
1、點(diǎn)“工具菜單/字符映射表”,即可調(diào)出內(nèi)置的字符映射表。
2、操作方法和“BabelMap”字符映射表完全相同,如果配置合理,可使用綜合字體。
(十一)轉(zhuǎn)換菜單:
1、在“轉(zhuǎn)換菜單/中文”中,可進(jìn)行繁簡轉(zhuǎn)換。此功能強(qiáng)大,速度快。
2、在“轉(zhuǎn)換菜單/中文”中,可將漢字轉(zhuǎn)換成規(guī)范的帶聲調(diào)拼音,譬如“女nǚ、路lù”,都劃分很清楚。
3、在“轉(zhuǎn)換菜單/其他”中,選中文本后,可“刪除音調(diào)符號”(即漢語拼音的聲調(diào)符號)。
①此功能可用于制作詞庫。
②此功能的缺陷是“ü、u”不分,譬如會將“女nǚ、路lù”轉(zhuǎn)換成“女nu、路lu”?稍趫(zhí)行此功能之前,需將“ü”首先轉(zhuǎn)換成“v”。
更新日志:
最新的 BabelMapV7.0.0.3字符映射表,英國語言學(xué)家魏安先生的軟件作品。包含統(tǒng)一碼(Unicode)7.0 正式版的數(shù)據(jù)。
Unicode 7.0新增了2834個字符,23個新腳本,以及許多新的符號。
主要增加的字符包括:
1、兩個新的貨幣符號:阿塞拜疆使用的馬納特、俄羅斯等國家使用的盧布。
2、象形文字符號(包括許多表情)、幾何符號、箭頭、來自Wingdings和Webdings的裝飾品。
3、23個新的腳本以及舊的腳本擴(kuò)展支持以下國家的書面語言:北美、中國、印度、其它亞洲國家、非洲。
4、Teuthonista和其他轉(zhuǎn)錄系統(tǒng)使用的字母,以及一個新的符號集,Duployan。
Unicode 7.0其它重要更新:
1、對章節(jié)和布局的核心規(guī)范進(jìn)行重大重組,一種新的頁面大小,方便在電子閱讀器和其他移動設(shè)備上查看。
2、更新了Unicode雙向算法。
3、進(jìn)一步澄清了穩(wěn)定政策對應(yīng)的情況,以及針對Numeric-Type的新穩(wěn)定政策。
4、Unihan重大更新,新增了近3000個粵語發(fā)音條目。
5、增強(qiáng)Indic腳本屬性,改善了foundation、更多的腳本互操作性顯示。
Unicode 7.0新增新增表情符號之比較
(一)BabelMap 6.3表情符號:
(二)BabelMap 7.0表情符號:
文件功能
Open files encoded as :
Unicode : UTF-8
Unicode : UTF-16 (Big Endian or Little Endian)
Unicode : UTF-32 (Big Endian or Little Endian)
Unicode : UTF-7
Unicode : SCSU
Unicode : CESU-8
Unicode 1.0 : UCS-2
Unicode 1.1 : UCS-2
Unicode 1.1 : UTF-7
ISO-8859-1 (Latin1) : Western European
ISO-8859-2 (Latin2) : Non-Cyrillic Central European
ISO-8859-3 (Latin3) : Esperanto, Galician, Maltese, Turkish
ISO-8859-4 (Latin4) : Baltic Rim
ISO-8859-5 (Cyrillic)
ISO-8859-6 (Arabic)
ISO-8859-7 (Greek)
ISO-8859-8 (Hebrew)
ISO-8859-9 (Latin5) : Improved Turkish
ISO-8859-10 (Latin6) : Inuit, Lappish
ISO-8859-11 (Thai)
ISO-8859-13 (Latin7) : Improved Baltic Rim
ISO-8859-14 (Latin8) : Celtic
ISO-8859-15 (Latin9, a.k.a. Latin0) : Improved Western European
ISO-8859-16 (Latin10) : South-Eastern European
Windows CP 874 (Thai)
Windows CP 932 (extension of Shift-JIS) : Japanese
Windows CP 936 (extension of GB2312) : Simplified Chinese
Windows CP 949 (Unified Hangul Code) : Korean
Windows CP 950 (extension of Big5) : Traditional Chinese
Windows CP 1133 (Lao)
Windows CP 1250 (East European)
Windows CP 1251 (Cyrillic)
Windows CP 1252 (West European)
Windows CP 1253 (Greek)
Windows CP 1254 (Turkish)
Windows CP 1255 (Hebrew)
Windows CP 1256 (Arabic)
Windows CP 1257 (Baltic)
Windows CP 1258 (Vietnamese)
EUC-JA (Japanese)
EUC-KR (Korean)
GB18030 (Extended Chinese) : Unicode-mapped superset of GB2312
GB2312 (Simplified Chinese)
Big5 (Traditional Chinese)
Big5-HKSCS (Big5 plus Hong Kong Supplementary Character Set)
Shift-JIS (Japanese) (optionally converting DoCoMo/KDDI/SoftBank emoji extensions)
JIS X 0201 (Latin plus Katakana)
JIS X 0208 (Japanese)
KPS 9566-2003 (Korean [DPRK])
KSC 5601 (KS X 1001) (Korean)
Wansung (Korean)
Johab (Korean)
KOI8-R (Russian)
KOI8-U (Ukranian)
ARMSCII-8 (Armenian)
VISCII (Vietnamese)
VIQR (Vietnamese Quoted Readable)
TIS-620 (Thai)
Mulelao-1 (Lao)
TSCII (Tamil)
TAM (Tamil Monolingual)
TAB (Tamil Bilingual)
I.S. 434 (Ogham)
Autodetects Unicode encoding forms and character sets declared in HTML or XML documents.
Automatically convert CR/LF, CR, LF, Line Separator and Paragraph Separator characters.
Option to convert Numeric Character References (NCR) and/or Universal Character Names (UCN) to Unicode characters on Open.
Save the current document as :
Unicode : UTF-8 (with or without a Byte Order Mark)
Unicode : UTF-16 Big Endian or Little Endian (with or without a Byte Order Mark)
Unicode : UTF-32 Big Endian or Little Endian (with or without a Byte Order Mark)
GB18030 (with or without a Byte Order Mark)
ASCII with Hexadecimal Numeric Character Reference (NCR) substitution of non Basic Latin characters
ASCII with Decimal Numeric Character Reference (NCR) substitution of non Basic Latin characters
ASCII with Universal Character Name (UCN) substitution of non Basic Latin characters
ASCII with HTML Entity substitution of non Basic Latin characters
SCSU (Standard Compression Scheme for Unicode) [encoder/decoder code kindly supplied by Doug Ewell]
Save line breaks as CR/LF, LF, CR, or as Unicode Line Separator [U+2028] or Paragraph Separator characters [U+2029].
編輯功能
從左到右或從右到左(LTR)(RTL)頁面布局。
自動換行模式或沒有自動換行模式。
拖放編輯。
多個撤銷/重做。
縮進(jìn)和Unindent選定行文本使用選項(xiàng)卡和轉(zhuǎn)變選項(xiàng)卡。
選擇自動縮進(jìn)文本作為你類型(用于編寫代碼)。
選擇一個“單詞”,通過雙擊導(dǎo)航中的“單詞”通過左/右箭頭(適用于大多數(shù)Unicode腳本)。
選擇一行文本由左點(diǎn)擊空白處(選擇一個段落通過雙擊空白處)。