這個(gè)詞庫具有一定的廣泛意義和通用性,作者真是用心良苦。替所有用輸入法的人向你致敬!
▓?jiān)~庫特色
1.內(nèi)容:“紫光詞庫”是一個(gè)收錄現(xiàn)漢詞語、短語為主而偏重于文史哲詞匯的大型綜合性詞庫,繼承了fengyu29的系統(tǒng)詞庫,收納了官方專業(yè)詞庫,增補(bǔ)了自制的17個(gè)專業(yè)詞庫,整合了xml00的2個(gè)成語詞庫,吸收了AhMan的首選詞庫,采選了古漢語、語言學(xué)、司法行政、軍事地理、韻文名句、俗語諺語、書畫體育、佛教易經(jīng)、計(jì)算機(jī)等方面語匯,詞庫的文史性特色相對較為明顯。人名只收錄中外歷史上有較大影響的歷史人名、中小學(xué)教材中涉及的歷史人名;其他人名分離到獨(dú)立的“人名詞庫”。
2.詞條:詞庫中2字詞約占28%,3字詞約占35%,4字短語約占33%,≥4字詞條占7%。2字詞盡量控制在9條以內(nèi);4字以上長詞條,以詩詞曲賦文名句、俗語諺語為主體。
3.音形:堅(jiān)決執(zhí)行國家語委公布的規(guī)范性文件,未明確的依次采信《現(xiàn)代漢語詞典》、《漢語大字典》、《漢語大詞典》、《現(xiàn)代漢語規(guī)范詞典》等辭書;辭書互相矛盾的本人酌定。
、贀(jù)古今字規(guī)律、常用字頻度,酌定異形成語。
、诜补糯褡、國名、人名、地名等專有名詞,據(jù)《漢語大字典》、《漢語大詞典》正音。
③拼音容錯編碼部分保留,但易辨、易記之多音字錯誤拼音盡力刪除,如“行商坐賈”、“扁舟”,剔除“xing'shang'zuo'jia”、“bian'zhou”拼音編碼,只取“xing'shang'zuo'gu”、“pian'zhou”。
▓?zhí)貏e約定
1.的、地、著、了:逐一照實(shí)際正音,嚴(yán)格按語法區(qū)分。
2.血、熟、露、殼:一般注為xuè、shú、lù、ké。
3.咱、誰”:統(tǒng)一注為zán、shuí。
4.堡:軍事性質(zhì)地名,音bǎo;一般村莊,音bǔ;“N里堡”類,音pù;情況不明的,一般音bǔ。
5.大都:副詞,dàdōu;名詞,dàdū。
6.音譯用字:“扎”概注za(“扎啤”音zhā。,“塞”概注sai,“查”概注chá,“什”,概注shí。