鴻雁拼音輸入法文藝基礎(chǔ)版是一個(gè)自己的拼音輸入法,開源的,可以高度定制,沒有強(qiáng)制彈窗、沒有強(qiáng)制升級(jí)。文藝根底版包括1000萬詞語,來歷于各大開源的分詞數(shù)據(jù)庫,最大的數(shù)據(jù)來歷是百度百科約400萬標(biāo)題。希望鴻雁輸入法能夠成為文字工作者、學(xué)生、老師、社會(huì)各界人士常用的輸入法軟件。
軟件說明
中文輸入法中的一個(gè)黑馬,開源,高度定制,沒有強(qiáng)制彈窗、沒有強(qiáng)制升級(jí),主打中文輸入習(xí)慣,擁有一個(gè)強(qiáng)大詞庫,而且可以無限制字?jǐn)?shù)的整句輸入。此版本為文藝基礎(chǔ)版,包含1000萬詞語,來源于各大開源的分詞數(shù)據(jù)庫,輸入法使用流暢,沒有繁瑣的操作,一鍵安裝。
鴻雁輸入法基于詞頻統(tǒng)計(jì)的最大概率排序,同樣可以對(duì)千萬級(jí)的詞匯進(jìn)行統(tǒng)計(jì)。如果把2-4個(gè)字的詞語前后組合排列,就構(gòu)成一個(gè)更大的詞語。在不考慮中文語法規(guī)則得情況下,把一個(gè)句子當(dāng)作一個(gè)詞語,和詞語一樣,按照語料庫的出現(xiàn)概率大小進(jìn)行排序,同樣可以實(shí)現(xiàn)整句輸入的效果。只要保證足夠大、足夠全面的語料樣本,語句按照詞語分割后,按照所有分詞組合對(duì)應(yīng)的概率排序,就可以獲得質(zhì)量相當(dāng)高的整句輸入法。鴻雁輸入法在語料庫分析的時(shí)候,最大的詞語長(zhǎng)度是16,這個(gè)長(zhǎng)度已經(jīng)足以覆蓋絕大部分中文語句的使用場(chǎng)合。
使用說明
中文詞語上屏,使用標(biāo)點(diǎn)符號(hào)、回車鍵、或者空格按兩次。單個(gè)空格可以用于整句輸入的分詞。
輸入字母的半途,使用英文上屏,按下shift鍵。
初次安裝輸入法會(huì)生成詞庫索引,可能會(huì)占用較高的資源。尤其是鴻雁拼音手機(jī)輸入法,需要等待1-4分鐘,LevelDB數(shù)據(jù)庫需要處理337萬的數(shù)據(jù)。這個(gè)時(shí)候軟件會(huì)出現(xiàn)無響應(yīng)的狀態(tài),請(qǐng)耐心等待。
可以使用拼音的簡(jiǎn)拼輸入詞語,如鍵入“tswcbyy”,候選詞列表第一個(gè)是“天生我材必有用”。沒有模糊音選項(xiàng),一個(gè)漢字要么輸入聲母或者首字母,要么輸入全拼。
請(qǐng)使用規(guī)范漢語拼音。比如“嗯”字,新華詞典這個(gè)字的拼音有“ń ńg ň ňg ǹ ǹg”,目前市面上的輸入法可以使用“en”打出“嗯”字。這里不破壞拼音標(biāo)準(zhǔn),拼音輸出單字“嗯”,請(qǐng)輸入“ng”或者“vn”。至于為什么不用“n”而用“vn”,下面作出解釋。
在拼音輸入詞語的時(shí)候,可以用每個(gè)字的拼音第一個(gè)字母組合起來作為簡(jiǎn)拼輸入。在漢字中有一些漢字的拼音只有一個(gè)字符,比如“堊 è”、“阿 à ā ē”、“㕶 ň ňg”、“呣 m̀ ”,單個(gè)的拼音轉(zhuǎn)化為英文字母,“a o e”這些字母作為簡(jiǎn)拼輸入不會(huì)出現(xiàn)詞語競(jìng)爭(zhēng),“n m”這兩個(gè)字母單獨(dú)輸入,每一次輸入時(shí)都會(huì)出現(xiàn)單獨(dú)的“㕶 呣”這些單音字列表,干擾使用體驗(yàn),故把完整拼音是“n”或者“m”的漢字輸入拼音分別改為“vn”、“vm”。這里采用類似轉(zhuǎn)移字符的方式繞過這個(gè)小狼毫輸入法缺陷。
本輸入法未對(duì)詞語的馬爾可夫鏈概率鏈進(jìn)行統(tǒng)計(jì),就是前后兩個(gè)詞語的相關(guān)概率并未統(tǒng)計(jì)。鑒于需求的輕重緩急,本方案比較簡(jiǎn)單粗暴,只追求單個(gè)漢字和單個(gè)詞語極致的拼音庫質(zhì)量和數(shù)量。
因?yàn)樵~庫數(shù)據(jù)量較大,安卓平臺(tái)的版本按照同文輸入法的默認(rèn)步驟安裝會(huì)無法安裝成功,會(huì)出現(xiàn)無響應(yīng)、進(jìn)入不了輸入法界面的狀態(tài)。需要按照“鴻雁拼音手機(jī)輸入法安裝步驟.pdf”文檔,按照特定的步驟才能成功安裝。
鴻雁拼音輸入法windows版只能在Windows 7及以上平臺(tái)使用,不支持windows xp平臺(tái)。
軟件特點(diǎn)
不以盈利為目的,本著開源共享的精神,使用網(wǎng)絡(luò)上可以公開獲得的數(shù)據(jù),打造一個(gè)高準(zhǔn)確率的拼音輸入法,免除彈窗、捆綁安裝、強(qiáng)制升級(jí)的煩惱。
商業(yè)化的輸入法有經(jīng)濟(jì)利潤(rùn)的驅(qū)動(dòng),投入大量的人力,擁有較高的詞庫質(zhì)量。當(dāng)商業(yè)化傾向過于嚴(yán)重時(shí),會(huì)影響用戶體驗(yàn)。閉源的數(shù)據(jù)和代碼,讓一般民眾無法參與到產(chǎn)品核心功能的改進(jìn),無法吸納群體的智慧。
開源的和免費(fèi)的輸入法屬于興趣驅(qū)動(dòng),人力投入?yún)T乏,良莠不齊,缺乏高質(zhì)量的詞庫和功能體驗(yàn)。
大學(xué)研究人員對(duì)于漢語詞頻、拼音、分詞的學(xué)術(shù)性研究,擁有科研基金的支持,有高水平人才的參與,學(xué)術(shù)成果擁有較高的質(zhì)量,但研究者沒有將學(xué)術(shù)成果轉(zhuǎn)化為實(shí)用性較強(qiáng)的拼音輸入法傾向。
魚與熊掌不可兼得,綜合吸納了商業(yè)化、開源化、學(xué)術(shù)化的產(chǎn)品三方優(yōu)點(diǎn),鴻雁拼音輸入法誕生了,同時(shí)擁有windows版和安卓版。
常見問題
為什么安裝完成后無法輸入中文?
可能原因:
1 安裝鴻雁輸入法之后,部分系統(tǒng)需要重啟操作系統(tǒng)才能正常工作
2 軟件安裝過程中沒有選擇安裝到默認(rèn)目錄,預(yù)編譯詞庫索引(例如 hongyan_pinyin_simp_wenyi.table.bin)沒有移動(dòng)到用戶文件夾
3 輸入法安裝會(huì)執(zhí)行腳本移動(dòng)文件,部分安全軟件會(huì)攔截
4 重啟操作系統(tǒng)之后,部分電腦需要等待一段時(shí)間,輸入法算法后臺(tái)需要加載詞庫索引。(具體的延時(shí)取決于電腦的配置和開機(jī)加載的軟件數(shù)量。i5處理器、固態(tài)硬盤、win 10系統(tǒng)在開機(jī)只有火絨軟件的情況下,只需要等待數(shù)秒)
為什么有時(shí)候切換到五筆或者雙拼無法正常工作?
有時(shí)候不知道怎么回事,算法服務(wù)出問題了,也沒提示什么的,導(dǎo)致輸入法不能用。重啟系統(tǒng)又正常了。
切換輸入法之后,輸入法后臺(tái)需要加載數(shù)據(jù)庫。出現(xiàn)這樣的問題是因?yàn)樗惴ê笈_(tái)沒有加載成功數(shù)據(jù)庫。
鴻雁輸入法是基于rime輸入法修改而來的,也“繼承”了小狼毫輸入法的一些缺點(diǎn)。
使用小狼毫助手這個(gè)軟件,把算法服務(wù)停止,再把算法服務(wù)啟動(dòng)即可。
極端的例子,前面的方法無法奏效,停止算法服務(wù)后,通過windows系統(tǒng)的文件管理器手動(dòng)啟動(dòng)WeaselServer.exe后才能正常打字。
原版小狼毫輸入法提供“小狼毫算法服務(wù)”、“退出算法服務(wù)”,就是因?yàn)橛幸恍┮呻y雜癥只能用重啟算法服務(wù)解決問題。