cht電腦資訊gcingcin分享
adm Find login register

[分享] 五四三倉頡

winlin
1 [分享] 五四三倉頡
Promote 2 Bookmark 02012-05-19quote  

一、簡介:

先前在gcin聊天室經過eliu兄的啟發之後,
小弟發現的確可以來弄個「五四三倉頡」(感謝eliu兄賜名)。
顧名思義就是把「五碼的第三代倉頡」、四碼倉頡三碼倉頡合併在一起,
為了顧及使用會utf-8某些稀少用字的使用者,目前也加入了「第五代倉頡」的字碼,
在下面所介紹的特殊版本裡,還加了「速成/簡易」的拆碼,
使用者隨時可以看自己高興來選擇要拆什麼碼、要拆幾碼~
同時把這麼多種倉頡輸入法合併在一起,難道候選字不會爆多嗎?
當然會!不過請別擔心~
因為五四三倉頡預設開啟gtab自動選字功能,使用者不需設定就可體驗自動選字的快感,
拆碼交給您,候選字的困擾就放心交給gcin來處理吧~
五四三倉頡的操作方式類似微軟新倉頡,習慣「新倉頡」的windows使用者想在Linux平台找替代方案的話,可以考慮試試。值得一提的是,五四三倉頡可以使用「預選詞」(直接按數字就能輸出詞),這是目前相對於微軟新倉頡的重要特色:

※註:
如果目前詞庫未包含您的常用詞,gcin現在也可以手動加詞,
只要把游標移到新詞的後面按「ctrl+數字」,即可快速加入新詞,
詳情請見gtab自動選字使用指南,FAQ第一節「如何新增自訂詞?」。

同於四碼倉頡三碼倉頡,「五四三倉頡」也預設使用全形標點符號,
方便使用者輸入常用的全形標點符號:


二、下載與安裝:

若想編輯自訂輸入法的細節,請下載*.cin檔。

★五四三倉頡(倉頡+四碼倉頡+三碼倉頡+倉五):

Linux版本:
gcin-1.4.7-pre3以後已內建,
在此之前的gcin版本,請下載cj543.gtab,更改檔名為cj5.gtab置於~/.gcin,按ctrl+alt+2即可使用。
Windows版本(32-bit):
請下載並安裝gcin for win32,此程式內已有內建。
原始表格檔下載:cj543.cin

 

以下有幾個特製版本,是為了其他倉頡使用族群而修改:

★For 簡易/速成使用者

如果是想用類似微軟「新速成」這種可以自動選字的簡易/速成輸入法的朋友,可以試試標點簡易
如果是一般倉頡或倉五使用者偶爾想偷懶只拆2碼,則可以考慮這個版本。
這個版本有包含速成(或稱「簡易」)的拆碼在內,輸入法表格排序為:倉頡+四碼倉頡+三碼倉頡+速成/簡易+倉五。
由於重碼太多,所以這個輸入法在初次啟用使用時會花大約半分鐘的時間建立詞庫,不是當掉,請耐心等候,詞庫建立完成後,往後使用就不會再出現這種看似當掉的狀況了,不過遇到重碼字比較多的時候(例如:拆碼為「人火」之後,再繼續拆其他字時),自動選字的速度會稍慢一些。
安裝方法:
(一)gcin-1.4.7-pre3(含)以後版本:
Linux版本:
下載cj5432.gtab,改檔名為cj543.gtab,放到~/.gcin,取代現有的五四三倉頡。

Windows版本:
下載cj5432.gtab,改檔名為cj543.gtab,放到%APPDATA%\gcin,取代現有的五四三倉頡。
(二) gcin-1.4.7-pre2(含)以前版本:
Linux版本:
下載cj5432.gtab,請改檔名為cj5.gtab,放到~/.gcin,取代原有的「倉五」。
原始表格檔下載: cj5432.cin
 
★For 倉五使用者:
倉五使用者如果不習慣五四三倉頡預設使用的三代倉頡排字序,
可以試試這個版本,這個版本把倉五的表格排在最前面,
這樣一來,候選單字序就完全和倉五一樣了,
即使關閉了自動選字功能,也能從容適應。
gcin專用表格:cj543-cj5.gtab (使用前請記得更改檔名)
原始表格檔下載:cj543-cj5.cin
 

 ★For 純Big-5使用者:

如果只單純要輸出Big-5的中文字,請用下列版本:
gcin專用表格:cj543-big5.gtab (使用前請記得更改檔名)
原始表格檔下載:cj543-big5.cin

 

三、為自己重新各種倉頡表格排序:

若想編輯自訂輸入法的細節,請下載*.cin檔。

目前的五四三倉頡預設順序是:cj.txt cj4c.txt cj3c.txt simplex.txt cj5.txt

但若覺得不適用,可以自己變更各個倉頡表格的先後順序,做法如下:

下載各個倉頡表格的tar檔,解開後進入cj_tables這個資料夾,
假設您要的順序是倉五、倉頡、四碼倉頡、三碼倉頡、簡易/速成,則指令如下:
cp template.cin cj543-cj5.cin; cat cj5.txt cj.txt cj4c.txt cj3c.txt  | perl -nle '(print,$hash{$_}=1) unless defined $hash{$_}' >> cj543-cj5.cin; gcin2tab cj543-cj5.cin

這個一長串指令的結果,會生成一個cj543-cj5.cin和一個cj543-cj5.gtab,
有需要自訂表格的朋友,可參考此方式來修改製作。

edited: 18
eliu
2
Promote 0 Bookmark 02009-08-06quote  
edited: 1
eliu
3
Promote 0 Bookmark 02009-12-19quote  
eliu
4
Promote 0 Bookmark 02010-01-10quote  
obarisk
6
Promote 0 Bookmark 02010-01-11quote  

要不要連速成都加進來

感覺也不錯

現在用的蠻習慣的

 

BTW可以教我如何將萬用鍵移到z嗎?

winlin
7
Promote 0 Bookmark 02010-01-12quote  
obarisk

要不要連速成都加進來

感覺也不錯

現在用的蠻習慣的

感謝 obarisk:
加入速成的測試版如附件(使用前請記得改一下檔名)。

幾個月前我就試過了,
但是要使用速成/簡易(含自動選字)需要有一段磨合期,
也就是要加足一定的常用詞之後,用起來才會順。
但是一開始需要加詞的情形實在太多,
而當時gtab又不支援自動加詞,所以我中途試了幾次,也放棄了好幾次。
所幸現在gtab已經可以直接由ctrl+數字加詞,而且可以依字的使用頻率調整,
所以這個問題應可較順利度過,
現在比較麻煩的就是有幾個詞庫無法解決的情形,還是得要使用者自己手動選,
例如:「關門」和「開門」,這二個詞在拆碼上完全一樣,但是自動選字無法判斷應使用何者。
這是目前的限制。

此外,再提醒一下,有些狀況下,gcin的自動選字會很慢,那是因為詞庫結構的關係。

若有其他心得或建議,麻煩不吝指出,感謝~

edited: 2
winlin
8
Promote 0 Bookmark 02010-01-12quote  

gcin2tab目前不會刪除*.cin中的重複定義,
所以昨天二篇貼文的543.gtab以及5432.gtab用起來會發現候選字清單有重複定義的情形,
我用vi裡的:sort u刪除重複列之後,又各編了一份,
目前的543.gtab以及5432.gtab在使用上已經沒有編碼重複定義的問題,
不過,我不會用vi依字頻排序,所以目前*.cin裡的倉頡排序順序是以a到z來排。
但是如果使用自動選字功能的話,有沒有排序應該影響不大。

簡言之,目前最新版本狀態如下(下列二者均已刪除重複拆碼):
543.gtab:倉頡+倉五+四碼倉頡+三碼倉頡
5432.gtab:倉頡+倉五+四碼倉頡+三碼倉頡+速成/簡易

edited: 1
eliu
9
Promote 0 Bookmark 02010-01-12quote  
winlin
10
Promote 0 Bookmark 02010-01-12quote  

多謝eliu兄提醒,已整理乾淨 :)
往後請需要下載的朋友們,到本討論串的第一篇下載。
另外,也麻煩eliu兄將gcin source裡的五四三倉頡更新為目前最新版本。
感謝~辛苦了~大笑

edited: 1
eliu
11
Promote 0 Bookmark 02010-01-12quote  
caleb
12
Promote 1 Bookmark 02010-01-13quote  

winlin
不過,我不會用vi依字頻排序,所以目前*.cin裡的倉頡排序順序是以a到z來排。

輸入法的排序非常重要,亂搞是非常不好的。

建議用下面兩個 link 的方法重新按照傳統倉頡排序:

1. http://cle.linux.org.tw/trac/wiki/GcinRemoveCinDup 

2. http://hyperrate.com/thread.php?tid=4493
--
其實我個人認為 gcin tarball 與其放五四三倉頡,不如放快倉… 

winlin
13
Promote 0 Bookmark 02010-01-13quote  
caleb

輸入法的排序非常重要,亂搞是非常不好的。

建議用下面兩個 link 的方法重新按照傳統倉頡排序:

1. http://cle.linux.org.tw/trac/wiki/GcinRemoveCinDup 

2. http://hyperrate.com/thread.php?tid=4493
--
其實我個人認為 gcin tarball 與其放五四三倉頡,不如放快倉… 

感謝caleb兄提供連結。

我看了一下,
發現gcin source裡的cj.cin和cj5.cin正巧也是以a~z的順序來排,
所以vi的:sort u本身的結果正巧和原先的表格檔的排序是一樣的了。

除了快倉以外,小弟個人認為亂倉打鳥其實也很值得推薦~

winlin
16
Promote 0 Bookmark 02010-01-18quote  

感謝caleb兄和eliu兄的提議,2010.01.18.已再更新表格檔的排序:

五四三倉頡的表格順序為:「倉頡、四碼倉頡、三碼倉頡、倉五

五四三倉頡簡易速成版表格順序為:「倉頡、四碼倉頡、三碼倉頡、速成/簡易、倉五

把倉頡排最前面,是希望可以提供和「倉頡」相同的字碼順序,以確保一定的相容性。
不過,這可能要關閉自動選字才會有差,
因為開啟自動選字的狀況下,
gcin會自動計算各單字的使用頻率而重新把候選字清單排序。

另外,把倉五排最後的考量是,utf8的字用到的機率應較少,故排最後。

*.gtab與*.cin已在第一篇更新了,歡迎有興趣的朋友下載試用。
如在使用上有問題請不吝指出,感謝~

edited: 1
料功益
17
Promote 0 Bookmark 02010-01-21quote  
如何將倉五放到第一位呢? 我己經很習慣倉五了
caleb
18
Promote 0 Bookmark 02010-01-21quote  

料功益
如何將倉五放到第一位呢? 我己經很習慣倉五了

把系統的 gtab.list 複製到 ~/.gcin

然後修改 ~/.gcin/gtab.list

不用重新啟動 gcin, ctrl-space 按兩次就會直接使用新版 gtab.list 

eliu
19
Promote 0 Bookmark 02010-01-21quote  
winlin
20
Promote 0 Bookmark 02010-01-27quote  

料功益
如何將倉五放到第一位呢? 我己經很習慣倉五了

目前的五四三倉頡預設順序是:cj.txt cj4c.txt cj3c.txt simplex.txt cj5.txt

每個人可以依自己的喜好,變更各個倉頡表格的先後順序,做法如下:

下載各個倉頡表格的tar檔,解開後進入cj_tables這個資料夾,
假設您要的順序是倉五、倉頡、四碼倉頡、三碼倉頡、簡易/速成,則指令如下:
cp template.cin cj543-cj5.cin; cat cj5.txt cj.txt cj4c.txt cj3c.txt  | perl -nle '(print,$hash{$_}=1) unless defined $hash{$_}' >> cj543-cj5.cin; gcin2tab cj543-cj5.cin

這個一長串指令的結果,會生成一個cj543-cj5.cin和一個cj543-cj5.gtab,
請有需要自訂表格的朋友,可參考此方式來修改製作。

習慣倉五的朋友,如果沒時間弄,可以直接下載下面弄好的:

gcin專用表格:cj543-cj5.gtab (使用前請記得更改檔名)
原始表格檔下載:cj543-cj5.cin
edited: 5
caleb
21
Promote 0 Bookmark 02010-01-24quote  

winlin
echo "%chardef end

gcin 完全不需要 %chardef end

winlin
22
Promote 0 Bookmark 02010-01-24quote  

caleb
gcin 完全不需要 %chardef end

感謝caleb兄提醒,已刪除冗贅的指令大笑

winlin
23
Promote 0 Bookmark 02010-03-07quote  
2010.03.07.更新:
  • ~!()左列這4個符號可以用shift+某鍵來輸出。
  • 新增一個純big5的版本,不想被utf8字元煩的人可以考慮用這個

winlin
24
Promote 0 Bookmark 02012-05-19quote  

2011.09.18.更新:

為了讓五四三倉頡可以順利在詞庫中加入夾雜數字和英文字的詞,
上傳一個較新的版本,如有需要,請下載下列附件(已放在第1篇的附件):

cj543.gtab

cj543.cin(原始檔)

參考資料:

1.6.9
- ts-edit key區 用藍色顯示,這樣比較清楚。
- tsa2d32 現在會 popup dialog 顯示錯誤行數
- 「標點簡易」現在可以新增有 A-Z,0-9的詞了,其他的輸入法也需要定義 A-Z,0-9 的按鍵。

edited: 2
winlin
25
Promote 0 Bookmark 02012-05-19quote  

2012.05.19.更新:

第1篇裡的cj543-big5、cj543-cj5和cj5432的相關附件全都更新過了,更動內容如下:

  • 加入英文和數字的拆碼,讓這些輸入法能順利在詞庫中加入夾雜數字和英文字的詞
  • 預設使用垂直選擇(%flag_vertical_selection)

cht電腦資訊gcingcin分享
adm Find login register
views:91030