cht電腦資訊gcin
adm Find login register

注音輸入法版權?

ychao
joined: 2007-10-25
posted: 298
promoted: 21
bookmarked: 3
1subject: 注音輸入法版權?Promote 0 Bookmark 02009-12-21quote  

有位香港網友在詢問,關於GCIN內付的注音輸入法(.cin),授權條件為何?小弟查了一下,SCIM的注音號稱是來自Open Vanilla,另一個中標注音則是來自OpenDesktop.org.tw,來源應該是行政院主計處?至於gcin的,請問有人可以說明一下嗎? (from xcin cvs?)

edited: 3
eliu

joined: 2007-08-09
posted: 11474
promoted: 617
bookmarked: 187
新竹, 台灣
2subject: 注音輸入法版權?Promote 0 Bookmark 02009-12-22quote  

ychao
至於gcin的,請問有人可以說明一下嗎? (from xcin cvs?)

你是指 pho.tab.src, 對。我有修改了不少東西。pho-huge.tab.src 則不清楚。 gcin 的注音不是 .cin 的format,

caleb
joined: 2007-09-22
posted: 630
promoted: 134
bookmarked: 90
3subject: 注音輸入法版權?Promote 0 Bookmark 02009-12-22quote  
ychao

有位香港網友在詢問,關於GCIN內付的注音輸入法(.cin),授權條件為何?小弟查了一下,SCIM的注音號稱是來自Open Vanilla,另一個中標注音則是來自OpenDesktop.org.tw,來源應該是行政院主計處?至於gcin的,請問有人可以說明一下嗎? (from xcin cvs?)

xcin 剛出來時是需要倚天中文的表格檔,後來直接轉成 .cin 格式放在 source 裡(從此不再需要倚天中文表格檔)。

xcin big5 的 phone.cin 一直都保持和倚天中文 bug for bug compatible。 

gcin 的 pho.tab.src 大約 99% 都和 xcin big5 的 phone.cin 一樣,也就是說和倚天中文大約 99% 一樣。

 

gcin 的 pho-huge.tab.src 來自 xcin cvs 的 utf8 phone.cin,幾乎沒有變動,其 header 如下:

# convert by phoneu8.pl
# data source:
# big5/phone.cin
# Unicode 4.0.1 Unihan.txt, kMandarin field

 

xcin cvs 的 doc/Changes 內容如下:

38. Merge kMandarin field of Unicode 4.0.1 Unihan.txt into utf-8/phone.cin

 

此類「單字注音發音」其實並無明確授權,說是倚天中文的也不對。實務上可合理視之為 public domain。

但若是「詞庫」就會牽涉到語料來源問題,可能會有爭議,例如當初 Google 拼音盜用搜狗詞庫事件。

Ben Lau
joined: 2009-12-22
posted: 4
promoted:
bookmarked:
6subject: Promote 0 Bookmark 02009-12-22quote  

多謝ychao的幫忙及各位的回答~ 我叫Ben Lau,是ychao所說來自香港的網友。

概然pho.tab.src是public domain那就好辦了,另外我想請教多一個問題,關於常用字的頻率(選字的先後),己經包括了在pho.tab.src裹,還是有其他檔記錄?那個的授權又如何?

edited: 1
eliu

joined: 2007-08-09
posted: 11474
promoted: 617
bookmarked: 187
新竹, 台灣
7subject: Promote 0 Bookmark 02009-12-22quote  

Ben Lau
關於常用字的頻率(選字的先後),己經包括了在pho.tab.src裹
選字 menu 一開始的順序就是 .tab.src 裏面的順序,沒有使用次數。

gcin 使用次數的統計一開始是0,每使用一次就加1。所以是完全依使用者的次數調整順序。

edited: 2
本人已不在此站活動

joined: 2007-09-19
posted: 4946
promoted: 325
bookmarked: 206
歸隱山林
8subject: 注音輸入法版權?Promote 0 Bookmark 02009-12-22quote  

caleb
此類「單字注音發音」其實並無明確授權,說是倚天中文的也不對。實務上可合理視之為 public domain。

不是無法被授權,是根本無著作權可言。除非另有巧思的變更。基本上這都是屬於專利權的範圍。

但若是「詞庫」就會牽涉到語料來源問題,可能會有爭議,例如當初 Google 拼音盜用搜狗詞庫事件。

辭典裡頭的詞語拿出來用,這樣算不算違反著作權呢?大家小時候考試造句就常常違反著作權?吐舌頭

像某個字怎麼寫,著作權又要屬誰呢?這些歷史文化上的東西有很多無法用著作權規範。頂多主張「排版權」。


Ben Lau
joined: 2009-12-22
posted: 4
promoted:
bookmarked:
9subject: Promote 0 Bookmark 02009-12-24quote  
eliu

選字 menu 一開始的順序就是 .tab.src 裏面的順序,沒有使用次數。

gcin 使用次數的統計一開始是0,每使用一次就加1。所以是完全依使用者的次數調整順序。

明白了,謝謝! 

Ben Lau
joined: 2009-12-22
posted: 4
promoted:
bookmarked:
10subject: Promote 0 Bookmark 02009-12-29quote  

另外,我想請問關於 pho.tab.src的格式,第一欄是注音碼,第二欄是字,那麼第三欄是什麼意思?

例如:

ㄨㄛ3 我 0

大部份的字都是0,但有些是負數, 這是使用頻率嗎?

eliu

joined: 2007-08-09
posted: 11474
promoted: 617
bookmarked: 187
新竹, 台灣
11subject: Promote 0 Bookmark 02009-12-29quote  
是使用頻率,負數是為了避免 juyin-learn 標示注音時選到這個字。
Ben Lau
joined: 2009-12-22
posted: 4
promoted:
bookmarked:
12subject: Promote 0 Bookmark 02009-12-29quote  
謝~ 另外還想問像是   "ㄧㄚ2", 裏面的"2"實際上對應鍵盤上的 "6",這個對應該是怎樣決定的?

cht電腦資訊gcin
adm Find login register
views:23994