cht電腦資訊gcin
adm Find login register

[bug] 關於 gcin 詞庫的問題

coolcd
1 [bug] 關於 gcin 詞庫的問題
Promote 0 Bookmark 12009-02-20quote  

阿Q ㄚ 0
A片 ㄆㄧㄢ4 0
A型 ㄒㄧㄥ2 0
維他命A ㄨㄟ2 ㄊㄚ ㄇㄧㄥ4 0
維生素A ㄨㄟ2 ㄕㄥ ㄙㄨ4 0

用ㄚ代表A,好像不太直覺;還有,Q 和 ㄟ 差太多了,可能是筆誤,有看到詞庫內其他有 Q 的詞是用 ㄆ 代表 Q,建議遇到詞中有英文字時,一律用原來英文字所在的注音來代表。 

A片 ㄆㄧㄢ4 0
A型 ㄒㄧㄥ2 0
維他命A ㄨㄟ2 ㄊㄚ ㄇㄧㄥ4 0
維生素A ㄨㄟ2 ㄕㄥ ㄙㄨ4 ㄚ 0

「阿Q ㄚ ㄆ 0」原本就有了,不需要加。

以下注音、或國字有錯誤,建議刪掉:

鼻咽癌 ㄅㄧ2 ㄧㄝ4 ㄧㄢ2 0
不行 ㄅㄨ2 ㄒㄧㄥ2 0
嘸蝦米 ㄈㄨ3 ㄒㄧㄚ ㄇㄧ3 0
餓肚子 ㄜ4 ㄉㄨ4 ㄗ3 0
鼻 ㄜ2 ㄌㄨㄢ2 ㄅㄧ2 0
愛面子 ㄞ4 ㄇㄧㄢ4 ㄗ3 0
愛到深處無怨尤 ㄞ4 ㄉㄠ4 ㄕㄣ ㄔㄨ3 ㄨ2 ㄩㄢ4 ㄧㄡ2 0
沮喪 ㄐㄩ ㄙㄤ4 0

加入

嘸蝦米 ㄨ3 ㄒㄧㄚ ㄇㄧ3 0
餓肚子 ㄜ4 ㄉㄨ4 ㄗ1 0
愛面子 ㄞ4 ㄇㄧㄢ4 ㄗ1 0
愛到深處無怨尤 ㄞ4 ㄉㄠ4 ㄕㄣ ㄔㄨ4 ㄨ2 ㄩㄢ4 ㄧㄡ2 0

以下也是錯誤讀音,但是,是比較常看到的錯誤讀音,這是為了方便輸入?我認同 gcin 以真實讀音為主,但像這種情形,如果小朋友因輸入法打得出來就以為自己的讀音是對的,好像不太好,所以,建議這類字另外放,讓有需要的讀者,自行匯入詞庫

凹凸不平 ㄠ ㄊㄨ ㄅㄨ4 ㄆㄧㄥ2 0
睪丸癌 ㄍㄠ3 ㄨㄢ2 ㄞ2 0

另外,「癌」正式的讀音是「ㄧㄢ2」,雖平時我也唸「ㄞ2」,唸「ㄞ2」也確實沒錯 (所以原本詞庫中的詞不需要刪),但我知道考試寫「ㄧㄢ2」比較保險,「凸」應唸「ㄊㄨ2」(雖然我也常唸成一聲),建議加入以下條目:

凹凸不平 ㄠ ㄊㄨ2 ㄅㄨ4 ㄆㄧㄥ2 0
癌細胞 ㄧㄢ2 ㄒㄧ4 ㄅㄠ 0
癌症 ㄧㄢ2 ㄓㄥ4 0
胰臟癌 ㄧ2 ㄗㄤ4 ㄧㄢ2 0
胃癌 ㄨㄟ4 ㄧㄢ2 0
鼻癌 ㄅㄧ2 ㄞ2 0
壁癌 ㄅㄧ4 ㄧㄢ2 0
膀胱癌 ㄆㄤ2 ㄍㄨㄤ ㄧㄢ2 0
皮膚癌 ㄆㄧ2 ㄈㄨ ㄧㄢ2 0
肺癌 ㄈㄟ4 ㄧㄢ2 0
大腸癌 ㄉㄚ4 ㄔㄤ2 ㄧㄢ2 0
大腸直腸癌 ㄉㄚ4 ㄔㄤ2 ㄓ2 ㄔㄤ2 ㄧㄢ2 0
卵巢癌 ㄌㄨㄢ3 ㄔㄠ2 ㄧㄢ2 0
睪丸癌 ㄍㄠ ㄨㄢ2 ㄧㄢ2 0
肝癌 ㄍㄢ ㄧㄢ2 0
口腔癌 ㄎㄡ3 ㄑㄧㄤ ㄧㄢ2 0
抗癌 ㄎㄤ4 ㄧㄢ2 0
喉癌 ㄏㄡ2 ㄧㄢ2 0
結腸癌 ㄐㄧㄝ2 ㄔㄤ2 ㄧㄢ2 0
前列腺癌 ㄑㄧㄢ2 ㄌㄧㄝ4 ㄒㄧㄢ4 ㄧㄢ2 0
血癌 ㄒㄧㄝ3 ㄧㄢ2 0
直腸癌 ㄓ2 ㄔㄤ2 ㄧㄢ2 0
致癌 ㄓ4 ㄧㄢ2 0
致癌物 ㄓ4 ㄧㄢ2 ㄨ4 0
食道癌 ㄕ2 ㄉㄠ4 ㄧㄢ2 0
攝護腺癌 ㄕㄜ4 ㄏㄨ4 ㄒㄧㄢ4 ㄧㄢ2 0
乳癌 ㄖㄨ3 ㄞ2 0
子宮頸癌 ㄗ3 ㄍㄨㄥ ㄐㄧㄥ3 ㄧㄢ2 0

以下 gcin 中翻譯地名的注音與教育部國語字典提供的不同,我覺得不需要墨守教育部的標準,但建議至少讓按照官方讀音的人可以打得出來

愛荷華州 ㄞ4 ㄏㄜ4 ㄏㄨㄚ2 ㄓㄡ 0
愛達荷州 ㄞ4 ㄉㄚ2 ㄏㄜ4 ㄓㄡ 0
俄勒岡州 ㄜ4 ㄌㄜ4 ㄍㄤ ㄓㄡ 0

在教育部字典中,這些注音是


愛達荷州 ㄞ4 ㄉㄚ2 ㄏㄜ2 ㄓㄡ 0
愛荷華州 ㄞ4 ㄏㄜ2 ㄏㄨㄚ2 ㄓㄡ 0
俄勒岡州 ㄜ2 ㄌㄜ4 ㄍㄤ ㄓㄡ 0

建議加上以上三個條目,原本的要不要刪,我沒意見。

 

下面兩個新詞,建議加入

考證 ㄎㄠ3 ㄓㄥ4 0
望其項背 ㄨㄤ4 ㄑㄧ2 ㄒㄧㄤ4 ㄅㄟ4 0

我才看了兩百個詞啊,就找到這些問題,要整理詞庫真是大工程。

建議每次修改完詞庫後,對詞庫下 "sort -k1 tsin.src" 整理一下,以後會比較好整理。

edited: 2
eliu
2 [bug] 關於 gcin 詞庫的問題
Promote 0 Bookmark 02009-02-20quote  
coolcd
用ㄚ代表A,好像不太直覺;還有,Q 和 ㄟ 差太多了,可能是筆誤,有看到詞庫內其他有 Q 的詞是用 ㄆ 代表 Q,建議遇到詞中有英文字時,一律用原來英文字所在的注音來代表。 

這是因為我是用倚天鍵盤的關係,所以如果有英文字母,會看起來很奇怪。 目前 gcin 可以用標準 or 倚天的注音來輸入英文字母,存詞到辭庫時則是用當時用的注音。目前用英文字母的詞好像不是很多,所以也還好。

eliu
3 [bug] 關於 gcin 詞庫的問題
Promote 0 Bookmark 02009-02-20quote  

coolcd
我認同 gcin 以真實讀音為主,但像這種情形,如果小朋友因輸入法打得出來就以為自己的讀音是對的,好像不太好,所以,建議這類字另外放,讓有需要的讀者,自行匯入詞庫

我覺得可以兩個都放入詞庫。以輸入方便為主。

edited: 1
coolcd
4 [bug] 關於 gcin 詞庫的問題
Promote 0 Bookmark 02009-02-20quote  

coolcd wrote:

我認同 gcin 以真實讀音為主,但像這種情形,如果小朋友因輸入法打得出來就以為自己的讀音是對的,所以,建議這類字另外放,讓有需要的讀者,自行匯入詞庫

eliu wrote:

我覺得可以兩個都放入詞庫。以輸入方便為主。

 

hmm, 我上面那句話好像有點茅盾,不知道寫文的時候在想什麼 XD,應該說,我還是不太贊成把明顯有問題的注音留在詞庫吧。

等我有空,來 fork 一個版本好了,沒玩過詞庫,順便玩一玩 :D

eliu
5
Promote 0 Bookmark 02009-02-20quote  

印象中 睪 念 ㄍㄠ3 比較多,凸 一聲比較多。

語言不是什麼物理定律,眾人喜歡就好,沒有說誰定的標準才是對的。

不然弄個小學校正過的版本。不過不要叫我弄。微笑

coolcd
6
Promote 0 Bookmark 02009-02-20quote  
eliu

語言不是什麼物理定律,眾人喜歡就好,沒有說誰定的標準才是對的。

嗯, 這我相當同意,我在意的,其實不是詞庫中的發音對不對的問題,也不認為只有字典有的才是對的,我所在意的,是:如果詞庫與字典的記載不合 → 使我們的認知與字典不同 → 讓我們在各種「以字典知識為尊」的場合吃虧。所以,為了讓自己不吃虧,我覺得把「學院派的知識」與「草根派的經驗法則」分清楚,比較保險。至少,在東方這種不尊重多元價值的環境,比較不會吃虧。

打個比方,以後 eliu 你兒子用 gcin 詞音輸入「 那片土地凹凸不平」,因為可以輸入,所以他以為凸唸成「ㄊㄨ」,結果考試時,國文因此被扣分。搞不好差那一、兩分,就可以上更好的學校了呢!

不然弄個小學校正過的版本。不過不要叫我弄。微笑

這個我會自己想辦法,不過,可能會搞很久就是了 大笑

edited: 1
eliu
7
Promote 0 Bookmark 02009-02-20quote  

coolcd
打個比方,以後 eliu 你兒子用 gcin 詞音輸入「 那片土地凹凸不平」,因為可以輸入,所以他以為凸唸成「ㄊㄨ」,結果考試時,國文因此被扣分。搞不好差那一、兩分,就可以上更好的學校了呢!

不過國中有考發音嗎? 

本人已不在此站活動
9
Promote 0 Bookmark 02009-02-20quote  

coolcd
eliu
不然弄個小學校正過的版本。不過不要叫我弄。微笑
這個我會自己想辦法,不過,可能會搞很久就是了 大笑

看有沒有在學校的老師,他們可能比較熟悉?

我覺得慢慢來比較快,反正有誰發現那裡不對或要增就 bug report 就對了。我看了一下,頗多人有 post 建議,我相信這些朋友應該是有需要才會建議的吧!這樣請他們有空的時候,review 一下,順手就 bug report,這樣應該就會漸漸完整正確了。

edited: 2
coolcd
10
Promote 0 Bookmark 02009-02-20quote  
eliu

不過國中有考發音嗎? 

記得在我高中的年代,都還有考注音啊。

winlin
11
Promote 0 Bookmark 02009-06-05quote  

老大,
我發現詞庫裡有這個詞↓

邋褟 ㄌㄚ ㄊㄚ 1

請問真的有這個詞嗎?如果沒有的話,是否考慮刪除呢?
感謝~

cht電腦資訊gcin
adm Find login register
views:27198