[wish] 進化版的發音引擎

coolcd
1 [wish] 進化版的發音引擎
0 0	2010-10-25	quote

剛看到一個教香港人說北京話的網站在教變調，原來國語中的三聲還有分半三聲跟完全三聲，以前都沒注意到

兩個三聲在一起，前面的唸二聲，這個應該國小學生就知道了，處理起來感覺應該不難

不過看到還有三個三聲字的情形，這就有點複雜了

希望以後可以有更智慧型的中文發音

我知道這個可能太難，有點不切實際，所以用 wish

有志之士可以挑戰一下

hansioux
2
0 0	2010-10-26	quote

破音和變調是需要 context awareness 的，除非是用很大的 database 去裝，不然就要電腦可以直接理解你要說的是什麼。

eliu
3
0 0	2010-10-26	quote

我覺得在文字檔 text-to-speech 來轉聲調比較適合。

在使用詞音時，因為使用者有輸入注音的聲調，此時轉聲可能會讓盲打的使用者認為輸入錯誤。

gtab 輸入法其實可以搭配詞音的注音資料來選擇注音。

覺得Android中文輸入法(注音、倉頡)不易輸入？→ gcin Android

手機照相看照片不方便？→ AndCamera

覺得鬧鐘/行事曆有改進的空間？→ AndAlarm

edited: 2

coolcd
4
0 0	2010-10-26	quote

eliu

我覺得在文字檔 text-to-speech 來轉聲調比較適合。

仔細想想後，有同感，理由有三：

第一點，同老大講的，輸入時唸出發音是確認輸入，若發出變調後的音可能會造成困擾

第二點，我們是一字一字輸入的，兩個、三個三聲字的變調，可能輸入第二字、第三字時，才知道第一字、第二字要變調，所以不可能輸入時就即時發出變調後的音，頂多做到從編輯區進入應用程式時發出變調後的音，即使可以做到如此，從編輯區進入應用程式時，切法不同，讀音可能也不同，譬如：「好領導者有以下特質」這句話，有興趣的不妨試著切切看變調方式有何不同。

第三點，如同前面 hansioux 提過的，要變調效果好，可能需要大資料庫、需要瞭解語言的 context，這應該是另一個 project 的事了，要在 gcin 裡頭實作，太複雜，也難以完善。

所以現在自己覺得我這個 gcin wish 是不太適合在 gcin 實作的，大家看了笑笑就好吧。

ychao
5
0 0	2010-10-27	quote

劉老大，能否考慮直接開發一個全文發音的引擎呢？

雖然說已經有一個zhspeak的TTS引擎了，但是港腔跟中式發音實在令人不敢領教。至於espeak雖然有中文辭典了，發音的品質因為是純合成的，作者也說無法改善了。個人覺得能夠真正聽得順耳的，就只有GCIN了啊。

hansioux
6
0 0	2010-10-29	quote

ychao

劉老大，能否考慮直接開發一個全文發音的引擎呢？

gcin 是每個音錄一個檔，和合成的差很多啊。現在這個引擎不就可以正常發音了，若聽不慣還可以自己錄，要新引擎的需求是什麼呢？

gcin 是一面打字一面讓使用著能聽到剛剛輸入的字音。比如打「〤ㄟˇ」電腦怎麼知道你後面是要打「娓娓道來」，所以現在這個字要發成「〤ㄟˊ」？電腦連你後面要打什麼都不知道，又怎麼能依字義判斷讀音？

如果你的需求是電腦讀一段已經打好的文字，那去用專門的 TTS 程式應該比較合適吧？