cht電腦資訊gcingcin wish
adm Find login register

[wish] 進化版的發音引擎

coolcd
1 [wish] 進化版的發音引擎
Promote 0 Bookmark 02010-10-25quote  

剛看到一個教香港人說北京話的網站在教變調,原來國語中的三聲還有分半三聲跟完全三聲,以前都沒注意到

兩個三聲在一起,前面的唸二聲,這個應該國小學生就知道了,處理起來感覺應該不難

不過看到還有三個三聲字的情形,這就有點複雜了

希望以後可以有更智慧型的中文發音

我知道這個可能太難,有點不切實際,所以用 wish

有志之士可以挑戰一下  Tongue out

hansioux
2
Promote 0 Bookmark 02010-10-26quote  

破音和變調是需要 context awareness 的,除非是用很大的 database 去裝,不然就要電腦可以直接理解你要說的是什麼。

eliu
3
Promote 0 Bookmark 02010-10-26quote  

我覺得在文字檔 text-to-speech 來轉聲調比較適合。

在使用詞音時,因為使用者有輸入注音的聲調,此時轉聲可能會讓盲打的使用者認為輸入錯誤。

gtab 輸入法其實可以搭配詞音的注音資料來選擇注音。

edited: 2
coolcd
4
Promote 0 Bookmark 02010-10-26quote  

eliu

我覺得在文字檔 text-to-speech 來轉聲調比較適合。

仔細想想後,有同感,理由有三:

第一點,同老大講的,輸入時唸出發音是確認輸入,若發出變調後的音可能會造成困擾

第二點,我們是一字一字輸入的,兩個、三個三聲字的變調,可能輸入第二字、第三字時,才知道第一字、第二字要變調,所以不可能輸入時就即時發出變調後的音,頂多做到從編輯區進入應用程式時發出變調後的音,即使可以做到如此,從編輯區進入應用程式時,切法不同,讀音可能也不同,譬如:「好領導者有以下特質」這句話,有興趣的不妨試著切切看變調方式有何不同。

第三點,如同前 面 hansioux 提過的,要變調效果好,可能需要大資料庫、 需要瞭解語言的 context,這應該是另一個 project 的事了,要在 gcin 裡頭實作,太複雜,也難以完善。

所以現在自己覺得我這個 gcin wish 是不太適合在 gcin 實作的,大家看了笑笑就好吧。 Embarassed

ychao
5
Promote 0 Bookmark 02010-10-27quote  

劉老大,能否考慮直接開發一個全文發音的引擎呢?

雖然說已經有一個zhspeak的TTS引擎了,但是港腔跟中式發音實在令人不敢領教。至於espeak雖然有中文辭典了,發音的品質因為是純合成的,作者也說無法改善了。個人覺得能夠真正聽得順耳的,就只有GCIN了啊。

hansioux
6
Promote 0 Bookmark 02010-10-29quote  

ychao

劉老大,能否考慮直接開發一個全文發音的引擎呢?

雖然說已經有一個zhspeak的TTS引擎了,但是港腔跟中式發音實在令人不敢領教。至於espeak雖然有中文辭典了,發音的品質因為是純合成的,作者也說無法改善了。個人覺得能夠真正聽得順耳的,就只有GCIN了啊。

 

gcin 是每個音錄一個檔,和合成的差很多啊。現在這個引擎不就可以正常發音了,若聽不慣還可以自己錄,要新引擎的需求是什麼呢?

 

gcin 是一面打字一面讓使用著能聽到剛剛輸入的字音。比如打「 〤ㄟˇ」電腦怎麼知道你後面是要打「娓娓道來」,所以現在這個字要發成「〤ㄟˊ」?電腦連你後面要打什麼都不知道,又怎麼能依字義判斷讀音?

 

如果你的需求是電腦讀一段已經打好的文字,那去用專門的 TTS 程式應該比較合適吧?

cht電腦資訊gcingcin wish
adm Find login register
views:17918