基於隱藏式馬可夫模型實作中文語音合成的技術,只需要使用少量的語料,就能合出品質還不錯的語音,最大的優勢即在於參數化之語音表示法本身的彈性,在一些延伸的合成應用上,例如加入情緒特徵、聲音轉換(voice conversion)、說話風格等,較為容易。在建構不同語言的語音合成系統時,也只需要做少量的修改。 由於上述的優勢,基於隱藏式馬可夫模型的中文語音合成已經越來越廣泛的應用在各種實際系統之中。然而如何使得合成語音具有像自然語音那樣生動的韻律和節奏,一直是語音合成領域中的一大挑戰。本論文透過在標記(label)中加上音素與句、詞、字三層結構之相關位置的韻律資訊,增加合成語音的韻律、節奏之自然度。 本論文更進一步實驗隱藏式馬可夫模型的狀態個數、語音標記的方式、聲調之韻律資訊對合成語音的影響,經過增加前後音節的聲調資訊,能夠有效提升合成語音聲調的自然度,並解決中文語音發音之中,對於連續兩個聲調為三聲的音節,前音節必須發為二聲的問題。 本論文之語音合成系統所用的文句分析器較為陽春,由於詞庫使用windows XP內建之小型詞庫,演算法也較為簡單,因此斷詞的準確度不夠,使得無論是在訓練或是合成上,對於詞的韻律掌控仍有改進的空間,若能取得較龐大的詞庫,以及套用較好的演算法,合成語音的韻律性應該能獲得進一步的提升。