國語之韻律及聲調模型與其在語音辨識
及韻律預測之應用

語音中的韻律訊號是口語溝通中，不可或缺的一環。在數位語音工程的應用中，語音韻律訊號的模型及解讀應有助於提升系統對人類語言的處理能力。本論文藉由多種訊號特徵及語言特徵，並採用三種機器學習之方法做為基本架構，建立了國語的韻律訊號模型，來解讀國語語音中所呈現的韻律事件，進而應用在數位語音工程的諸多應用上。在國語大字彙連續語音辨識之應用中，我們利用四個韻律訊號維度之資訊來建構模型，對各個聲調韻律事件的可能性做評估，用以執行兩段式的語音辨識，並得到顯著的字元辨識進步率。在韻律預測之應用上，我們也根據猜測的所有可能會影響韻律訊號之事件，推估這些韻律事件對各個韻律維度上呈現現象之綜合影響，並以之建立了與統計數據相合的韻律模型。

關鍵字

聲調；大字彙辨識；韻律模型；韻律預測；中文韻律

並列摘要

無資料

並列關鍵字

tone ； large vocabulary speech recognition ； prosody model ； prosody prediction ； Mandarin Prosody

參考文獻

[1] Chiu-yu Tseng, “Prosody Analysis," in Advances in Chinese Spoken Language Processing, edited by Chin-Hui Lee, Haizhou Li, Lin-Shan Lee, Ren-Hua Wang, Qiang Huo, World Scientific Publishing, Singapore, pp.57-76, Singapore, 2006

[3] 黃瑞婷, “使用韻律模型的進一歨大字彙國語連續語音辨識(Improved Large Vocabulary Continuous Mandarin Speech Recognition By Prosodic Modeling),” 碩士論文, 國立台灣大學電信工程學研究所, 2006

[4] 盧彥廷, “以預測的韻律詞邊界建構韻律模型使用於大字彙中文語音辨識(Large Vocabulary Continuous Mandarin Speech Recognition with Prosodic Modeling Using Predicted Prosodic Word Boundaries),” 碩士論文, 國立台灣大學電信工程學研究所, 2007

[5] Hongxiu Wei, Xinhao Wang, Hao Wu, Dingsheng Luo, Xihong Wu, “Exploiting prosodic and lexical Features for Tone Modeling in a Conditional Random Field Framework”, In Proc. ICASSP 2008

[6] 林婉怡, “流利國語語音之聲調辨識及其在大字彙辨識上的應用(Tone Recognition for Fluent Speech and Its application on Large Vocabulary Recognition),” 碩士論文, 國立台灣大學電信工程學研究所, 2004

被引用紀錄

蘇嘉雄（2014）。電腦輔助華語學習之聲調偏誤類型偵測〔碩士論文，國立臺灣大學〕。華藝線上圖書館。https://doi.org/10.6342/NTU.2014.02460

周建宇（2009）。基於機器學習之中文語句分段〔碩士論文，國立臺灣大學〕。華藝線上圖書館。https://doi.org/10.6342/NTU.2009.00568

國際替代計量

國語之韻律及聲調模型與其在語音辨識及韻律預測之應用

全文下載

主題瀏覽