以預測的韻律詞邊界建構韻律模型使用於大字彙中文連續語音辨識

韻律是日常口語對話中產生之現象，因此在語音辨識系統中加入了韻律的資訊，能使辨識的結果更趨近於人說話時所產生的語句。本論文運用大量韻律資訊訓練韻律模型，並與傳統考慮聲學模型以及語言模型之語音辨識系統結合，得到更佳的辨識率。本論文以音節為單位抽取基頻、能量、長度以及類別參數，訓練聲調與韻律詞邊界之韻律模型；而在韻律模型的訓練上，又以辭典詞與韻律詞分別訓練並比較其產生之韻律模型對辨識系統的幫助。為了得到較豐富的韻律詞邊界資訊，採用條件隨機域的方法，預測了韻律詞的邊界，其準確率、回收率、F1評比以及邊界正確率都在百分之八十以上。此外，亦比較韻律模型對於特定語者與非特定語者之影響。在實驗的架構上，採取兩階段，在第一階段中作傳統的辨識產生詞圖；第二階段根據詞圖中的每個詞弧上音節的時間區間抽取相對應的韻律特徵參數，建立韻律模型後在詞弧上重新計分。實驗結果顯示，以韻律詞訓練之韻律模型有較好的表現，在字元的辨識率上優於傳統模型與辭典詞韻律模型。

關鍵字

韻律詞；韻律模型；韻律詞邊界；聲調

並列摘要

無資料

並列關鍵字

prosodic word ； prosodic model ； prosodic boundary ； tone

參考文獻

【2】黃瑞婷, “使用韻律模型的進一步大字彙國語連續語音辨識（Improved

Language Processing, edited by Chin-Hui Lee, Haizhou Li, Lin-shan Lee,

【3】 Xuedong Huang, Alex Acero, Hsiao-Wuen Hon, “Spoken Language

International Editions. 2005

Recognition on Radio News”, Department of Electrical and Computer

被引用紀錄

蘇嘉雄（2014）。電腦輔助華語學習之聲調偏誤類型偵測〔碩士論文，國立臺灣大學〕。華藝線上圖書館。https://doi.org/10.6342/NTU.2014.02460

鄭力維（2008）。國語之韻律及聲調模型與其在語音辨識及韻律預測之應用〔碩士論文，國立臺灣大學〕。華藝線上圖書館。https://doi.org/10.6342/NTU.2008.01041

國際替代計量

以預測的韻律詞邊界建構韻律模型使用於大字彙中文連續語音辨識

全文下載

主題瀏覽