串接群聚階層式多層感知器聲學模型之中文大字彙語
音辨識

在傳統的聲學模型中，連續機率密度隱藏馬可夫模型最為被廣泛使用。但是連續機率密度隱藏馬可夫模型有一些無法克服的缺點，近年不少研究藉由不同的訓練方法或是結合不同機器學習的技術以改進連續機率密度隱藏馬可夫模型，這些方法在新一代的語音辨識技術上已漸受肯定並普受重視，而且有不少被實踐在各項國際競賽中。本論文即是嘗試使用多層感知器來幫助聲學模型辨識的研究。在本論文中，我們提出藉由音素分群建立的階層式多層感知器。一般串接模型中以單一多層感知器學習概括性的音素分類，很難區分混淆的音素；本論文藉由拆解概括性音素分類問題為一組針對性的階層式分類，將複雜的音素分類問題分而治之，並且討論在不同的分群結構下階層式多層感知器的表現，之後再以由下而上的訓練方法，進一步改進階層式多層感知器。最後在以上述的方法為第一階段辨識，由隱藏馬可夫與多層感知器混合模型以及隱藏馬可夫(KL)模型重新計分。這些方法在中文大字彙新聞辨識中都證實可以使辨識正確率有明確進步。

關鍵字

大字彙語音辨識；聲學模型；多層感知器

並列摘要

無資料

並列關鍵字

LVCSR ； Acoustic Model ； Multi-layer Perceptron

參考文獻

【1】 Defense Advanced Research Projects Agency http://www.darpa.mil/

【2】 National Institute of Standards and Technology

predictive analysis of speech,” Apr 1985, vol. 10, pp. 509–512.

Hall, 1993,

【6】 Hynek Hermansky Daniel, Daniel P. W. Ellis, and Sangita Sharma,

被引用紀錄

李尚文（2011）。用串接式系統整合加伯與基頻特徵之國語語音辨識〔碩士論文，國立臺灣大學〕。華藝線上圖書館。https://doi.org/10.6342/NTU.2011.03187

陳順隆（2010）。使用凱氏分歧度及階層式多層感知器的串接式聲學辨認〔碩士論文，國立臺灣大學〕。華藝線上圖書館。https://doi.org/10.6342/NTU.2010.00645

國際替代計量

串接群聚階層式多層感知器聲學模型之中文大字彙語音辨識

全文下載

主題瀏覽