透過您的圖書館登入
IP:18.216.121.55
  • 學位論文

串接群聚階層式多層感知器聲學模型之中文大字彙語 音辨識

Large Vocabulary Mandarin Speech Recognition Based on Tandem System with Clustered Hierarchical Multi-layer Perceptron

指導教授 : 李琳山

摘要


在傳統的聲學模型中,連續機率密度隱藏馬可夫模型最為被廣泛使用。但是 連續機率密度隱藏馬可夫模型有一些無法克服的缺點,近年不少研究藉由不同的 訓練方法或是結合不同機器學習的技術以改進連續機率密度隱藏馬可夫模型,這 些方法在新一代的語音辨識技術上已漸受肯定並普受重視,而且有不少被實踐在 各項國際競賽中。本論文即是嘗試使用多層感知器來幫助聲學模型辨識的研究。 在本論文中,我們提出藉由音素分群建立的階層式多層感知器。一般串接模 型中以單一多層感知器學習概括性的音素分類,很難區分混淆的音素;本論文藉 由拆解概括性音素分類問題為一組針對性的階層式分類,將複雜的音素分類問題 分而治之,並且討論在不同的分群結構下階層式多層感知器的表現,之後再以由 下而上的訓練方法,進一步改進階層式多層感知器。 最後在以上述的方法為第一階段辨識,由隱藏馬可夫與多層感知器混合模型 以及隱藏馬可夫(KL)模型重新計分。這些方法在中文大字彙新聞辨識中都證實可 以使辨識正確率有明確進步。

並列摘要


無資料

並列關鍵字

LVCSR Acoustic Model Multi-layer Perceptron

參考文獻


【1】 Defense Advanced Research Projects Agency http://www.darpa.mil/
【2】 National Institute of Standards and Technology
predictive analysis of speech,” Apr 1985, vol. 10, pp. 509–512.
Hall, 1993,
【6】 Hynek Hermansky Daniel, Daniel P. W. Ellis, and Sangita Sharma,

被引用紀錄


李尚文(2011)。用串接式系統整合加伯與基頻特徵之國語語音辨識〔碩士論文,國立臺灣大學〕。華藝線上圖書館。https://doi.org/10.6342/NTU.2011.03187
陳順隆(2010)。使用凱氏分歧度及階層式多層感知器的串接式聲學辨認〔碩士論文,國立臺灣大學〕。華藝線上圖書館。https://doi.org/10.6342/NTU.2010.00645

延伸閱讀