透過您的圖書館登入
IP:3.137.187.233
  • 學位論文

跨詞相依三連音素模型大字彙連續語音辨識系統之實作及分析

Inter-word Tri-phone Model Search and Analysis in Large Vocabulary Continuous Speech Recognition

指導教授 : 李琳山

摘要


大字彙連續語音辨識系統,是圖樣辨識及搜尋演算法的結合,為語音領域中的核心技術。雖以隱藏式馬可夫模型為基礎的辨識系統已經發展多年,但當模型設計改變時,舊有的搜尋演算法仍需變動,才可與模型配合。本論文的目標,即是在音素模型上,建立並分析可支援跨詞相依三連音素模型的辨識工具程式。 大字彙連續語音辨識系統的結構十分複雜,環環相扣,一不小心就會出錯。因此,本論文會詳細介紹實作可能碰到的問題,從聲學模型、語言模型、詞典等基礎模型開始,接著導入人工智慧中搜尋演算法的概念,介紹非跨詞相依音素模型如何以詞彙樹展開搜尋空間;利用維特比光束搜尋加快搜尋速度。之後以非跨詞相依的辨識系統為基礎,改進詞彙樹來展開原本在式子上難以推導的跨詞相依性問題,達成跨詞相依三連音素模型大字彙連續語音系統之實作。 實驗中,以傳統右相關聲韻母模型來測試非跨詞相依音素模型;以SAMPA-T的三連音素模型來測試跨詞相依音素模型。以實驗數據討論系統在兩個不同的音素集之中,時間、空間的需求,及討論不同參數之下,對系統效能的影響。 在最後的實驗結果及分析中,以右相關聲韻母為模型的辨識系統,無論在時間與空間上都需求較少;而跨詞相依的三連音素模型,用了更多的參數來描述音素模型,雖時間與空間都需求較多,但正確率比右相關聲韻母模型高,展現出其較精緻的模型能力。

並列摘要


無資料

參考文獻


【2】 大字彙中文連續語音辨識之聲學模型及特徵正規化 朱忠玲
【24】 MATBN: A Mandarin Chinese Broadcast News Corpus H.-M. Wang, B. Chen, J.-W. Kuo, and S.-S Cheng Interational Journal of Computational Linguistics and Chinese Language Processing, 2005
【16】 PAT-Tree-Based Keyword Extraction for Chinese Information Retrieval Lee-Feng Chien
【18】 A Speech Recognition Method with A Language-Independent Intermediate Phonetic Codes. Kazuyo TANAKA. And Hiroaki KOJIMA. ICSLP vol. IV pp-191-194, 2000
【1】 DSP history - Understanding Speech: An Interview with John Makhoul. IEEE Signal Processing Magazine p.76-79, May 2005

延伸閱讀