利用共振峰特徵參數與距離正規化之進一步語者確認技術

本論文以改進傳統的以高斯混合模型為基礎的語者辨識系統為目標，提出了一組新的特徵參數以及一種新的分數正規化方法。本論文所提出的新的特徵參數稱為共振峰特徵參數(Formant-specific Feature)，此特徵參數由人聲頻譜中的共振峰所求得，將每個共振峰形狀用一個三角形趨近，並以三個參數描述。實驗結果顯示使用此共振峰特徵參數與梅爾頻率倒頻譜係數(Mel Frequency Cepstral Coefficient, MFCC)在分數階段整合時，可以獲得相當顯著的進步。其次為本論文所提出的分數正規化方法，稱為距離正規化(Distance Normalization)。距離正規化法首先將高斯混合模型(Gaussian Mixture Model, GMM)的機率分數轉到固定值域範圍，再將分數除以模型距離，以減低共通門檻值(Global Threshold)的影響，並和測試正規劃(Test Normalization)結合，可以得到更佳的效果。實驗結果顯示距離正規化在低錯誤接受率(False Acceptance)時表現良好，在與測試正規化結合後效果更加理想。最後本論文所提出的共振峰特徵參數與分數正規化二者加以整合，與傳統的梅爾頻率倒頻譜係數以及測試正規化的系統相比，發現兩種新方法的效果幾乎完全可以加成，得到了本論文中最佳的實驗結果。

關鍵字

共振峰；正規化；高斯混合模型

並列摘要

無資料

並列關鍵字

formant ； normalization ； Gaussian Mixture Model

參考文獻

[1] D. A. Reynolds, “Robust Text-Independent Speaker Identification Using Gaussian Mixture Speaker Models,” IEEE Trans. On Speech and Audio Processing, Vol.3, No.1 , Jan. 1995, pp.72-83

[2] D. A. Reynolds, et al., “Speaker Verification Using Adapted Gaussian Mixture Models,” Digital Signal Processing 10,2000, pp.19-41

[3] S. Furui, “Cepstral analysis technique for automatic speaker verification,” IEEE Trans. On Acoustic Speech and Signal Processing, vol. ASSP-29, no.2, pp. 254-272,1981.

[5] L. Ferrer, et al., “SRI’s 2004 NIST Speaker Recognition Evaluation System,” in Proc. ICASSP 2005, Philadelphia, pp.173-176,March 2005

[6] V. Wan, et al., “SVMSVM: Support Vector Machine Speaker Verification Methodology,” in Proc. ICASSP 2003, Hong-Kong, 2003.

國際替代計量

利用共振峰特徵參數與距離正規化之進一步語者確認技術

全文下載

主題瀏覽