透過您的圖書館登入
IP:3.141.244.201
  • 學位論文

在時頻空間以二階段法作盲音源分離

Two-stage Method for Blind Source Separation in Time-Frequency Domain

指導教授 : 王小川
若您是本文的作者,可授權文章由華藝線上圖書館中協助推廣。

摘要


本論文主要探討摺積混合下盲音源分離的演算法,希望能解決實際環境下,語音訊號處理中所描述的雞尾酒派對問題。本論文利用相關性來量測獨立性,由於相關性在統計學上是屬於二階的統計特性,表現此統計特性的方式為一個對稱的方陣,稱之為共變異矩陣。實際運算時先將訊號轉至頻域,接著計算訊號的交頻譜來表現語音訊號的二階統計特性。利用聯合對角化演算法對每個離散頻率計算解混合矩陣,使分離出來的訊號能夠盡可能的不相關。為了能有較佳的分離效果,我們利用語音訊號在時頻域上有稀疏性的假設,估計出某時頻點應該由哪位說話人獨占,且利用共變異矩陣的特徵值來近似原說話人與干擾訊號在此點上的能量比。接著,利用此比值建立一組遮罩,將以不相關的訊號通過這組遮罩來更加壓抑干擾訊號。為了避免遮罩產生分離訊號之頻譜的不連續性,我們將此遮罩轉換至倒頻域,在低倒頻率的部分用較小的平滑係數處理,藉此保持分離訊號的諧振,在高倒頻率的部分用較大的係數平滑之,讓分離出來的訊號之頻譜不會過於不連續。實驗時嘗試將兩個麥克風在實際環境中錄到的雙人混合語音分離開,將只有不相關的訊號和通過遮罩後的加強訊號作主觀評量,發現透過遮罩的確可以使干擾訊號更加的被壓抑。

關鍵字

盲訊號分離

並列摘要


無資料

並列關鍵字

BSS

參考文獻


with non-orthogonal transformations and its application to blind
[2] R. Vollgraf and K. Obermayer, Quadratic optimization for simultaneous matrix
diagonalization," IEEE Trans. Signal Process., vol. 54, pp. 3270{3278.
[3] D. Pham, Joint approximate diagonalization of positive denite hermitian matrices,"
SIAM J. on Matrix Anal. and Appl, vol. 22, pp. 1136{1152, 2000.

被引用紀錄


梁翰銘(2012)。利用粒子濾波器與麥克風陣列進行直角座標上多聲源之追蹤〔碩士論文,國立清華大學〕。華藝線上圖書館。https://doi.org/10.6843/NTHU.2012.00699

延伸閱讀