基於遠場錄音之環境下的特徵選取來改善語者辨識

高齡化是目前社會逐漸邁向的趨勢，大眾逐漸意識到醫療照護的重要性，但由於高齡化社會的另一面即代表青壯年人口的下降，導致照護人力逐漸減少，居家照護也因此受到重視。然而由於智慧裝置以及3C產品的普及，人手一台智慧手機已不是新聞，在此趨勢下結合科技產品之居家照護系統之研究也如雨後春筍般出現，其中不乏多數為透過傳感器或者影像辨識之技術來實現照護之目的，但透過影像辨識之技術往往會受限於環境中之遮蔽物或者攝影機照射之死角造成辨識上的疏漏，但若能將語音辨識中之語者辨識系統應用於居家生活中來協助影像進行人物之辨識，即可消除影像辨識之死角以及遮蔽相關的盲點，甚至不需要人在畫面中，只要有說話聲音就能得知哪位家庭成員在該空間中，但由於遠距離錄音會造成麥克風收錄到之音訊會帶有環境內之空間響應，影響了語音之特徵，其中影響最大的現象稱作迴響(Reverberation)，所以一般語者辨識之研究多屬於近場錄音，但將錄音設備配戴於家庭成員身上來進行人物辨識並不符合智慧居家照護之應用情境，因此本研究透過觀察語音特徵在遠場錄音下的影響來改善語者辨識，最後透過特徵選取來驗證我們對特徵的假設。本研究提出適用於遠場錄音情境下之語音參數組合應用於語者辨識時，在語音含有模擬迴響時間達到0.5秒時最高有88%的正確率，而在實際環境下則可達到96%，透過本研究的結果可使智慧居家照顧系統更兼完善且穩定。

關鍵字

居家照護；語音特徵；遠場錄音；語者辨識

並列摘要

無資料

並列關鍵字

Speech Feature ； Far Field ； Speaker Recognition ； Homecare

參考文獻

[2] Ahmad, Khan Suhail, et al, "A unique approach in text independent speaker recognition using MFCC feature sets and probabilistic neural network," Advances in Pattern Recognition (ICAPR), 2015 Eighth International Conference on. IEEE, 2015.

[3] Kinnunen, Tomi, and Haizhou Li, "An overview of text-independent speaker recognition: From features to supervectors," Speech communication 52.1, pp.12-40 2010.

[5] Rose, Phil, "Forensic speaker identification," CRC Press, 2003.

[6] K. Bartkova, D. Le-Gac, D. Charlet, and D. Jouvet, “Prosodic Parameter for Speaker Identification,” In Proc. of ICSLP, pp. 1197-1200, 2002.

[8] Ferras, Marc, et al, "Comparison of speaker adaptation methods as feature extraction for SVM-based speaker recognition," Audio, Speech, and Language Processing, IEEE Transactions on 18.6, pp. 1366-1378, 2010.

國際替代計量

基於遠場錄音之環境下的特徵選取來改善語者辨識

未授權

主題瀏覽