透過您的圖書館登入
IP:18.227.183.215
  • 學位論文

整數型態之FFT的實作與改進,及其在語音辨識之應用

Implementation and Improvement of Integer-type FFT for Speech Recognition

指導教授 : 張智星

摘要


語音辨識系統應用,在現今是個很熱門的一項電腦技術。我們可以從目前的手機和語言學習機上發現其應用,例如:手機上的聲控撥號以及語言學習機的跟讀比對功能。當民眾在使用這些產品時,所要求的就是辨識率、辨識速度、記憶體容量、成本和攜帶便利性等等。在理想的情況下,當然是希望能辨識率高、辨識速度快、占記憶體容量少、成本低和容易攜帶等等優點。不過這都是在理想情況下才能達到,所以目前只能看使用者的需求,來加以取捨以上的優點。 而現在人們大多為了追求攜帶方便、低耗電量和低成本的優點。所以個人行動處理器上的時脈都比PC的低了許多,並且為了低成本,而捨去昂貴的浮點運算功能。若要將PC上應用的語音辨識系統,直接轉移到個人行動處理器上,就無法達到和在PC上執行時,有一樣的效能。 若要將語音辨識系統,應用在個人行動處理器上,必須將原本的浮點運算轉換成整數型態的運算,如此才能配合無浮點運算功能的個人行動處理器,讓使用者能接受容易攜帶且低成本的優點。 在語音辨識上最重要的參數-梅爾倒頻譜係數,在抽取語音特徵的程序中,以整數型態快速傅立葉轉換(integer-FFT)過程,所產生的誤差值是最大的。因此本篇論文所討論的重點,以各種放大係數,對浮點數FFT轉換成整數型態FFT過程中,分析對誤差影響的程度。最後再依據分析結果,找出一個放大係數,使辨識率為最佳的。

關鍵字

語音辨識

並列摘要


In this thesis, we investigate the methodologies of porting the computation of floating-point MFCCs to integer ones. In particular, we focus on the implementation of integer-FFT during the integer-MFCCs computation. We have closely checked the scaling-up factors during each stage of the computation of integer-FFT by using a data-driven approach. These scaling-up factors are carefully chosen for striking a balance between precision and overflow, such that the highest recognition rate can be achieved. Moreover, we have proposed the use of some characteristics in trigonometric functions in building a minimum lookup table without degrading the recognition rate.

並列關鍵字

Speech Recognition

參考文獻


[ 2]Ying-Jui Chen and Truong Q. Nguyen,” Integer Fast Fourier Transform”, IEEE transactions on signal processing,vol.50,no.3,March 2002.
[ 3]Alan V.Oppenheim ,Ronald W.Schafer with John R.Buck Discrete-Time Signal Processing.2th Edition
[ 4]William H. Press ,Saul A. Teukolsky ,William T. Vetterling and Brian P. Flannery ,Numerical Recipes in C. The Art of Scientific Computing ,Second Edition
[ 5]Yoshikazu Yokotanit, Soontom Oraintarat, Ralf Geiges, Gerald Schullert, and K.R.Rao ,”A Comparison of Integer Fast Fourier Transforms for Lossless Coding”. International Symposium on Communications and Information Technologies 2004 ( ISCIT 2004 ) Sapporo, Japan, October 26- 29,2004
[ 6]Randy Yates, Fixed-Point Arithmetic: An Introduction, Digital Audio Signal Processing ,March 3, 2001

被引用紀錄


白家豪(2015)。基於超寬頻雷達之非接觸式心跳率及呼吸率監護系統〔碩士論文,國立中央大學〕。華藝線上圖書館。https://www.airitilibrary.com/Article/Detail?DocID=U0031-0412201512074830
廖敏竣(2017)。我國優秀選手參與不同訓練場所滿意度比較研究〔碩士論文,長榮大學〕。華藝線上圖書館。https://www.airitilibrary.com/Article/Detail?DocID=U0015-2206201714411500

延伸閱讀