透過您的圖書館登入
IP:18.222.111.24
  • 學位論文

合併分類器用於哼唱選歌的研究

Query by singing/humming using combination of classifiers

指導教授 : 張智星
若您是本文的作者,可授權文章由華藝線上圖書館中協助推廣。

摘要


合併分類器(Combination of Classifiers)主要用於統整多筆有分類的資料,並從中計算出一個新的分類結果,使其最符合各種資料的分類結果。而旋律辨識則是以人聲哼唱旋律的方式,從已知的資料庫中找出正確的歌曲。現今已經有了許多種的旋律辨識的方法,而各種旋律辨識的方法也擁有各自的特性,如以動態時間伸縮(dynamic time warping,DTW)進行辨識的結果,通常需較長的時間,但卻有較高的辨識率,而線性縮放(linear-scaling,LS),則速度較快,但相對於DTW辨識率則通常較差。而由於各種辨識方法有其不同的特性,因此其挑選出的歌曲也不盡相同。因此會出現某些的哼唱歌曲,使用某種辨識方法得到的辨識率比較好的情形。 本篇論文的重點在於,從合併分類法的角度,將旋律辨識的方法視為分類器,而其計算結果則視為分類器的分類結果,以達到整合各種旋律辨識的效果,因此,不同於旋律辨識的相關研究,本篇論文只注重於各種辨識方法的辨識結果,而不需考慮其辨識特性,其優點在於我們可以根據同一筆資料的不同排序結果,直接挑選出最好的辨識結果。 在實驗的部分,我們採用了兩組資料庫進行實驗,而根據實驗的結果,皆顯示兩組資料的辨識率皆可提升,然而都還是有無法突破的上界。因此在錯誤分析的部分,提出了一些無法被合併分類法所克服的類型。另一方面,也對於旋律辨識的兩種整合方式做比較,並做出結論。最後我們根據此結論,擷取兩種辨識方法的優點,並提出新的旋律辨識合併法(Combination of Melody Recognition)。

關鍵字

旋律辨識

參考文獻


李念容, 張智星,"哼唱檢索的辨識方法改進及探討A Study on Improving the Methods for Querying by Singing/Humming"(2007)
Jean-Charles de Borda, Memoire sur les elections au scrutin, Historie de l’Academie Royale des Sciences, Paris (1781).
J. R. Parker, “Rank and response combination from confusion matrix data” (2000).
Jean-Francois Pessiot, Tuong-Vinh Truong, Nicolas Usunier, Massih-Reza Amini, Patrick Gallinari. “Learning to Rank for Collaborative Filtering” (2007)
Eunju Kim, Wooju Kim, Yillbyung Lee, “Combination of multiple classifiers for the customer’s purchase behavior prediction” (2002)

延伸閱讀