合併分類器用於哼唱選歌的研究

合併分類器（Combination of Classifiers）主要用於統整多筆有分類的資料，並從中計算出一個新的分類結果，使其最符合各種資料的分類結果。而旋律辨識則是以人聲哼唱旋律的方式，從已知的資料庫中找出正確的歌曲。現今已經有了許多種的旋律辨識的方法，而各種旋律辨識的方法也擁有各自的特性，如以動態時間伸縮(dynamic time warping，DTW)進行辨識的結果，通常需較長的時間，但卻有較高的辨識率，而線性縮放(linear-scaling，LS)，則速度較快，但相對於DTW辨識率則通常較差。而由於各種辨識方法有其不同的特性，因此其挑選出的歌曲也不盡相同。因此會出現某些的哼唱歌曲，使用某種辨識方法得到的辨識率比較好的情形。本篇論文的重點在於，從合併分類法的角度，將旋律辨識的方法視為分類器，而其計算結果則視為分類器的分類結果，以達到整合各種旋律辨識的效果，因此，不同於旋律辨識的相關研究，本篇論文只注重於各種辨識方法的辨識結果，而不需考慮其辨識特性，其優點在於我們可以根據同一筆資料的不同排序結果，直接挑選出最好的辨識結果。在實驗的部分，我們採用了兩組資料庫進行實驗，而根據實驗的結果，皆顯示兩組資料的辨識率皆可提升，然而都還是有無法突破的上界。因此在錯誤分析的部分，提出了一些無法被合併分類法所克服的類型。另一方面，也對於旋律辨識的兩種整合方式做比較，並做出結論。最後我們根據此結論，擷取兩種辨識方法的優點，並提出新的旋律辨識合併法（Combination of Melody Recognition）。

關鍵字

旋律辨識

參考文獻

李念容, 張智星，"哼唱檢索的辨識方法改進及探討A Study on Improving the Methods for Querying by Singing/Humming"(2007)

Jean-Charles de Borda, Memoire sur les elections au scrutin, Historie de l’Academie Royale des Sciences, Paris (1781).

J. R. Parker, “Rank and response combination from confusion matrix data” (2000).

Jean-Francois Pessiot, Tuong-Vinh Truong, Nicolas Usunier, Massih-Reza Amini, Patrick Gallinari. “Learning to Rank for Collaborative Filtering” (2007)

Eunju Kim, Wooju Kim, Yillbyung Lee, “Combination of multiple classifiers for the customer’s purchase behavior prediction” (2002)

國際替代計量

合併分類器用於哼唱選歌的研究

未授權

主題瀏覽