利用階層式支持向量機演算法建立應用於行動化視覺搜尋之影像字彙樹

在Mobile Visual Search的系統中，scalable recognition是其中一個很重要的環結，在之前的研究中，Vocabulary Tree提供了一個很好的方式，能夠有效地進行影像的辨識。但是，在Vocabulary Tree的方法中，使用Hierarchical K-means演算法將所有影像的特徵點進行分類，由於Hierarchical K-means演算法是利用K-means演算法進行階層的分類，首先使用K-means演算法進行分類，分類的結果會受到選擇初始中心點的影響，造成分類隨著實驗變動，使得影像辨識的困難，再者在每一層分類上，分類的數目都是小於實際分類的數目，即使選擇分類中心點是實際分類的中心點，其他類別的特徵點就很容易被均勻分布在分類中心點，也造成影像分辨不正確的結果。分類一群未知影像的特徵點是屬於unsupervised machine learning，但是真正想要分類是影像而不完全是影像的特徵點，特徵點屬於那個影像是一個有效而且有用的資訊；於是在建立Vocabulary Tree的每一層分類時，本論文加入了特徵點的影像資訊，利用影像中心點，先將影像使用K-means++演算法進行初步分類，再將初步分類的結果，使用supervised machine learning的Support Vector Machine演算法做真正特徵點的分類，使得影像的特徵點能夠更有效地分類，也提升了影像辨識的正確率。

關鍵字

支持向量機；行動化視覺搜尋；影像字彙樹

並列摘要

無資料

並列關鍵字

Support Vector Machine ； Mobile Visual Search ； Vocabulary Tree

參考文獻

[2] V. Chandrasekhar, G. Takacs, D. Chen, S. Tsai, and B. Girod, “Transform Coding of Feature Descriptors,” in VCIP, 2009.

[4] V. Chandrasekhar, G. Takacs, D. M. Chen, S. S. Tsai, R. Grzeszczuk, and B. Girod. CHoG: Compressed Histogram of Gradients - A low bit rate feature descriptor. In Proc. of IEEE Conference on Computer Vision and Pattern Recognition (CVPR), Miami, Florida, June 2009.

[5] K. Grauman and T. Darrell. The Pyramid Match Kernel: Efficient Learning with Sets of Features. Journal of Machine Learning Research (JMLR), 8 (Apr): 725--760, 2007.

[7] D. Lowe, “Distinctive Image Features from Scale-Invariant Keypoints,” International Journal of Computer Vision, vol. 60, no. 2, pp. 91–110, 2004.

[9] D. Nist’er and H. Stew’enius, “Scalable Recognition with a Vocabulary Tree,” in IEEE Conference on Computer Vision and Pattern Recognition (CVPR), vol. 2, 2006, pp. 2161–2168.

國際替代計量

利用階層式支持向量機演算法建立應用於行動化視覺搜尋之影像字彙樹

全文下載

主題瀏覽