在Mobile Visual Search的系統中,scalable recognition是其中一個很重要的環結,在之前的研究中,Vocabulary Tree提供了一個很好的方式,能夠有效地進行影像的辨識。但是,在Vocabulary Tree的方法中,使用Hierarchical K-means演算法將所有影像的特徵點進行分類,由於Hierarchical K-means演算法是利用K-means演算法進行階層的分類,首先使用K-means演算法進行分類,分類的結果會受到選擇初始中心點的影響,造成分類隨著實驗變動,使得影像辨識的困難,再者在每一層分類上,分類的數目都是小於實際分類的數目,即使選擇分類中心點是實際分類的中心點,其他類別的特徵點就很容易被均勻分布在分類中心點,也造成影像分辨不正確的結果。 分類一群未知影像的特徵點是屬於unsupervised machine learning,但是真正想要分類是影像而不完全是影像的特徵點,特徵點屬於那個影像是一個有效而且有用的資訊;於是在建立Vocabulary Tree的每一層分類時,本論文加入了特徵點的影像資訊,利用影像中心點,先將影像使用K-means++演算法進行初步分類,再將初步分類的結果,使用supervised machine learning的Support Vector Machine演算法做真正特徵點的分類,使得影像的特徵點能夠更有效地分類,也提升了影像辨識的正確率。