透過您的圖書館登入
IP:18.118.12.222
  • 學位論文

對ImageNet大規模物件影像資料庫的形狀標註與辨識之研究

Study on shape annotation and recognition for the large-scale image database on ImageNet

指導教授 : 劉震昌
若您是本文的作者,可授權文章由華藝線上圖書館中協助推廣。

摘要


物件辨識有許多方法,形狀是其中一種重要的辨識特徵。日常生活的圖片較符合實際物件辨識的應用情境,但若要從日常生活影像用電腦視覺的方式辨識出物件是相當困難的,這是因為圖片中含有太多雜訊以及拍攝的環境不同導致辨識率低。然而訓練資料的不足則是另一個問題,要從日常影像標註物件輪廓要耗費大量人力。本論文提出在ImageNet大規模物件影像資料庫取得多樣化的生活日常影像,並設計一套互動式行動應用程式吸引群眾參與,以群眾外包的方式進行影像中物件輪廓的描繪。此系統除了可收集大量形狀標註資料,亦可幫助了解人類對於不同物件辨別的重要輪廓特徵。對於目前收集到的小規模物件形狀資料,我們使用一維傅立葉描述子、二維傅立葉描述子、輪廓特質等形狀特徵進行初步的物件辨識研究。

並列摘要


There are many approaches for object recognition, and shape is one of the most important features. It is still difficult to recognize object class from real-world images using computer vision techniques, because real-world images contain background clutters and the photograph environment varies. Moreover, lack of training data is another issue. It is labor intensive to annotate object contours from a large amount of images. In this paper, we propose to use the large-scale image database on ImageNet. The idea of crowdsourcing is applied to collect object contours by designing an interactive mobile APP. Through the human sketches of the objects’ contours, we can understand which contour segments are important for humans to recognize objects. Shape features, including 1-D Fourier descriptor, 2-D Fourier descriptor, and shape context, are used for the experiments for object recognition for the collected small object shape set.

參考文獻


[1]上官林傑,《Google應用服務引擎開發實戰》,精誠資訊悅知文化股份有限公司,2009。
[2]李威和,《網路應用程式開發—使用Google App Engine雲端運算》,統一元氣資產管理,2009。
[3]佘志龍、陳昱勛、鄭名傑、陳小鳳、郭秩均,《Google Android SDK開發範例大全》,精誠資訊悅知文化股份有限公司,2009。
[4]何孟翰,《前進 Android Market!Google Android SDK 實戰演練》,精誠資訊悅知文化股份有限公司,2011。
[5]陳伶志、余孝萱,《淺談群眾外包—以Amazon Mechanical Turk 為例》,中央研究院,週報1314期。

延伸閱讀