以FPGA實現摺積神經網路及應用於人臉辨識之研究

本研究主要提出一個以可程式化邏輯閘陣列(Field Programmable Gate Array; FPGA) [1]為主的硬體架構來實現快速辨識影像架構，此架構是採用摺積神經網路(Convolutional Neural Network ; CNN)的向前傳遞法則(Forward propagation)來實現影像的辨識階段，現有的CNN系統架構多以GPU實現，GPU有高功率的缺點，而現有使用FPGA實現CNN運算的電路設計大部分只有設計CNN中的少數幾層，只實作出摺積層或是全連結層，本研究以FPGA為平台，設計CNN中的Lenet5模型，設計出Lenet5完整架構，具有低功率消耗跟極高的辨識率的優點。本研究的架構為可程式化系統晶片(System on Programmable Chip; SOPC)中的硬體加速器以實現圖像辨識，本研究使用人臉圖像來當作辨識影像，總共辨識28個人的人臉。實驗結果顯示本研究所提出的CNN架構十分合適於使用在需要高可攜性，高辨識率，高計算速度等的視覺應用。本論文實作CNN的Lenet5架構比較適合運用在社區的人臉監視系統，Lenet5 模型對於很多人的辨識運用比其它摺積神經網路較差些，像是VGG Net [2]、GOOGLE Net [3]，但對於30人左右的辨識率Lenet5模型還是辨識率還是足夠的。本研究可以使用在社區人臉辨識，社區的人臉監視系統只需要辨識社區內所有人物，而且辨識的速度快速，一有辨識錯的影像可以馬上被察覺，不會讓社區以外的人進入，這是本論文的一個有趣的應用。

關鍵字

摺積神經網路

並列摘要

none

並列關鍵字

none

參考文獻

[1] C. Zhang, P. Li, G. Sun, Y. Guan, B. Xiao, and J. Cong, (2015). Optimizing FPGA-Based Accelerator Design for Deep Convolutional Neural Networks. In Proc. ACM/SIGDA Int. Symp. on Field- Programmable Gate Arrays, pp.161-170.

Google Scholar

[2] L. Wang, S. Guo, W. Huang, and Y. Qiao (2015). Places205-VGGNet Models for Scene Recognition; Available online: https://github.com/wanglimin/Places205-VGGNet (accessed on 20 Nov. 2015).

Google Scholar

[3] C. Szegedy, W. Liu, Y. Jia, P. Sermanet, S. Reed, D. Anguelov, D. Erhan, V. Vanhoucke, A.Rabinovich (2015). Going Deeper with Convolutions. In Proc. IEEE Int. Conf. on Comp. Vis. and Pattern Recogn.

Google Scholar

[4] Y. LeCun, Y. Bengio and G. Hinton, (2015). Deep Learning, Nature, 521, pp. 436-444.

Google Scholar

[5] J. Fan, W. Xu, Y. Wu, and Y. Gong, (2010) Human Tracking Using Convolutional Neural Networks. IEEE Trans. Neural Networks, 21, pp. 1610 -1623.

Google Scholar

主題瀏覽