由於當今圖形處理器(GPU)具有強大的計算能力及高記憶體頻寬,運用GPU實作光線追蹤演算法在近年來成了電腦圖學領域中的熱門研究課題。而CUDA──一種新的GPU通用運算架構──的問世更克服了許多傳統上基於GPU實作光線追蹤演算法所遇到的困難。 在這篇論文中,我們展示了一個高度最佳化的基於CUDA的光線追蹤演算法實作。我們檢視並評測了多種過去的GPU光線追蹤演算法設計,得到的結論是普通的kd-tree走訪演算法的效能表現最佳。在使用簡單的打光模型及僅處理從眼睛射出的光線的條件下,我們的實作在數個適度複雜的場景中達到了每秒處理30-43百萬條光線的執行速度。我們並呈現了一個Whitted式光線追蹤演算法的實作,該成果顯示了用GPU和CUDA處理高品質繪圖的可行性。