仿射非線性系統是無控制訊號非線性項的非線性系統,其軌跡追蹤控制問題的傳統解法是利用線性化求解,但是仿射非線性系統的線性化設計受到很多限制,而且線性化會降低控制精度也不適用於具有強非線性的系統。本論文採用適應型最佳控制法求解仿射非線性系統的軌跡追蹤最佳控制問題,適應型最佳控制法的特點是用成本函數表示優化的目標,然後把根據最小值原理導出的最佳控制條件式安排成一個強化學習架構,此架構可以透過學習程序建立評議函數,完成學習的評議函數會在強化學習架構之下引導循序優化控制器的程序,循序優化程序收斂之後會得到軌跡追蹤最佳控制器的近似解。本論文針對仿射非線性系統軌跡追蹤最佳控制問題建立適應型最佳控制法的求解步驟,透過許多個應用例的電腦模擬結果檢驗此求解方法的成效,並且與疊代試探動態規劃法的成效相比較,結果顯示適應型最佳控制法確實可以透過學習和循序優化程序,求得仿射非線性系統的軌跡追蹤最佳控制器的近似解,對照疊代試探動態規劃法的成效,適應型最佳控制法的收斂速率明顯的快很多,而且可以容忍比較大的系統模型誤差。