強化學習(Reinforcement Learning, RL)屬於機器學習中的一門重要學問,被用於解決智能體(Agent)應如何基於環境(Environment)來決定所該採取的行動(Action, a),並從中獲得獎賞(Reward, R)。而智能體的策略(Policy, π)則針對環境所具有的狀態(States, s)來提出所應當採取的一系列行動,以期盡可能地提升總整體的獎賞。本文詳述智能體是如何藉由強化學習的觀念,使得自己如同現實生物一般來與環境產生互動、並介紹強化學習中不同的演算法。智能體可藉由強化學習方式來學習到與環境互動的經驗,等到學成了之後,當智能體再次遇到相同的環境狀況之時,便能藉由所學到的經驗即時做出最有利於本身的反應。