本論文之主軸在改進任務導向(Task-Oriented)與非任務導向(Non-Task- Oriented)之對話系統(Dialouge System)。隨著機器學習技術的日新月異,深層類神經網路(Deep Neural Network)已經在許多領域中取得非常優良的成績,而本論文的目標是挑戰深層類神經網路下的對話系統。對話系統是能夠與人類進行對話的機器人,並且依照其目的分成任務導向以及非任務導向兩種,而本論文對這兩類對話機器人都會進行探討。 論文的第一大方向是以電腦輔助華語學習系統作為任務導向對話機器人的範例。華語學習機器人的目的是幫助外國人學習華語發音,並讓學習者藉由不斷的練習語句使得學習者能夠在華語中不同的發音單位上進步。此方向的重點為使用了新的深層強化學習演算法(Deep Reinforcement Learning)取代了舊的演算法用以訓練語言學習系統中的對話管理者(Dialogue Manager),同時提出了新的獎勵函數(Reward Function)以增進整體效益。實驗結果也證明了新的深層強化學習演算法以及獎勵函數能夠有效的減少學習者學習華語所花費的時間。 論文第二大方向以非任務導向對話系統,又稱聊天機器人為主軸。聊天機器人的任務是與使用者漫無目的的聊天,而本論文提出了四種不同的模型以嘗試更改聊天機器人輸出回應語句的情緒,使之更正面,其分別為個人化模型、強化學習模型、即插即用模型以及循環式生成對抗網路。同時為了驗證各種模型的表現,本論文提出了四種機器評分機制以三種不同的角度評估聊天機器人的表現,也以人工評分結果驗證了機器評分機制的可信度。