國立臺灣師範大學博碩士論文全文系統

簡易檢索 / 詳目顯示

回結果列表

研究生：	楊日鳳 Yang, Jih-Feng
論文名稱：	使用強化式學習於時間序列預測之應用 Time Series Prediction Using Reinforcement Learning
指導教授：	黃文吉
學位類別：	碩士 Master
系所名稱：	資訊工程學系 Department of Computer Science and Information Engineering
論文出版年：	2019
畢業學年度：	107
語文別：	中文
論文頁數：	45
中文關鍵詞：	時間序列預測、強化式學習、股價趨勢預測
英文關鍵詞：	Time Series Prediction, Policy Gradient
DOI URL：	http://doi.org/10.6345/NTNU201900876
論文種類：	學術論文
相關次數：	點閱：69 下載：0
分享至:	分享至facebook 分享至twitter

查詢本校圖書館目錄查詢臺灣博碩士論文知識加值系統勘誤回報

本論文使用強化式學習的方法結合類神經網路LSTM架構於時間序列的分析與預測，然而我們想針對美國NASDAQ指數進行買點分析的研究探討，並使用強化式學習中的Policy Gradient法則，以型態學的角度處理資料，讓LSTM模型，學習歷史收盤價中上漲及下跌前會發生的預兆進而預測買點。本論文的研究目的為證明強化式學習及LSTM的模型，對於時間序列的預測是相當合適的，雖然本研究只針對一種資料做研究，但其方法與架構可以套用至其它時間序列資料。
由型態學的理論作為基礎，我們需要訓練兩種趨勢的模型，使我們可以更確定特徵出現的訊號，讓預測結果更加確定更為穩健。我們也以型態學的角度，將收盤價資料做處理，使看似雜亂無章的收盤價資料處理成趨勢資料。接著我們以Policy Gradient的方法，以獲利值引導參數學習，使得模型在訓練的過程中，會自行隨著獲利值慢慢收斂至擁有最大期望值的模式。
實際測試方面，本論文以三種趨勢的資料做測試，測驗本研究所提出的演算法架構使否能成功避險及獲得高獲利，而根據實驗結果顯示，此架構除了能夠成避開負獲利的買點以外，也能夠只挑選那些有足夠把握的買點才做購買，避開那些不必要之交易風險。本論文也將此架構之演算法和其他現有的方法做討論，也有較好之獲利能力。

中文摘要    i
目錄    ii
圖目錄    iv
表目錄    v
第一章 緒論  1
第一節 研究背景與動機  1
第二節 研究目的  5
第三節 全文架構  6
第二章 基礎理論與文獻探討  7
第一節 NASDAQ綜合指數資料介紹  7
第二節 型態學  8
第三節 多層感知器(Multilayer Perceptron)  10
第四節 長短記憶模型(Long Short Term Memory)  11
2.4.1遞歸神經網路(Recurrent Neural Network)  11
2.4.2長短記憶(Long Short Term Memory)  12
第五節 Policy Gradient演算法介紹  13
第三章 研究方法與架構  16
第一節 資料前處理  17
3.1.1 資料切割  18
3.1.2 極值正規化(Normalization)  19
3.1.3 趨勢分類  19
第二節 模型架構與訓練  23
3.2.1以MLP為基礎的Agent其模型架構與訓練說明  23
3.2.2以LSTM為基礎的Agent其模型架構與訓練說明  27
第三節 後處理  30
第四章 實驗數據與分析  32
第一節 獲利率計算  32
第二節 於不同Agent結構之分析與實驗數據  33
4.2.1以MLP為Agent之架構  36
4.2.2以LSTM為Agent之架構  37
第三節 參數設定之實驗數據  39
第四節 與其他現有法則進行比較  40
第五節 將本研究測試於近四年資料之實驗結果  42
第五章 結論  44
參考文獻  45
                                

一、
歐陽亦凡, “使用深度學習進行證券交易之型態分析研究,” 國立臺灣師範大學碩士論文, 2018.

二、英文文獻
T. Chen and F. Chen, “An intelligent pattern recognition model for supporting investment decisions in stock market,” Information Sciences, pp. 261-274, 2016.

D. M. Q. Nelson and A. C. M. Pereira “Stock market's price movement prediction with LSTM neural networks,” in Proc. IEEE International Conf. on Neural Networks, pp.2161-4407, 2017.

Wang and Chan, “Stock market trading rule discovery using pattern recognition and technical analysis,” Expert Systems with Applications, pp. 304-315, 2007.

I. Goodfellow, Y. Bengio, and A. Courville, Deep Learning. MIT Press, Cambridge, Massachusetts, USA, 2016.

R. S. Sutton and A. G. Barto, Reinforcement Learning: An Introduction, 2nd Ed., MIT Press, Cambridge, Massachusetts, USA, 2018.

H. D. Huynh and L. M. Dong, “A New Model for Stock Price Movements Prediction Using Deep Neural Network” In SoICT ’17. pp.57-62, 2017

S. Selvin, R. Vinayakumar, “Stock price prediction using LSTM, RNN and CNN-sliding window model” in Proc IEEE International Conference on Advances in Computing, Communications and Informatics (ICACCI), 2017

電子全文延後公開
2024/08/19

簡易檢索 / 詳目顯示

相關論文