透過您的圖書館登入
IP:13.58.82.79
  • 學位論文

動態時間校正與模型基底分析高維度時間序列資料

Large Scale Time Series Data Analysis by Using Dynamic Time Warping and Model-Based Method

指導教授 : 任立中

摘要


在傳統的時間序列分析中,多是針對單一的時間序列進行自我相關迴歸分析,若要進行高維度的分析則可能遇上非定態(Non-Stationary)的情況,無法直接建立模型分析。因此發展出如 PCA 降維(Gavrilov, et al. 2000)、動態時間校正(Keogh and Pazzani 2001)等方法將高維時間序列進行分群(Clustering)。 本篇研究使用聯合醫院某院區為期兩年半之用藥資料進行分析,其中包含1038 種藥品在 30 個月中的藥品支出量,在對藥物不具有領域知識(Domain knowledge)的情況下,欲分別使用動態時間校正以及 ARIMA 模型建立各藥品的殘差矩陣兩方法,探詢各藥品之相關性,再從有相關性的藥品當中,實際查看時間序列上的趨勢(Trend)、季節性(Seasonal)的異同,或是序列相似的藥品間是否具有實際關係做後續分析。

並列摘要


In traditional time series methods, studies usually used ARIMA model to analysis and predict. However, it may become non-stationary model in high dimension situation so that the study can’t use multivariate ARIMA model directly. Reducing dimensions by PCA (principal component analysis) and DTW (dynamic time warping) are another way to cluster high dimensions time series data. Data of the theme is the medicine expenditure from TAIPEI CITY HOSPITAL. It is from January, 2015 to June, 2017, includes 1038 drugs. Without domain knowledge of drugs, the study uses DTW and residual matrix of ARIMA model individually to find correlated drugs. After finds out correlated drugs, the author checks if these drugs have similarity of trend or seasonal.

參考文獻


一、 中文文獻
葉小蓁
1998 時間序列分析與應用: 葉小蓁發行.
二、 英文文獻
Agarwal, Rakesh, and Ramakrishnan Srikant

延伸閱讀