透過您的圖書館登入
IP:18.226.82.78
  • 學位論文

以谷歌趨勢及多層感知器模型於旅客人數預測之應用

Using Google Trends and Multilayer Perceptron Model in Tourism Forecast

指導教授 : 白炳豐
若您是本文的作者,可授權文章由華藝線上圖書館中協助推廣。

摘要


現今網際網路越來越發達,Google搜尋引擎與瀏覽器的興起,改變了以往使用者的網路行為,數以億計的Google使用者,產生了龐大的關鍵字搜尋資料,使用關鍵字搜尋資料做預測是目前非常熱門的研究。故本研究使用Google趨勢擷取關鍵字趨勢資料,搭配美國排行榜網站Ranker.com,提供的美國知名旅遊景點53個關鍵字,例如:美國大峽谷(Grand Canyon)、布萊斯峽谷(Bryce Canyon)、黃石公園(Yellowstone National Park)…等著名景點。最後加上飯店(hotels)、航班(flights)以及旅遊(travel),這3個文獻提供的關鍵字,總共挑選56個關鍵字,並分別鎖定於加拿大、澳洲、英國三個國家的搜尋量。 本研究使用多組時間序列模型與多層感知器(Multilayer Perceptron, MLP)進行比較,觀察在預測澳洲、加拿大、英國訪美人數方面,使用Google趨勢資料是否可優於其他時間序列模型,並且為了篩選過多的關鍵字,本研究使用集成學習方法,分別有相關選取法(Correlation Feature Selection, CFS)、皮爾森相關係數(Pearson Correlation Coefficient, PCC )和逐步回歸法(Stepwise regression, SR)三種特徵選取集成學習法,希望能找到最佳的模型組合。 經實驗證實,使用特徵選取法時,透用集成學習(ensemble learning)以三種方法取交集、聯集的方式,比起單一方法可找到更好的關鍵字,另外以56個關鍵字,蒐集Google趨勢的關鍵字資料並建立多層感知器模型,結果表明使用Google趨勢資料,可以有效的預測澳洲、加拿大、英國訪美人數,其平均絕對值誤差率(MAPE)皆落在最佳的預測範圍內。

並列摘要


In this study, Google Trends data are used as input variables by Multilayer Perceptron (MLP) models to forecast the number of visitors from Canada, Australia and the United Kingdom to the United States. Ensemble learning is employed to determine the important input variables for the MLP models. Numerical results show that ensemble learning is a more appropriate way in determining input variables for the MLP models than using a single method. Time series methods are used to predict the number of visitors for the same cases as the MLP models. Experiment results show that using Google trends data by the MLP models to predict the number of visitors can obtain more accurate results than the time series models.

參考文獻


參考文獻
一、 中文部分
[1] 林傑斌, 劉明德, & 統計學. (2002). SPSS 11.0 與統計模式建構. 文魁資訊.
[2] 曾憲雄, 蔡秀滿, 蘇東興, 曾秋蓉, & 王慶堯. (2005). 資料探勘, 旗標出版股份有限公司.
[3] 楊奕農(2009). 時間序列分析: 經濟與財務上之應用. 雙葉書廊.

延伸閱讀