透過您的圖書館登入
IP:3.21.233.41
若您是本文的作者,可授權文章由華藝線上圖書館中協助推廣。

摘要


在順序型資料上建構分類樹時,所使用的分割方法,許多都會因為解釋變數的切割點數量 不同,而造成選取上的偏差。在本論文中,我們發現 Galimberti et al. (2012) 的 rpartScore 方法 還是有變數選取上的偏差。 我們使用 Simonoff (2003) 的方法來建立我們的分割選取方法,也 提供了建構分類樹,修剪分類樹與選擇最佳分類樹的程式。 藉由模擬實驗及實際資料分析我們發現,此方法在變數選取上較不會產生偏差, 而且在實際的資料上也有較好的預測準確率。

關鍵字

分類樹 順序型資料

並列摘要


無資料

並列關鍵字

Classification Trees

參考文獻


Archer, K. (2010), "rpartOrdinal: An R package for deriving a classification tree for predicting an ordinal response", Journal of Statistical Software, 34.
Classification and Regression Trees, Wadsworth Publishing Co Inc.
Galimberti, G., Soffritti, G. and Maso, M. (2012), "Classification Trees for Ordinal Responses in R: The rpartScore package", Journal of Statistical Software, 47, 1-25.
Piccarreta, R. (2008), "Classification trees for ordinal variables", Computational Statistics, 23, 407-427.
Breiman, L., Friedman, J. H., Olshen, R.A., Stone, C. J. (1984),

延伸閱讀