近20年來,癌症始終為國人十大死因之首。而女性乳癌在臺灣歷年女性癌症死亡原因中,皆排名於前五名內。在罹癌後,多數病患、家屬或照護者會面臨某種程度的憂鬱、焦慮和恐懼。將近50 %罹患早期乳癌的女性病患在診斷後一年內有憂鬱、焦慮或兩者並存的現象。因此,本研究欲以資料探勘技術分析全民健保庫資料庫中的女性乳癌病患相關因素,透過資料探勘技術,找出可能影響罹患乳癌後造成憂鬱的原因,並用以建構一個有效的女性乳癌後憂鬱之預測分類模型。 本研究研究方法為使用支援向量機(Support Vector Machine,SVM)、分類迴歸樹(Classification and Regression Trees,CART)和邏輯斯迴歸(Logistic Regression)三種資料探勘技術建立預測模型。根據過去的研究及專家建議,以病患的手術後治療方式(放射治療、化學治療或並行)、是否有慢性病、重大傷病及罹癌施行手術後門診就醫的醫事機構特約類別、醫事機構地區、與憂鬱病症相關的診斷及其他門診診斷等相關因素做為建立模型之變數。並在建立模型後分別比較各種預測模型之AUROC、敏感度(sensitivity)和特異度(specificity)、準確率(Accuracy)作為評估。 本研究之研究對象為罹患乳癌並施行手術後之女性病患,經資料清理後,樣本數共有970人,其中有憂鬱者為194人,沒有憂鬱的有776人。全部樣本數平均年齡為51.56歲,有慢性病者為490人,有重大傷病者為528人。就診醫事機構多為醫學中心,就診地區多在台北。 訓練組資料有734筆,測試組資料共有236筆。測試組資料在訓練的模型中,雖然支援向量機的AUROC和準確率最佳,但與分類迴歸樹、邏輯思迴歸的差異並不大。AUROC分別為0.921、0.920及0.904,準確率分別是0.87、0.84和0.85。敏感性(Sensitivity)分別為94.2、100.0、98.1。特異性(Specificity)分別為89.1、85.3、85.3。