透過您的圖書館登入
IP:34.227.191.136
  • 學位論文

應用Dagging集成式學習演算法改善分類準確度之研究

A Study of Using Dagging Ensemble Learning Algorithm for Improving Classification Accuracy

指導教授 : 顧瑞祥
若您是本文的作者,可授權文章由華藝線上圖書館中協助推廣。

摘要


近年來,因為電腦資訊以及技術的發展,資料收集較以前容易,而各行各業也開始利用收集資料的方式,再加以分析得出更好的結論與決策,進而提高績效或生產力,因此衍生出資料探勘的技術。目前資料探勘技術被運用在行銷分析、輔助醫療診斷等眾多領域之中。而近期結合多種分類器的集成式演算法更被廣泛探討,集成式演算法是建立一組分類學習器,利用這些學習器對資料庫進行分類。而目前國內論文與期刊並無學者使用Dagging這個集成式演算法進行分類準確度之探討,因此本研究以集成式演算法中的Dagging做為分類評估的方法,此方法是使用多個基底分類器進行分類,再以投票的方式,整合出一個較佳的模型。本研究使用四種分類器分別為決策樹中的C4.5/J48、簡單貝氏、支援向量機與倒傳遞類神經網路,在過去許多研究中,這些分類器皆有不錯的分類結果,因此以這些分類器做為單一分類器。並使用UCI四個資料庫做為實驗的測試與評估,應用的軟體為開放式的資料探勘工具WEKA。本研究所使用的四個資料庫之研究結果顯示,當使用平均值比較法時,屬性個數過小,使用Dagging集成式演算法沒有優於單一分類器演算法。反之則優於單一分類器演算法,且使用多種不同基底分類器則會有較佳的準確度。而當使用優劣比較法時,僅Dagging結合兩種基底分類器時沒有優於其他模型外,其餘Dagging結合基底分類器之模型會比單一分類器好。

並列摘要


In recent years, data mining has been applied to extensive fields. However, Ensemble Algorithms combines a variety of classifiers, have been more explored lately. It is a way to set up a group of classifiers to perform the classification in databases. Therefore, researchers used Dagging of Ensemble Algorithms as a method for sorting out the evaluation by employing numerous base classifiers, and further integrate them into the best model with a vote. This study utilized four classifiers. They are C4.5/J48, Naive Bayes, Support Vector Machine, and Back-Propagation Neural Network. This study utilized the four databases of UCI as the test and evaluation of the experiment.

參考文獻


[7]李俊宏、古清仁(2010),「類神經網路與資料探勘技術在醫療診斷之應用研究」,工程科技與教育學刊,7卷,1期,頁154-169。
[20]黃書猛、張中權(2010),「應用空間資料探勘於未來需求規劃之研究─以都會捷運系統為例」,電子商務研究,8卷,1期,頁105-122。
[38]蕭漢威、楊錦生、魏志平、馬淑貞(2007),「以網路流量資料探勘進行阻斷服務攻擊偵測之研究」,資訊管理學報,14卷,2期。
[29]葉宣萱(2011),「消費金融無擔保客戶違約協商後毀諾─資料探勘技之應用」,台灣金融財務季刊,12卷,4期。
[18]陳承昌、史天元(2007),「支援向量機應用於水稻田辨識之研究」,航測及遙測學刊,12卷,4期,頁255-240。

被引用紀錄


陳靜慧(2011)。低碳旅遊評量指標建立之研究〔碩士論文,國立高雄餐旅大學〕。華藝線上圖書館。https://www.airitilibrary.com/Article/Detail?DocID=U0018-2107201121201000

延伸閱讀