近年來,因為電腦資訊以及技術的發展,資料收集較以前容易,而各行各業也開始利用收集資料的方式,再加以分析得出更好的結論與決策,進而提高績效或生產力,因此衍生出資料探勘的技術。目前資料探勘技術被運用在行銷分析、輔助醫療診斷等眾多領域之中。而近期結合多種分類器的集成式演算法更被廣泛探討,集成式演算法是建立一組分類學習器,利用這些學習器對資料庫進行分類。而目前國內論文與期刊並無學者使用Dagging這個集成式演算法進行分類準確度之探討,因此本研究以集成式演算法中的Dagging做為分類評估的方法,此方法是使用多個基底分類器進行分類,再以投票的方式,整合出一個較佳的模型。本研究使用四種分類器分別為決策樹中的C4.5/J48、簡單貝氏、支援向量機與倒傳遞類神經網路,在過去許多研究中,這些分類器皆有不錯的分類結果,因此以這些分類器做為單一分類器。並使用UCI四個資料庫做為實驗的測試與評估,應用的軟體為開放式的資料探勘工具WEKA。本研究所使用的四個資料庫之研究結果顯示,當使用平均值比較法時,屬性個數過小,使用Dagging集成式演算法沒有優於單一分類器演算法。反之則優於單一分類器演算法,且使用多種不同基底分類器則會有較佳的準確度。而當使用優劣比較法時,僅Dagging結合兩種基底分類器時沒有優於其他模型外,其餘Dagging結合基底分類器之模型會比單一分類器好。
In recent years, data mining has been applied to extensive fields. However, Ensemble Algorithms combines a variety of classifiers, have been more explored lately. It is a way to set up a group of classifiers to perform the classification in databases. Therefore, researchers used Dagging of Ensemble Algorithms as a method for sorting out the evaluation by employing numerous base classifiers, and further integrate them into the best model with a vote. This study utilized four classifiers. They are C4.5/J48, Naive Bayes, Support Vector Machine, and Back-Propagation Neural Network. This study utilized the four databases of UCI as the test and evaluation of the experiment.