透過您的圖書館登入
IP:18.189.193.172
  • 學位論文

RAS Classifier – 一個適用於生物學資料二元以及多元分類的整合型機器學習網站

RAS Classifier – an integrated machine learning web server applied to binary and multinomial classification of biological data

指導教授 : 羅惟正

摘要


我的研究的主要目的是建造一個二元以及多元分類器的網站,可供科學家用來進行各類預測。它具備了簡易,親切的使用介面外,使用者在使用此網站時不需要安裝任何特別的軟體。這個網站提供了幾種不同的機器型學習方法,且各方法都會提供使用者一個簡單易懂、可判斷預測結果可信度的分數。總共有三個機器型學習方法,包括 support vector machine (SVM), random forest (RF) 和 artificial neural network (ANN)。SVM是以LIBSVM這個工具來完成,RF是由以C4.5建構的 decision tree (DT) 為基礎而建造出,ANN則使用了Fast Artificial Neural Network這個函式庫來實作。這幾種機器型學習方法不但可以被單獨使用,也可以合併使用。當使用兩種以上機器型學習方法去預測資料,系統會幫使用者計算最後所得到的結果,且提供預測之可信度供使用者參考。資料格式上,此系統接受三種不同資料格式,讓使用者依個人方便準備原始資料。格式分別是:LIBSVM, C4.5和FANN的檔案資料格式。這三種資料格式不會隨著使用者選擇的建模(training)方法而受影響,使用者不需要自行做格式轉換。

關鍵字

機器學習

並列摘要


The main goal of this work is to construct a machine learning web server capable of performing binary and multinomial classifications and is well-suited to be applied to the biological researches in which predictions shall be made. This system is named the “RAS classifier”. The web server provides a user-friendly interface. There is no need for users to install any particular software before using the service. In addition, the web server provides three different machine learning methods — random forests (RFs), artificial neural networks (ANNs), and support vector machines (SVMs) — and each of these methods provides a simple score for users to determine the credibility of the prediction. Two datasets are used to assess the performance of the RAS classifier: a circular permutation (CP) site dataset, and a three-dimensional (3D) domain-swapping dataset. The RAS classifier is accessible at http://140.113.15.116/.

並列關鍵字

machine learning

參考文獻


[2] Mehryar Mohri, Afshin Rostamizadeh, Ameet Talwalkar,”Foundations of Machine Learning”, The MIT Press, 2012.
[3] S. Kotsiantis, "Supervised learning: A review of classification techniques," Informatica, vol. 31, pp. 249-268, 2007.
[4] P. Sajda, "Machine Learning for Detection," Annu Rev Biomed Eng, p. 29, 7 4 2006.
[5] D.-U. R and A. d. A. S., "Gene selection and classification of microarray data using random forest.," BMC Bioinformatics, 6 1 2006.
[6] W.-C. Lo, L.-F. Wang and Y.-Y. Liu, "CPred: a web server for predicting viable circular," Nucleic Acids Research, 11 6 2012.

被引用紀錄


鄭見文(2016)。植基於SVM之氣象資訊對美髮沙龍洗療護產品銷量預測分析-以台中市為例〔碩士論文,國立臺中科技大學〕。華藝線上圖書館。https://www.airitilibrary.com/Article/Detail?DocID=U0061-2708201612431900

延伸閱讀