透過您的圖書館登入
IP:54.225.56.41
  • 學位論文

以機率式檢索方法達成程式元件之重複利用

Probabilistic Retrieval Methods for Program Component Reuse

指導教授 : 蘇豐文
若您是本文的作者,可授權文章由華藝線上圖書館中協助推廣。

摘要


程式元件的可重複利用性為物件導向程式語言的特色之ㄧ。但是在實務上,程式開發人員或許能輕易地重複利用標準函式庫、較為有名氣的函式庫以及自己所撰寫的程式碼。但卻很難有效率地重複利用他人所開發,散佈在網際網路上的程式元件。因為在重複利用他人的程式元件之前,我們必須透過作者所寫的註解或是追溯原始碼來了解如何使用,更重要的是必須要能在眾多的函式庫中,準確地找到符合需求的程式元件。目前已有許多的研究,在協助程式開發者自動擷取程式元件,但在使用上還是有許多的限制,例如:詢問要使用特定的語言描述。在本篇論文中,我們開發了一個程式元件自動檢索系統,從網路上取得的函式庫中,擷取出程式元件,並紀錄元件註解中所使用詞彙與元件原始碼中所使用的可重複利用元件兩者之間的關係。爾後當程式開發人員撰寫好要實作的程式元件註解之後,便可利用系統分析該註解,根據先前所建立的詞彙-元件關係,使用機率式檢索方法計算出,註解中的詞彙所對應相關元件的分數,利用該分數檢索可供重複利用的程式元件列表。最後我們設計了一個實驗,使用網路上所取得的函式庫,分別使用「詞彙頻率-逆元件頻率」與單純貝式分類器,進行回合式試驗來計算精確率與召回率,用以評估系統的效能。實驗的結果為,在檢索出的「可重複利用元件」列表取前20名時,平均精確率為64%,平均召回率為76%。

並列摘要


無資料

參考文獻


[22] Shih-Yao Yang, Szu-Yin Lin, Chi-Feng Lee, Shian-Luen Cheng and Von-Wun Soo. Extracting Domain Specific Terminologies from Patent Claims to Construct Domain Thesaurus and Ontology, The 36th International Conference on Computers and Industrial Engineering, 2006.
[1] Leo Breiman. Bagging predictors. Machine Learning, 24(2):123–140, 1996.
[2] C. W. Krueger. Software Reuse, ACM Computing Surveys, Vol. 24, No. 2, pp.131-183, June 1992.
[4] Java Language Keywords. Available:
[6] G. Salton and C. Buckley. Term-weighting approaches in automatic text retrieval. Information Processing & Management 24(5): 513–523, 1988

延伸閱讀