  • 學位論文


Mining the Structure and Content of Wikipedia for Automatic Textbook Prototyping

指導教授 : 吳世弘


維基百科(Wikipedia)快速地在全球成長,有愈來愈多的使用者參與建構以及使用維基百科的內容。但是,在維基百科中的知識是較為分散的,沒有一個可以讓使用者自訂知識概念的表達方式。另一方面,維基百科是維基媒體基金會(Wikimedia Foundation Inc., Wikimedia)旗下的一項國際性計劃,而維基教科書(Wikibooks)是維基百科的姐妹計劃。維基教科書這項計劃為收集自由的教科書,以及使用者所合作編輯完成的教科書,目的是為了完成一個內容開放的教科書計劃。 本篇論文將討論傳統建構教科書目錄(Table-of-Content, TOC)的流程與我們的自動化流程之間的差異。我們利用資訊檢索的技術,探討維基百科中條目與鏈結之間的關係,來自動化形成一個本體論知識雛型。將使用者輸入的關鍵字當作是一個本體論中的概念,並且利用搜尋的方法來找出其他有相關性的概念,並且使用基本的排序演算法來排序搜尋出來的概念,以構成一個類似於本體論的階層架構。我們期望這個系統可以應用於特定領域知識的整理,例如:協助編輯教科書的目錄,或是協助在維基教科書計劃上編輯自由教科書的使用者,能更快地產生有質量的教科書內容。 實驗結果表明,本篇論文的方法,可以幫助使用者快速地對於某一個知識領域有概念上的建構,並且可以對該目錄中的細項主題做進一步的擴張。未來將加入可讓使用者自訂細項主題編輯與自訂排序的功能,讓每個使用者都能藉由這樣的一個系統來完成一本教科書的目錄,進而擴展自己的知識領域來完成編輯一本教科書內容。


Wikipedia is the world’s largest collaboratively edited source of encyclopedic knowledge. Wikibooks is a sub-project of Wikipedia. The purpose of Wikibooks is to enable a free textbook to be edited by various contributors, in the same way that Wikipedia is composed and edited. However, editing a book requires more effort than editing separate articles. Therefore, how to help users cooperatively edit a book is a new research issue. In this paper, we investigate how to automatically extract content from Wikipedia and generate a prototype of a Wikibooks. Applying search technology, our system can retrieve relevant articles from Wikipedia. A table of contents is built automatically based on information retrieval and ordering algorithm. Our experiment shows that given a topic, our system can generate a table of contents, which can be treated as a prototype of a Wikibooks. We also proposed an evaluation method based on the comparison of system results to exist textbook.


[5] Darina Dicheva, Christo Dichev, “Authoring educational topic maps: can we make it easier?,” Fifth IEEE International Conference on Advanced Learning Technologies, ICALT 2005, pp. 216-218.
[10] Lev Muchnik, Royi Itzhack, Sorin Solomon, and Yoram Louzoun, "Self-emergence of knowledge trees: Extraction of the Wikipedia hierarchies," The American Physical Society, Phys. Rev. E 76, 016106.
[16] Wen-Chung Shih, Shian-Shyong Tseng, and Chao-Tung Yang, "Wiki-based rapid prototyping for teaching-material design in e-Learning grids," Comput. Educ, Nov, 2008, Vol. 51, No. 3, pp. 1037-1057.
[19] Alexander D. Wissner-Gross, “Preparation of Topical Reading Lists from the Link Structure of Wikipedia,” Sixth IEEE International Conference on Advanced Learning Technologies (ICALT''06), 2006, pp.825-829,
[1] 駱詩軒、駱詩富、鄧俊修,作業系統概念 (Operating System Concepts, 6/e Windows XP Update),台灣東華書局股份有限公司,2003,目錄頁
