簡易檢索 / 詳目顯示

研究生: 謝順宏
Shun-hong Sie
論文名稱: 臺灣歷史人物傳記數位人文系統設計與建置之研究
A Study on the Design and Establishment of an Digital Humanities Oriented Taiwan Biographical Database
指導教授: 柯皓仁
Ke, Hao-Ren
學位類別: 博士
Doctor
系所名稱: 圖書資訊學研究所
Graduate Institute of Library and Information Studies
論文出版年: 2020
畢業學年度: 108
語文別: 中文
論文頁數: 108
中文關鍵詞: 臺灣歷史人物傳記資料庫數位人文人物志文本探勘社會網絡分析
英文關鍵詞: TBDB, gazetteers, social analysis
DOI URL: http://doi.org/10.6345/NTNU202001515
論文種類: 學術論文
相關次數: 點閱:159下載:51
分享至:
查詢本校圖書館目錄 查詢臺灣博碩士論文知識加值系統 勘誤回報
  • 資訊科技高度發展所帶來的衝擊,數位資料的大量產出,也影響到研究者研究的進程與方法。面對到龐大的資料,資訊科技能輔助人文研究,達到節省時間、呈現隱藏關係的成效,過往幾年「數位人文」開始被提起並加以應用。數位人文指的是應用資訊科技於那些唯有透過資訊科技的輔助,才有辦法由浩如煙海的資料中探勘,並尋找研究的相關議題。
    方志用以記載一地之風土民情,本研究透過數位人文以輔助,建置臺灣歷史人物傳記資料庫,初期以《新修彰化縣志・人物志》做為勘考、建置架構的對象。透過資訊科技的引入及輔助,可協助對於地方志的研究過程、結果之解讀,擺脫以往文字或書面的型式,而歷史研究者可以由圖表概念著手,建立史觀並加以解釋。以瞭解並探究應用數位人文於地方志歷史研究,其研究、成果之解讀與呈現之系統需求。藉由運用資訊科技,宏觀地處理大量資料,獲得概觀的方向,供歷史研究者參考、判斷與解讀,或提供不同面向的觀點,並以視覺化的輔助處理,則可提供一個全新的視角,供歷史研究者參考。
    臺灣歷史人物傳記資料庫採三層式架構,區分為資料呈現、資料探勘及資料儲存與處理,另因應歷史學家研究之需求,發展出全文檢索,包含若干資料探勘、呈現之介面或功能,並處理老照片之人臉偵測,以協助標示老照片,並進行相關社群網絡探勘。此外,為便於對歷史人物能有更精確且統一的描述與知識的再利用,與便於和其它系統進行資訊的交換,本研究另提出建置臺灣近代歷史人物資料之知識本體,知識本體不僅能滿足現行資料庫之需求,更轉出特定鏈結資料格式,與外部系統交換。
    數位科技的優勢在於處理大量資料與呈現圖表,透過系統所提供的查詢介面、互動式圖表及探勘工具,可精省過去人工判讀所耗費的時間,將有限的時間投注於新的研究議題、或發掘潛在研究問題。

    Rapid development of information technology and the massive output of digital data has affected researchers’ research process and methods. Facing the huge data, information technology could assist humanities research, saving time and presenting hidden relationships. In the past, Digital Humanities has begun to be mentioned and applied. Digital Humanities refers to the application of information technology to those that can only be explored from the huge data with the assistance of information technology, and to find relevant topics in it for research.
    In this research, we establish a biographical database of Taiwanese historical figures, Taiwan Biographical Database (TBDB) from the lens of Digital Humanities; we develop a database and a set of analytical tools according to the characteristics of modern Taiwanese history and historical figures. TBDB can assist in the interpretation of the research process and results from these local gazetteers. One of the major purposes of developing the TBDB is to build a model for the exploration of Taiwan history, either through the prosopography, SNA, or GIS analyses.
    TBDB employs the n-tier architecture, and is divided into three layers, namely data presentations, data exploration, and data storage and processing. In addition, in response to the research needs of historians, a variety of functions have been developed, including full-text search, data exploration functions and presentation interfaces. A function that detects human faces from old photos is developed for helping mark old photos and conduct related social network exploration. In addition, in order to facilitate a more accurate and unified description of historical figures and the reuse of knowledge, as well as to facilitate the exchange of information with other systems, this research also proposes the establishment of an ontology of historical figures in Taiwan. The ontology can not only to meet the needs of the current database, it also transfers out a specific link data format for exchange with external systems.
    The advantage of digital technology lies in processing huge data and presenting charts. Through the query interface, interactive charts and exploration tools provided by TBDB, the time spent on manual interpretation in the past can be reduced, and historians can focus their time on discovering new research topics or potential research issues.

    謝辭 i 摘要 ii Abstract iv 目次 vi 表次 ix 圖次 xi 第一章 緒論 1 第一節 研究背景 3 第二節 研究動機 5 第三節 研究目的 6 第四節 研究範圍與限制 8 第五節 名詞解釋 8 第二章 文獻探討 10 第一節 數位人文的發展與定義 10 第二節 應用數位人文於輔助研究 14 第三節 中國歷代人物傳記資料庫 23 第四節 知識本體與鏈結資料 27 第五節 數位人文系統需求 30 第三章 數位人文系統建置 33 第一節 資料來源 33 第二節 系統架構與資料處理 36 第三節 系統說明 40 第四章 知識本體設計 46 第一節 設計目的 46 第二節 規劃設計 47 第三節 應用實例 54 第五章 研究輔助工具發展 64 第一節 命名實體辨識技術 64 第二節 自動化社群關係探勘 70 第三節 人物輔助偵測與識別 77 第四節 外部系統支援 83 第五節 系統介面與建檔支援 84 第六章 結論與建議 93 第一節 結論 93 第二節 建議 96 參考文獻 99

    CBETA數位研究平臺。檢自 http://cbeta-rp.dila.edu.tw/
    丹尼爾.羅森堡、安東尼.格拉夫頓(2018)。時光的製圖學:由時間軸拉開的人類文明史。臺北市:麥田。
    王汎森(2011)。數位人文學之可能性及限制──一個歷史學者的觀察。在從保存到創造:開啟數位人文研究(項潔編,頁25-36)(數位人文研究叢書,1)。臺北市:臺大出版中心。
    王志宇(2015)。大村鄉志.經濟志。彰化縣:彰化縣大村鄉公所。
    包弼德、夏翠娟、王宏甦(2018)。數字人文與中國研究的網絡基礎設施建設。圖書館雜誌,37(11),18-25。檢自https://projects.iq.harvard.edu/files/cbdb/files/the_digital_humanities_and_a_cyberinfrastructure_for_china.pdf
    江子揚、薛化元、劉吉軒、蔡銘峰、黃文全、甯格致(2014,12月)。數位人文脈絡下的史學應用研究─《自由中國》內涵之檢證與詮釋。在中央研究院數位文化中心、國立臺灣大學數位人文研究中心主辦,2014第五屆數位典藏與數位人文國際研討會,台北市。 檢自:http://www.dadh.digital.ntu.edu.tw/Agenda.php?LangType=tw&His=EKALM
    余英時(1979)。中國史學的現階段:反省與展望--代發刊辭。史學評論,1,1-24。
    李昭容、張素玢、顧雅文、李毓嵐(2018)。新修彰化縣志‧卷九‧人物志‧文化人物篇。彰化縣︰彰化縣政府。
    李毓嵐、顧雅文、張素玢、李昭容(2018)。新修彰化縣志‧卷九‧人物志‧政治人物篇。彰化縣︰彰化縣政府。
    系統簡介。中國歷代人物傳記資料庫。檢自http://db1.ihp.sinica.edu.tw/cbdb/help/systemintro.html
    林天蔚(1995)。方志學與地方史研究。臺北市:南天。
    建縣沿革。彰化縣政府網站。檢自http://www.chcg.gov.tw/ch/01us/01history.asp
    徐永明(2016)。中國古典文學研究的幾種可視化途徑---以湯顯祖研究為例。浙江大學學報(人文社會科學版網路版)。檢自 https://projects.iq.harvard.edu/files/cbdb/files/zhong_guo_gu_dian_wen_xue_yan_jiu_de_ji_chong_ke_shi_hua_tu_jing_mdash_mdash_yi_tang_xian_zu_yan_jiu_wei_li_.pdf?m=1464818686
    張俊盛(2014)。抄襲與反抄襲的戰爭。科學人雜誌,148,53-54。
    張素玢、李毓嵐、顧雅文、李昭容(2018)。新修彰化縣志‧卷九‧人物志‧經濟人物篇。彰化縣︰彰化縣政府。
    張素玢、李鈺淳(2011)。數位人文─學科對話與融合的新領域。在數位人文研究與技藝(項潔編,頁67-89)(數位人文研究叢書5)。臺北市:臺大出版中心。
    許雪姬(2010)。台灣史研究三部曲:由鮮學經顯學到險學。思想,(16),71-100。doi:10.29848/SX.201007.0004
    陳捷先(1998)。中國古方志學探論。台北市:聯經出版公司。
    陳淑君、凌苡家(2014)。建構數位藝術史的知識本體:對應方法研究。在中央研究院數位文化中心、國立臺灣大學數位人文研究中心主辦,2014第五屆數位典藏與數位人文國際研討會,台北市。檢自:http://www.dadh.digital.ntu.edu.tw/config_xml/2014config/programINFO/pdf/paper_04_01.pdf
    項潔(2011)。序。在數位人文研究與技藝(項潔編,頁67-89)(數位人文研究叢書5)。臺北市:臺大出版中心。
    項潔、涂豐恩(2009)。數位歷史如何可能--簡介臺大數位典藏研究發展中心之工作旨趣。臺大歷史學系通訊,3。檢自http://homepage.ntu.edu.tw/~history/public_html/09newsletter/03/03-08.html
    項潔、涂豐恩(2011)。導論─何謂數位人文。在從保存到創造:開啟數位人文研究(項潔編,頁9-28)(數位人文研究叢書,1)。臺北市:臺大出版中心。
    項潔、涂豐恩(2011)。導論—什麼是數位人文。在項潔編, 從保存到創造:開啟數位人文研究 (頁9-28)。臺北:國立臺灣大學出版中心。
    項潔、翁稷安(2011)。導論─關於數位人文的思考:理論與方法。在數位人文研究的新視野:基礎與想像(項潔編,頁10-18)(數位人文研究叢書,2)。臺北市:臺大出版中心。
    項潔、陳麗華(2011)。數位人文─學科對話與融合的新領域。在數位人文研究與技藝(項潔編,頁9-23)(數位人文研究叢書,5)。臺北市:臺大出版中心。
    黃克武(1984)。一個新的典範:《史學評論》代發刊辭的再反省。史學評論,8,153-168。
    葉智豪、王昱鈞、蔡宗翰(2011)。歷史文獻的命名實體擷取─結合主動學習法之半監督式模型。在從保存到創造:開啟數位人文研究(項潔編,頁131-144)(數位人文研究叢書,1)。臺北市:臺大出版中心。
    臺灣大學數位人文研究中心(2018)。DocuSky數位人文學術研究平台。檢自 https://docusky.org.tw/
    謝順宏、張素玢、柯浩仁(2019)。老照片中的人物群像:探討社會網絡的另一種途徑。在國立臺灣師範大學、臺灣數位人文學會、中央研究院數位文化中心主辦,2019第十屆數位典藏與數位人文國際研討會,台北市。 檢自:https://drive.google.com/file/d/1WY6wIWHQvBB2FRotJ5PmCpaXKiDN-oZO/view?usp=sharing
    劉吉軒、賴隆平(2011)。臺灣文官職等升遷預測。在從保存到創造:開啟數位人文研究(項潔編,頁113-130)(數位人文研究叢書,1)。臺北市:臺大出版中心。
    劉明德、林傑斌(2002)。地理資訊系統GIS理論與實務。臺北市:文魁資訊股份有限公司。
    鄭文惠(2014)。從人文到數位人文:知識微縮革命與人文研究範式的轉向。人文與社會科學簡訊,15(4),169-175。
    鄭樑生(2002)。史學方法。臺北市:五南。
    歷史學(2020年5月15日)。維基百科。檢自https://zh.wikipedia.org/wiki/%E6%AD%B7%E5%8F%B2%E5%AD%B8
    釋覺明(2013)。史學導論教材。取自http://rel2.nhu.edu.tw/download.php?filename=58_14ebf564.pdf&dir=personal_subject/&title=%E5%AE%97%E6%95%99%E5%8F%B2%E5%AD%B8%28102-1%29-%E6%95%99%E6%9D%90%E6%8F%90%E4%BE%9B%3A%E5%8F%B2%E5%AD%B8%E5%B0%8E%E8%AB%9650%E5%95%8F
    顧雅文、張素玢、李毓嵐、李昭容(2018)。新修彰化縣志‧卷九‧人物志‧社會人物篇。彰化縣︰彰化縣政府。
    Berners-Lee, T. (2006). Linked Data -Design Issues. Retrieved from http://www.w3.org/DesignIssues/LinkedData.html
    Berry, D. M. (2012). Introduction: Understanding the Digital Humanities. In D. M. Berry (Ed.). Understanding Digital Humanities (chap. 1, pp. 1-17). London: Palgrave Macmillan.
    Bird, S., Klein, E., & Loper, E. (2009). Natural language processing with Python. O'Reilly Media, Inc..
    Blei, D. M. (2012). Probabilistic topic models. Communications of the ACM, 55(4), 77-84.
    Borgman, C. L. (2009). The digital future is now: A call to action for the humanities. Digital Humanities Quarterly, 3(4). Retrieved from http://digitalhumanities.org/dhq/vol/3/4/000077/000077.html/000077.htm
    Bracewell, D.B., Ren, F., & Kuriowa, S. (2005). Multilingual single document keyword extraction for information retrieval. 2005 International Conference on Natural Language Processing and Knowledge Engineering (pp. 517-522), Wuhan, China. doi: 10.1109/NLPKE.2005.1598792
    Bradley, A., Kirton, T., Hancock, M., & Carpendale, M.S. (2016). Language DNA: Visualizing a Language Decomposition . Digital humanities quarterly, 10(4), 88-107.
    Chen, S.-P., Huang, Y.-M., Hsiang, J., Tu, H.-C., Ho, H.-T., & Chen, P.-Y. ( n.d.). Discovering land transaction relations from land deeds of Taiwan. Literary & Linguistic Computing, 28(2), 257-270.
    China Biological Database Project (CBDB) (2016a). Home. Retrieved from http://isites.harvard.edu/icb/icb.do?keyword=k16229&pageid=icb.page76535
    Choen, P. (2010). Digital Keys for Unlocking the Humanities’ Riches. The New York Times. Retrieved from http://www.nytimes.com/2010/11/17/arts/17digital.html?pagewanted=all&_r=0
    CIDOC Conceptual Reference Model. Retrieved from http://www.cidoc-crm.org/
    Decong Li, & Sujian Li (2011). Hypergraph-based inductive learning for generating implicit key phrases. In Proceedings of the 20th international conference companion on World wide web (WWW '11). Association for Computing Machinery, New York, NY, USA, 77–78. DOI:https://doi.org/10.1145/1963192.1963232
    Freure, N. (2012). Author Consolidation across European National Bibliographies. In J. C., Meister (Ed.), Digital Humanities 2012: Conference Abstracts (pp. 385-387). Carl von Ossietzky, Germany: Hamburg University Press.
    Gibbs, F. (2013). Digital Humanities Definitions by Type. In M. Terras, J. Nyhan, & E. Vanhoutte. (Eds.). Defining Digital Humanities: A Reader (chap.21, pp. 289-297). Burlington, VT: Ashgate Publishing Company
    Grier, R. A., Bangor, A., Kortum, P., & Peres, S. C. (2013). The System Usability Scale : Beyond Standard Usability Testing.. Proceedings of the Human Factors and Ergonomics Society Annual Meeting, 57(1): 187-191.
    Gruber, T. R. (1993). A translation approach to portable ontology specifications. Knowledge Acquisition, 5(2), 199-220.
    Guha, R.V., Brickley, D., & Macbeth, S. (2016). Schema.org: evolution of structured data on the web. Communications of the ACM, 59(2), 44-51.
    Haythornthwaite, C. (1996). Social network analysis: An approach and technique for the study of information exchange. Library and Information Science Research, 18(4), 323-342.
    Haythornthwaite, C. (2009). Social networks and information transfer. In Encyclopedia of Library and Information Sciences (3rd ed., pp. 4837-4847). New York: Taylor and Francis.
    Hearst, M. A. (1998). Support vector machines. IEEE Intelligent Systems and their Applications, 13(4), 18-28.
    Hey, T., Tansley, S., & Tolle, K. (Eds.). (2009). The fourth paradigm: Data-intensive scientific discovery. Retrieved from http://research.microsoft.com/en-us/collaboration/fourthparadigm/
    Ho, Hou Ieong Brent, & Hilde De Weerdt. MARKUS. Text Analysis and Reading Platform. 2014- http://dh.chinese-empires.eu/beta/ Funded by the European Research Council and the Digging into Data Challenge.
    Hockey, S. (2004). The History of Humanities Computing. In S. Schreibman, R. Siemens, & J. Unsworth. (Eds.). A Companion to Digital Humanities. Oxford: Blackwell.
    Jeff Sauro. (2015). SUPR-Q: A Comprehensive Measure of the Quality of the Website User Experience. Journal of Usability Studies 10(2): 68-86.
    Jeffrey Heer, Stuart K. Card, & James A. Landay (2005). prefuse: a toolkit for interactive information visualization. In Proceedings of the SIGCHI conference on Human factors in computing systems (pp. 421-430). Portland, Oregon, USA: ACM.
    Juola, P. (2008), Killer Applications in Digital Humanities. Literary and Linguistic Computing: Journal of the Association for Literary and Linguistic Computing, 23(1), 73-83.
    Kohonen, T. (1998). The self-organizing map. Neurocomputing, 21(1-3), 1-6.
    Lee, J., & Lee, J. (2017). Shakespeare’s Tragic Social Network; or Why All the World’s a Stage. DHQ: Digital humanities quarterly, 11(2), 201.
    Liu, A. (2011). The State of the Digital Humanities: A Report and A Critique. Art and Humanities in High Education, 11(1-2), 8-40.
    Markus L. (2013). Creating 3rd Generation Web APIs with JSON-LD and Hydra, Markus Lanthaler. In Proceedings of the Proceedings of the 22nd International World Wide Web Conference (WWW2013)(pp. 35-37). Rio de Janeiro, Brazil: ACM Press.
    Markus L., & Christian G. (2013). Model Your Application Domain, Not Your JSON Structures. In Proceedings of the 4th International Workshop on RESTful Design (WS-REST 2013) at WWW2013(pp. 1415-1420). Rio de Janeiro, Brazil: ACM Press.
    Michael B., & Jeffrey H..(2009). Protovis: A Graphical Toolkit for Visualization. IEEE Transactions on Visualization and Computer Graphics (Proc. InfoVis'09), 15(6), pp. 1121-1128.
    Ming Qing Women's Writings(明清婦女著作資料庫), McGill University. Home. Retrieved from http://digital.library.mcgill.ca/mingqing/
    Murrieta-Flores, P., Donaldson, C., & Gregory, I. (2017). GIS and Literary History: Advancing Digital Humanities research through the Spatial Analysis of historical travel writing and topographical literature. DHQ:Digital humanities quarterly, 11(1), 1.
    Natalya F. N., & Deborah L. M. (2001). Ontology Development 101: A Guide to Creating Your First Ontology. Stanford Knowledge Systems Laboratory Technical Report KSL-01-05 and Stanford Medical Informatics Technical Report SMI-2001-0880.
    Newman, M. E. J. (2003). The structure and function of complex networks. Retrieved from http://www-personal.umich.edu/~mejn/courses/2004/cscs535/review.pdf.
    Péoux, G., & Houllier, J.-R. (2017). To Visualize Past Communities: A Solution from Contemporary Practices in the Industry for the Digital Humanities. DHQ: Digital humanities quarterly, 11(2), 248.
    Ruecker, S., Radzikowska, M., & Sinclair, S. (2009). Designing Data Mining Droplets: New Interface Objects for the Humanities Scholar. Digital Humanities Quarterly, 3(3). Retrieved from: http://digitalhumanities.org/dhq/vol/3/3/000067/000067.html
    Schema.org mark-up in WorldCat.org. Data sets & services. Retrieved from https://www.oclc.org/developer/develop/data-sets.en.html
    Snow, C. P. (1959). The Two Cultures. Cambridge, MA: Cambridge University Press.
    Suárez, J. L., & Sancho-Caparrini, F. (2013). A Digital Geography of Hispanic Baroque Art. In J. C., Meister (Ed.), Digital Humanities 2012: Conference Abstracts (pp. 385-387). Carl von Ossietzky, Germany: Hamburg University Press.
    Svensson, P. (2010). The Landscape of Digital Humanities. Digital humanities quarterly, 4(1).
    Tenopir, C., Allard, S., Douglass, K., Aydinoglu, A. U., Wu, L., Read, E., Manoff, M., & Frame, M. (2011). Data sharing by scientists: practices and perceptions. PloS one, 6(6), e21101. Retrieved from https://doi.org/10.1371/journal.pone.0021101
    The Digital Humanities Manifesto 2.0. Retrieved from http://humanitiesblast.com/manifesto/Manifesto_V2.pdf
    Thomas, W. G. (2004). Computing and the historical imagination. In S. Schreibman, R. Siemens, & J. Unsworth, (Eds.), A companion to digital humanities, Blackwell Publishing, Oxford.
    Wetherell, C. (1998). Historical social network analysis. International Review of Social History, 43(S6), 125-144.

    下載圖示
    QR CODE