Have library access?
IP:44.211.26.178

數位典藏與數位人文/Journal of Digital Archives and Digital Humanities

  • OpenAccess

臺灣數位人文學會 & Ainosco Press,正常發行

5-year IF 0.087
0.087 2023 年
Discipline Ranking
圖書資訊學 9
歷史 20
Provided by Academic Citation Index

Choose issue


0 selected
  • Journals
  • OpenAccess

In this paper we introduce "DocuWidgets," a collection of toolkits comprised of several DocuSky widgets in the form of JavaScript packages. Developers can use them to directly access data from the DocuSky server without having to cope with the formats of Web Application Programming Interfaces (APIs). We will present our system design and discuss how the data are processed. We will then demonstrate the advantages of using DocuWidgets over Web APIs from the perspective of developers. Finally, we modify some drawbacks in current DocuWidgets and propose some handy functions for developers to use. We believe that the proposed design would expedite the development process of tools for DocuSky.

  • Journals
  • OpenAccess

《朝鮮王朝實錄》(조선왕조실록)為許多漢語和韓語學者研究朝鮮歷史的主要素材之一,其原先數位化的檔案除了考驗漢語使用者的韓文能力外,在本質上也更接近展示用途,對學者的研究造成限制。DocuSky數位人文學術研究平台,其提供使用者建立個人典藏庫,上面提供輔助使用者進行文字探勘的工具。文中會挑選幾個轉換過程中遇到的挑戰來說明,這些問題往往除了資料結構映射外,還得根據使用者的觀點、學者研究需求,來進行多方面的考量。除了闡述文本轉換成DocuSky公開庫過程中部分設計的構思和原因,同時也解析數位化《朝鮮王朝實錄》的XML格式,並且將其與DocuSky現行的格式標準DocuXML對比,以資訊科學的角度對兩個不同數位歷史文件以數據層面進行分析。同時驗證目前DocuSky的架構,遇上不同格式、相異體系的檔案時的相容性。

  • Journals
  • OpenAccess

人文研究經常需從研究的文本中,盡可能找出有意義詞彙。詞彙擷取方法是指能夠從數位化文本中,擷取出有意義詞彙的演算法。詞夾子方法是一種半自動的詞彙擷取演算法,它在詞彙擷取的過程中,除了利用電腦進行大量的字串比對,也需要人力介入以提升擷詞成效。本文討論擷詞工具2020。我們先回顧詞夾子方法的原理,說明2015年所開發的詞夾工具在實務操作上的侷限,然後討論新版工具解決這些問題的方式。我們以《熱蘭遮城日誌》第三冊為文本,進行「村社名、人名、船名、日期字串、身分職稱、貨物名稱」等六種類型詞彙的擷詞實驗。這項實驗證實擷詞工具2020可在實務上幫助研究者有效擷取詞彙。最後,我們簡單討論擷詞成果的可能應用,以及未來的改進方向。

  • Journals
  • OpenAccess

對讀,意指對照不同文本,進行對比式的閱讀。需要這種形式閱讀的例子很多,譬如比較同一本書的不同版本或不同語言的翻譯。中國古籍中常有不同的注釋,同時閱讀不同層次的注釋也是一種對讀。透過對讀,人文研究者可以清楚而快速的掌握不同文本間的差異,並對此差異做更深入的探討與分析。本文試圖開發一個對讀工具,利用資訊技術將不同而對應的文本並排在同個頁面,透過點選的方式快速檢視相對應的段落,以期降低紙本對讀的繁瑣性。我們的工具利用DocuSky所開發的DocuXML標準,引進Align-Tag作為內文段落間的對讀錨點,使得文件除了透過詮釋資料的對應外,亦可透過段落ID的對應來進行對讀。目前已實現的應用實例,包括歷史文本(春秋三傳)、翻譯對照(唐詩原文與白話翻譯)與版本對照(《聖經》)。

  • Journals
  • OpenAccess

電子文本的詞彙標記常被認為是數位人文研究的基礎工作,荷蘭萊頓大學的「碼庫思古籍半自動標記平台」(MARKUS)的問世,代表了不具備資訊技術的人文學者也能夠在電子文本上進行詞彙標記,再利用合適的數位工具達到詞彙的資源參照、聚合與消歧的目的。然而當電子文本規模增加,詞彙種類與數量增多時,單純使用MARKUS的標記方式顯得有點緩不濟急。本文介紹由杜協昌博士開發的DocuSky批次標記工具,藉由對該工具的開發理念與標記原理,說明如何運用這個工具加速對電子文本的標記以及如何透過工具內的許多功能來達到更精確的標記成果,以消除人文學者對批次標記的疑慮,並以中文和合本《聖經》的標記作為範例,說明如何針對這樣結構與內容的文本進行整理、分件、標記與分析。

  • Journals
  • OpenAccess

《洛陽伽藍記》是最早的佛寺志,其內容以佛寺為框架,生動描繪北魏末期洛陽城中的佛教文化、各類人物與活動。本文將說明藉由DocuSky數位人文學術研究平台,將《洛陽伽藍記》電子文本轉換為資料庫的過程與現象分析。嘗試以數位人文的方法梳理文獻,將研究者的日常研究成果轉換為資料庫,結構性地呈現文本內容及其重要資訊,藉由資料庫分析與排列資料的功能,讓研究者可以從更加高廣的角度觀察往常受到忽視的訊息,以達到挖掘多元的材料與研究方向的目的。