The Formosan Language Archive: Linguistic Analysis and Language Processing




Elizabeth Zeitoun;Ching-Hua Yu

Key Words

Formosan languages ; Formosan Language Archive ; corpora ; linguistic analysis ; language processing



Volume or Term/Year and Month of Publication

10卷2期(2005 / 07 / 01)

Page #

167 - 199

Content Language


English Abstract

In this paper, we deal with the linguistic analysis approach adopted in the Formosan Language Corpora, one of the three main information databases included in the Formosan Language Archive, and the language processing programs that have been built upon it. We first discuss problems related to the transcription of different language corpora. We then deal with annotation rules and standards. We go on to explain the linguistic identification of clauses, sentences and paragraphs, and the computer programs used to obtain an alignment of words, glosses and sentences in Chinese and English. We finally show how we try to cope with analytic inconsistencies through programming. This paper is a complement to Zeitoun et al. [2003] in which we provided an overview of the whole architecture of the Formosan Language Archive.

Topic Category 人文學 > 圖書資訊學
基礎與應用科學 > 資訊科學
工程學 > 電機工程
  1. Adelaar, K.A.,E. Zeitoun,P. J.-K. Li(1999).Selected Papers from the Eighth International Conference of Austronesian Linguistics.Taipei:Academia Sinica.
  2. Bird, S.,G. Simons(2003).Language.
  3. Blust, R..The Austronesian Languages.
  4. Blust, R.(2003).Thao dictionary.Taipei:Academia Sinica.
  5. Bow, C.,B. Hughes,S. Bird(2004).Proceeding of EMELD 2004: the Workshop on Linguistic databases and best practice.Detroit, Michigan:
  6. Chu, T.-H.(2003).Saisiyat texts.
  7. Early, R.,J. Whitehorn(2003).One hundred Paiwan texts.Canberra:Australian National University.
  8. Fey, V.(1993).O'Orip no' - Amis Ameizu wenhua - Amis Culture.Taipei:Taiwan Bible Society.
  9. Hockey, S.,J. Lawler,H. Aristar-Dry(1998).Using Computers in Linguistics: A Practical Guide.London:Routledge.
  10. Hsin, T.-H.(2002).Maga (Rukai) texts.
  11. Hua J.-J.(2005).Southern Paiwan texts.
  12. Jacobson, M.,B. Michailovsky,B. Lowe(2000).Speech Communication.
  13. Leech, G.,G. Myers,J. Thomas(1995).Spoken English on Computer.New York:Longman Publishing.
  14. Li, P. J.-K.(1992).Orthographic systems for Formosan languages.Taipei:Ministry of Education.
  15. Li, P. J.-K.(1999).The history of Formosan aborigines. Linguistic, Nantou.Taiwan:The Historical Research Commission of Taiwan Province.
  16. Li, P. J.-K.(1975).Rukai Texts.Taipei:Academia Sinica.
  17. Li, P. J.-K.,S. Tsuchida(2002).Pazih texts and songs.Taipei:Academia Sinica.
  18. Rau, V. D.,P. J.-K. Li,Y.-C. Lin(1995).The Languages of the Austronesian tribes of Taiwan.Taipei:Ministry of Education, ROC.
  19. Szakos, J.,U. Glavitsch(2004).Proceeding of EMELD 2004: the Workshop on Linguistic databases and best practice.Michigan:Detroit.
  20. Tseng, S.-Q.(1998).zouguo shikong de yueliang.Taipei:Chen-hsing Publ. Co..
  21. Tsuchida, S.(2003).Kanakanavu Texts (Austronesian Formosan).Kyoto:Nakanishi Printing Co..
  22. Tung, M.-N.,V. Rau(2002).Yami text.
  23. Tung, T.-H.(1964).A descriptive study of the Tsou Language, Formosa.Taipei:Academia Sinica.
  24. Venezky, R. L.(1970).Principles for the design of practical writing systems.Anthropological Linguistics,12(7),256-270.
  25. Ye, Y.-T.(2003).Atayal texts.
  26. Yu, C.-H.(2002).Proceeding of the First workshop on the Digital Library Projects.Taipei:
  27. Zeitoun, E.(2004).Tona texts.
  28. Zeitoun, E.(2005).The Formosan Language Archive: Linguistic analysis and language processing.
  29. Zeitoun, E.,C.-H. Yu(2004).Proceeding of 1st International Joint Conference on Language Language Processing (IJCNLP-04) Fourth Workshop on Asian Language Resources.
  30. Zeitoun, E.,C-H. Yu,C.-X. Weng(2003).The Formosan Language Archive: development of a multimedia tool to salvage the languages and oral traditions of the indigenous tribes of Taiwan.Oceanic Linguistics,42(1),218-232.
  31. Zeitoun, E.,H.-C. Lin(2004).We should not forget the stories of the Mantauran: Traditional folktales.
  32. Zeitoun, E.,H.-C. Lin(2003).We should not forget the stories of the Mantauran: Memories of the past.Taipei:
Times Cited
  1. 陳玫瑾(2015)。論漢語『行』之主觀性用法--以情態用法及誇飾用法為例。成功大學外國語文學系學位論文。2015。1-115。 
  2. 陳伯青(2015)。台灣閩南語「遘」的語法化和詞彙化。清華大學語言學研究所學位論文。2015。1-120。 
  3. 黃維晨(2012)。佳興排灣語動詞構詞研究。清華大學語言學研究所學位論文。2012。1-288。 
  4. 陳銀玲(2011)。宜蘭縣泰雅語音韻研究。清華大學語言學研究所學位論文。2011。1-187。 
  5. 周一銘(2008)。賽夏語疑問詞問句及其左緣結構之研究。清華大學臺灣研究教師在職進修碩士學位班學位論文。2008。1-210。 
  6. 陳怡君(2006)。閩南語指示位移動詞「來」、「去」語意及格式之研究。清華大學語言學研究所學位論文。2006。1-109。 
  7. 史家麟(2012)。霧台魯凱語格位標記有無探討。臺灣大學語言學研究所學位論文。2012。1-107。 
  8. 劉威辰(2011)。自由的追尋:閱讀雅克慎閱讀索緒爾。臺灣大學外國語文學研究所學位論文。2011。1-106。 
  9. 劉雅玲(2010)。台灣原住民國語流行歌詞之旅程隱喻研究。臺灣大學語言學研究所學位論文。2010。1-188。 
  10. 落合泉(2009)。賽德克語代名詞研究。臺灣大學語言學研究所學位論文。2009。1-74。 
  11. 洪媽益(2009)。Cebuano功能參考語法。臺灣大學語言學研究所學位論文。2009。1-697。 
  12. 黃舒屏(2008)。多義詞的分析及其在語料庫標記的應用: 以賽夏語為例。臺灣大學語言學研究所學位論文。2008。1-271。 
  13. 沈文琦(2008)。撒奇萊雅語句法結構初探。臺灣大學語言學研究所學位論文。2008。1-152。 
  14. 沈嘉琪(2005)。噶瑪蘭語反身詞與交互句型之研究。臺灣大學語言學研究所學位論文。2005。1-106。 
  15. 葉玉慧(2005)。國家文學的生物符號學架構:新加坡作品舉隅。臺灣大學外國語文學研究所學位論文。2005。1-244。 
  16. 郭維茹(Wei-Ju Kuo)(2015)。臺灣閩、客語使成述補結構中的虛指代詞「伊/佢」。臺大中文學報。(50)。117-153。 
  17. 施姵如(2007)。萬大泰雅語疑問句型之研究。臺灣師範大學英語學系學位論文。2007。1-134。
  18. 張中揚(2010)。論郡社布農語的疑問句構。臺灣師範大學英語學系學位論文。2010。1-182。
  19. 賴鶊文(2010)。中文假設句的語用功能。臺灣師範大學英語學系學位論文。2010。1-133。
  20. 吳政穎(2012)。以優選理論分析西拉雅語重疊詞。臺灣師範大學英語學系學位論文。2012。1-88。
  21. 李信賢(2016)。比較臺灣手語與中文手語的音韻系統。中正大學語言學研究所學位論文。2016。1-196。
  22. 徐富美(2017)。從語篇看古漢語隱性成分功能──以系統功能語言學為角度。清華大學中國文學系學位論文。2017。1-209。