透過您的圖書館登入
IP:3.138.202.226
  • 學位論文

讓格書寫的台語自動標音初探

An Initial Study on Automatic Phonetic Annotations of Taiwanese in LangGeh Orthography

指導教授 : 江永進

摘要


本文 主要在 探討 讓格書寫下的 台文 自動標音。 在 順向長詞優先(Forward Maximal Matching) 斷詞標音的 基礎上, 我們討論 高頻音、 位置修正的 改善。 接著, 使用 含拼音的 台華平行 語料庫, 藉由 平行斷詞, 自動抽取 含拼音的 新詞條(PSi詞典), 藉以 改善 自動標音的 效率。 文中 並比較 讓格書寫 與 無間書寫的 標音效果 差異。

並列摘要


With Taiwanese text written in LangGeh orthography, we study the automatic phonetic annotations of the text. Compared to the baseline case that uses Daiim phonetic dictionary (Chiang 2002) and forward maximal matching, we study some possible improvements using various information extracted from corpus: using high frequency phones of single characters as well as multi-syllabic words, positional information of a character in a LangGeh phrase, and additional phonetic dictionary extracted from parallel corpus. Due to limitation of corpus size, only high frequency phones of characters exhibits significant improvement in our experiments.

參考文獻


[10] 楊佩琦(2009)。「讓格書寫下統計式台華翻譯初探」。新竹:國立清華大學統
“A Statistical Approach to Machine Translation,” Computational Linguistics
Volume 16, Number 2, June 1990.
[9] 林淑卿(2009)。「從台華平行語料庫擷取對應詞組典」。新竹:國立清華大學
[1] CKIP詞典

被引用紀錄


吳戴任(2011)。論前音節輸入法〔碩士論文,國立清華大學〕。華藝線上圖書館。https://doi.org/10.6843/NTHU.2011.00667
王建傑(2013)。讓格書寫下 之 斷詞探討〔碩士論文,國立清華大學〕。華藝線上圖書館。https://www.airitilibrary.com/Article/Detail?DocID=U0016-2511201311361262

延伸閱讀