MAT-A Project to Collect Mandarin Speech Data through Telephone Networks in Taiwan




Hsiao-Chuan Wang

Key Words

Mandarin speech ; Speech database ; Speech I/O systems assessment ; Telephone network



Volume or Term/Year and Month of Publication

2卷1期(1997 / 02 / 01)

Page #

73 - 89

Content Language


English Abstract

A cooperative project, called ”Polyphone”, was initiated by the Coordinating Committee on Speech Databases and Speech I/O Systems Assessment (COCOSDA) in 1992. Accordingly, a project to collect Mandarin speech data across Taiwan (MAT) was conducted by a group of researchers from several universities and research organizations in Taiwan. The purpose was to generate a speech corpus for the development of Mandarin-based speech technology and products. The speech data were collected at eight recording stations through telephone networks. The speakers were chosen so as to reflect the population of the gender, the dialect, the educational level, and the residence .in Taiwan. A preliminary Mandarin speech database of 800 speakers has been produced. The final goal is to generate a speech database of at. least 5000 speakers.

Topic Category 人文學 > 圖書資訊學
基礎與應用科學 > 資訊科學
工程學 > 電機工程
  1. Wang、 Y. R.,Hwang, S. H.,陳順孝, S. H.(1996).ICSLP'96.
  2. Boldea, M.,Doroga, A.,Dumitrescu, T.,Pescaru, M.(1996).ICSLP'96.
  3. Chan, D.(1995).EUROSPEECH'95.
  4. Damhuis, M.(1994).ICSLP'94.
  5. Falcone, M.,Gallo, A.(1996).ICSLP ' 96.
  6. Godfrey, J.(1994).Polyphone: Second Anniversary Report.
  7. Godfrey, J.,Bernstein, J.,Taussig, K.(1994).ICASSP'94.
  8. Haeb-Umbach, R.,Langmann, D.,Boves, L.,den Os, E.(1996).ICSLP'96.
  9. Hess, W.,Kohler, K. J.,Tillmann, H. G.(1995).EUROSPEECH ' 95.
  10. Lamel, L. F.(1994).ICSLP '94.
  11. Lee, J. C.,Hahn, M.,Lee, Y. J.,Kim, S.(1996).ICSLP'96.
  12. Lee, L. S.(1995).ICASSP ' 95.
  13. Mariani, J.(1992).Proceedings of the 1992 Workshop of the International Coordinating Committe on Speech Databases and Speech I/O Systems Assessment.
  14. Misheva, A.(1995).EUROSPEECH ' 95.
  15. Nakama, T.,Arai, N.,Fujimura, N.,Kudo, I.(1994).ICSLP ' 94.
  16. Roach, P.(1996).ICSLP ' 96.
  17. Rosenbeck, P.(1994).ICSLP ' 94.
  18. Tapias, D.,Acero, A.,Esteve, J.,Torrecilia, J. C.(1994).ICSLP'94.
  19. Tapias, D.,Torre, C.,Hernandez-Gomez, L.(1995).ERUOSPEECH ' 95.
  20. Tseng, C. Y.(1995).A Phonetically Oriented Speech Database for Mandarin Chinese.ICPhS ' 95,3,326-329.
  21. Wang, J. F.,Huang, C. C.(1994).A Mandarin Speech Dictation System Based on Neural Network and Language Processing Model.IEEE Trans. Consumer Electronics,40(3),437-445.
  22. Wang, R. H.,Xia, D.,Ni, J.,Liu, B.(1996).ICSLP ' 96.
Times Cited
  1. 鄭竹勝(2007)。以多階層向量量化為基礎之語者辨識。淡江大學電機工程學系碩士班學位論文。2007。1-71。 
  2. 王貞英(2011)。台灣青少年所使用的流行語之研究。清華大學臺灣研究教師在職進修碩士學位班學位論文。2011。1-85。 
  3. 林秉正(2002)。使用適應性區間模型於語者說話速度之調整。成功大學資訊工程學系學位論文。2002。1-70。
  4. 洪倩玉(2003)。建立動態線性鑑別式分析於線上人臉辨識與驗證。成功大學資訊工程學系學位論文。2003。1-93。
  5. 王獻章(2004)。實用對話系統之強健性研究。成功大學資訊工程學系學位論文。2004。1-119。
  6. 廖惇利(2006)。用於語音情緒辨識的混和類神經網路模型之發展。成功大學資訊工程學系學位論文。2006。1-79。
  7. 李奇峰(2008)。中英混語辭彙不特定語者語音辨識器嵌入式系統設計研究。成功大學電機工程學系學位論文。2008。1-46。
  8. 周至宏(2009)。基於ARM920T之HTK關鍵模組定點數演算法研究與實現。成功大學電機工程學系學位論文。2009。1-59。
  9. 陳宥任(2011)。適合實際應用的多語音模型之中英語音辨識系統設計與實現。成功大學電機工程學系學位論文。2011。1-47。
  10. 黃得勝(2015)。基於頻譜變化偵測的盲音素分割。清華大學電機工程學系所學位論文。2015。1-90。