語碼轉換是指在一段話或是一段文字中交替使用兩種以上語言。基本上不同語者、不同對話內容、不同語言組合都可能有不同的語碼轉換風格與特性。雖然語碼轉換在自然語言中出現頻繁,但相較於單一語言,語碼轉換的語料相當缺乏。 本論文目標是發展一種非監督式的技術來自動產生語碼轉換的語料,並在兩套中文為主位語言、英文為客位語言的語碼轉換資料集上實驗驗證。本論文的方法是藉由生成對抗網路以及梯度策略演算法,從單一語言的文句 (主位語言) 預測適合的語碼轉換位置,將這些位置以詞翻譯為客位語言後產生句內語碼轉換的文句,並用以作為語言模型的增強訓練語料。結果顯示本論文所提出的方式能夠小幅度改善語言模型,並小幅降低語音辨識系統的客位語言的錯誤率。