透過您的圖書館登入
IP:18.118.126.94
  • 期刊

AI人工知能による個性的翻訳の可能性-小説の日中翻訳を例に-

以AI人工智慧進行個性翻譯的可行性:以小說為文本的日中翻譯為例|Possibility of stylish translation using artificial intelligence: the case of novel translation from Japanese to Chinese

摘要


本研究の目的は,特定の翻訳者の手による訳文とその原作をAIに学習させることで,AIは当該翻訳者と同じようなスタイルの訳文を生成できるかどうかを明らかにすることである。機械翻訳の実験は筆者が訳した日本語の小説を材料にして2段階に分けて行った。第1段階ではPyTorch Chatbotを以てテキストデータの機械学習を行ってから,データの日本語部分を使って翻訳テストを試みた。データセットを作成する際,日本語と中国語の文構造の相違を考慮して日本語のテキストに多くの修正を入れたが,却ってニューラル機械翻訳モデルの性能発揮を妨げたようである。学習データ量不足の問題も加わって,この実験では良い結果は得られなかった。が,PyTorch Chatbotの特性を把握でき,僅かながらも「個性的翻訳(スタイリッシュトランスレーション)」の可能性が確認できた。第2段階では,PyTorch ChatbotとTensor2Tensorを使用し,より語彙量の多いデータセットで機械学習を行い,そして翻訳テストの結果をBLEU値で測定した。実験は,Tensor2Tensorを使用した短文の翻訳では,BLEU値が1,即ち参照訳と同様な訳文を得ることに成功した。以上により,PyTorch Chatbotに比べ,Tensor2Tensorはより本研究に適している翻訳モデルだと考え,AIが個性のある訳文を生成する可能性は否定できないと結論付ける。

並列摘要


本研究主旨在測試AI是否能藉由只訓練單一譯者的譯文與其原文,便能如同該譯者所譯出的譯文般,擁有該譯者獨特個性的筆調。本研究使用筆者所譯之日文小說為測試材料,進行了兩次不同階段的實驗。第一階段實驗使用PyTorch Chatbot訓練中日文平行語料並以原文的日文做AI翻譯測試。其中在語料製作上,有鑒於日文與中文在造句結構上的差異而對日文語料做了許多加工與修整,但似乎反而妨礙了AI的機制與性能。加上語料的份量不足,在本階段實驗中並沒有得到預期的結果。但是掌握了類神經機器翻譯的特性,也有些許測試結果已顯示「個性翻譯」是可行的。第二階段實驗使用PyTorch Chatbot和Tensor2Tensor兩種機器翻譯模組來訓練更多的平行語料,並加入BLEU值以評價翻譯測試結果的優劣。從第二階段的實驗結果可知,使用Tensor2Tensor時,在短文測試能得到BLEU值為1的結果,也就是說AI譯出了與目標句相同的譯文。本研究得到兩個結論,一是實驗結果顯示AI可能仿效單一譯者的譯文,譯出與該譯者相近筆調的文章,二是確認了Tensor2Tensor在性能上比PyTorch Chatbot更適用於本研究。|The purpose of this study is to test whether modern artificial intelligence (AI) technologies can learn the unique style of a translator. That is, by training with the source text and its target translation from a single translator, can the system learn to translate like the specific translator? As the dataset, a Japanese novel is used, along with its Chinese translation by one of the authors. Two stages of experiments are conducted. First, a model from the PyTorch Chatbot package is trained on the Japanese-Chinese parallel dataset and tested for translation. During the data preparation, a lot of preprocessing is made to accommodate the difference in sentence structures between Japanese and Chinese. Due to the accommodation and lack of a sufficient dataset, expected results are not obtained but characteristics of neural machine translation (NMT) are learned. It is confirmed that stylish translation is possible by NMT. Second, the models from the PyTorch Chatbot and the Tensor2Tensor packages are trained on a more abundant parallel dataset and evaluated with the BLEU metric. The result shows that Tensor2Tensor performs better. For Tensor2Tensor on some short text tests, a BLEU value of 1 is even obtained which means the exact reproduction of the desired target translation. This study has two conclusions. It is confirmed that the AI technology in use has the potential to imitate a single translator with translations similar in style. It is also confirmed that Tensor2Tensor is more suitable than PyTorch Chatbot in performance for this study.

參考文獻


Graham Neubig(2013)「文レベルの機械翻訳評価尺度に関する調査」情報処理学会研究報告・自然言語処理研究会報告
国立国語研究所https://pj.ninjal.ac.jp/corpus_center/bccwj/morphology.html
Google Japan Blog(2016/11/16 付)https://japan.googleblog.com/2016/11/google.html(2019/02/12 閲覧)
科技大擂台「與 AI 對話」https://fgc.stpi.narl.org.tw/activity/techai
陳子瑋(2012)臺灣翻譯產業調查研究研究報告,國家教育院

延伸閱讀