語音辨識的使用日趨廣泛,大量出現於各種應用環境中,而語者調適愈顯得日趨重要。深層類神經網路亦已成為聲學模型的主流,本論文將各語者的平均識別向量分群,分別為每一群語者訓練特定的深層類神經網路模型,再用這些事前訓練好的模型來作語者調適。本論文提出兩種作法,一是以測試語者的識別向量做為選擇標準,挑出最適合的語者分群模型;另一者則用監督式方法學習出結合向量來整合各個模型的輸出結果。我們使用高度口語化、個人化及雙語特性之語料測試,發現本論文所提出的架構在調適語料少時能迅速提升辨識正確率,並且在調適語料數目增加時也有不錯的表現。