透過您的圖書館登入
IP:18.191.176.66

淡江大學資訊工程學系碩士班學位論文

淡江大學,正常發行

選擇卷期


已選擇0筆
  • 學位論文

現今很多資料查詢、報表設計及程式運作的功能都需要在前端提供使用者操作的選單,而在後端則依靠關聯式資料庫系統來管理。使用者在前端做表單式的查詢時,往往都會遇到選單操作複雜的問題,同時也可能使用者想查的資料並未出現在表單的選項中。為了讓使用者能夠更方便的查詢資料,有許多學者開始研究不同的資料庫問答型的QA機器人,以代替表單式操作。 傳統問答型的QA機器人,是基於使用者的問題,給定一個回答。在建立QA系統時,一定是要有一個完整的QA問答集,而這個問答集也應包含大量的問題與答案,才能夠有效的讓神經網路學習到問題與答案之間的聯繫關係。但是對於資料庫問答型的QA機器人,在訓練神經網路模型時,會遇到資料庫本身只有資料表,並無問答集,導致機器人無法學習資料庫的問題與資料庫查詢結果之間的關聯性。而對於一般問答型的QA機器人,當使用者提出問題,一定會給予一個答案,但這個答案的正確性則是以使用者主觀評價為標準,因為使用者有時提出的問題不完整,使得QA機器人在自然語言處理(Natural Language Processing, NLP)上,大多會採用模糊匹對的方式去搜尋,最後將得到最相近的結果去回復使用者一個答案。而對於資料庫問答型的QA機器人,使用者提出的問題一定要描述得很完整,才能夠使QA機器人精確的利用SQL語言/指令來查詢資料庫,並顯示結果,而這個結果的正確性則是以客觀的評價為標準,只有查詢正確與錯誤,所以使用者在問題的描述上,除了要具有完整性以外,敘述的文字也一定要與資料庫的資料相同,否則也會導致QA機器人無法查詢。這些問題都是發展資料庫QA機器人所會遭遇的挑戰。 綜合上述所提的問題,本論文將設計一個資料庫問答型的QA機器人,不但能夠讓使用者語音輸入,也可以自動將自然語言轉換成正確的資料庫系統語言,並且再將查詢到的結果快速地回傳給使用者,藉此有效的提高資料庫查詢的效率。但是,在設計資料庫問答型的QA機器人的過程中,將可能產生下列四項的挑戰,第一項是資料庫問答型機器人本身並無QA資料集,第二點是同音異字的問題,一旦語音轉文字時,因同音異字與資料庫欄名不同,將使SQL指令無法查出使用者擬查的資料;第三點是使用者詢問的問題不完整,第四點是將自然語言轉換成SQL查詢的語句。 針對以上挑戰,本論文透過爬蟲得到的各種不同的問句以及利用斷詞斷句標註重要詞語,並將這些詞替換成資料庫裡的欄位名稱,建立成新的資料庫問題集,再將這些問題利用BERT來訓練出一個自然語言轉中間語言的模型,可以得到使用者欲查詢的資料庫欄位有哪些,最後再將這些問句所轉成的中間語言,轉譯為SQL指令,藉此解決資料庫無問答集的問題。 本論文也透過爬蟲將國語辭典裡所有注音拼音的字抓取下來並建立一個同音異字庫,再利用CNN來訓練一個能將同音異字轉為正確資料欄位名稱,可以解決同音異字的語音轉文字問題。接著本論文利用FuzzyWuzzy建立了一套模糊比對算法,來針對當有使用者詢問的問題不完整時,也可以清楚得到該問題所想查詢的資料庫欄位名稱是甚麼。最後,本論文使用LSTM來做BERT模型的下游任務,也就是將BERT模型預測完的結果,再利用LSTM轉換成SQL的查詢語言。 根據實驗數據顯示,透過以上四種挑戰的功能,本論文相較於其他資料庫問答型的QA機器人更能夠針對使用者問題不完整時,能更有效且精準的查詢到資料庫的結果,進而以自動化及智慧化的方式,協助用戶利用自然語言詢問,能夠輕鬆地得到資料庫的資料,同時也能提升查詢和分析數據的效率。

  • 學位論文

隨著臺灣雙薪家庭數量逐年攀升的趨勢,許多家庭因為父母雙方平日工作繁忙,選擇將他們學齡前的小孩交付給保母托育,保母與家長間的溝通重要性可見一斑。保母除了需要遵照衛福部相關規定紀錄小孩的日常狀況,仍須製作小孩成長歷程,在傳統使用紙本聯絡本的方式下,除了要照顧小孩,還需要耗費額外時間動手填寫,勞心勞力,保母家長雙方的溝通效率也很差。因此本論文透過設計線上托育聯絡本 — BabeWithYou來解決上述的溝通效率問題、減輕保母日常作業負擔。我們以按鈕式的表單設計便利快速填寫常用內容、每日排程推播通知來提醒保母填寫聯絡本或提醒家長查看聯絡本、加入托藥單表單增進小孩托育期間的用藥安全、提供小孩日常生活圖片、影片上傳並整合聯絡本匯出成 PDF 供家長收藏,除了降低保母負擔,更提升家長對小孩托育相關資訊的能見度。為了支援這些功能,我們在 AWS平台上搭配相關技術的輔助下建立可靠的後端系統,確保使用者資料可以永續留存,同時為了維持系統穩定,將請求根據所需的系統計算資源分成同步與非同步的處理方式。為了確保BabeWithYou 可以長久服務家長與保母,我們分析了以往的使用狀況後採納了對應的幾項成本節省策略,並成功降低接近60% 的每月費用。BabeWithYou 至今已累積有將近 5000 名的使用者,當中包含了 2200 名每月活躍使用者及 1000 的每日活躍使用者,也獲的許多使用者的正向回饋,並期待可以往更廣的服務範圍如小學、補習班推廣。在手機應用介面上還能再更近一步提升保母填寫效率、根據填寫內容設計更直覺的操作方式,我們會再收集並分析更多使用者的回饋來改善。

  • 學位論文

詞曲詩詞等文本生成類型的應用在近期越來越多人開始研究,然而關於這方面研究通常使用人力評估,這樣的做法難免會出現量化標準不一情形,因為當使用同一方法研究卻用不同人力評估時,結果很可能不盡相同,就算是同一批人的調查結果,根據調查時的各種變因都有可能會影響結果。 本論文國內流行歌曲歌詞網中,幾位風格較具特色的作詞家之歌詞作品,將其作品資料使用SeqGAN進行訓練,並於訓練過程中,取出訓練程度不同的判別器,並將五個不同訓練次數(20, 40, 60, 80, 100)組合建立文本相似度評分器,以此作為歌詞與歌詞之間的評量方式。實驗結果顯示,詞風相似的作詞家,有較高的評分。