清華大學資訊工程學系所學位論文｜Airiti Library 華藝線上圖書館

摘要隱藏中

本文將於2026/12/15開放下載。若您希望在開放下載時收到通知，可將文章加入收藏。

學位論文

使用狀態機處理強化學習之獎勵設計複雜性 -- 以機器人不限定次數之重複性任務為例

莫雅雯(Ya-Wen Mo)

近年來，強化學習 (reinforcement learning) 被廣泛地應用在機器人領域。強化學習的目標是要得出一個使累積獎勵最大化的策略 (policy)。而智慧代理 (agent) 可透過獎勵函數的指導來選擇較好的行為動作 (action)。因此，在強化學習中，獎勵函數 (reward function) 是一項很重要的元素。其中稀疏獎勵 (Sparse reward) 很容易設計，但對於較為複雜的任務，像是不限重複次數的機器人操作任務，使用稀疏獎勵來進行訓練會使智慧代理很少收到有用的獎勵訊號。雖然這個問題可以通過獎勵塑形 (reward shaping) 來新增有用的獎勵訊號，但多數應用獎勵塑形提出的獎勵函數都只針對特定某個任務。在這篇論文中，我們提出一套針對機器人不限定次數之重複性任務的系統性獎勵函數設計原則，並利用reward machine的架構來設計獎勵函數。以重複性方塊放置任務為代表，我們進行疊方塊與排列方塊的實驗，實驗結果顯示我們設計的獎勵函數應用在疊方塊及排列方塊任務的成功率分別為66%及81%。相較於使用較稀疏的獎勵函數最終收斂到非期望的策略，我們設計的獎勵函數有不錯的表現。

學位論文

透過目標限定的任務編碼改善元模仿學習

林煜峰(Yu-Fong Lin)

摘要隱藏中

學位論文

基於代理重加密在區塊鏈平台上實作隱私保護資料分享框架

羅中廷(Jhong-Ting Luo)

我們構建了一個框架，通過公有鏈技術–乙太坊來簡化資料分享的應用開發並改進我們的食品安全追蹤服務。當人們開始關心資料的存儲方式時，會浮現出一些問題，它們往往成為基於區塊鏈系統推廣的障礙。我們在本文中的工作是重新思考並實作系統，以滿足以下三個要求： 1. 資料隱私是我們正在促進的關鍵概念，也是擁有者的基本權利。當應用程式在公開環境上運行時，人們可以透明地驗證執行中產生的每個塊，並可以輕鬆訪問託管的資料。因此，我們引入了代理重加密技術，以在管理共用存儲上加密資料的對稱金鑰時提高金鑰分發的效率。 2. 區塊鏈服務需要增強持久資料的可用性。我們使用分散式檔案系統 IPFS（星際檔案系統）作為我們的資料後端，並提出了一種結合 IPFS 和區塊鏈帳本的基於文件的資料庫設計。 3. 存取控制是多租戶資料共用方案中的必要功能。我們的系統使用通用的智慧合約來執行資料所有者定義的策略，用戶可以靈活地控制基於 ACL 模型中每個資料集的許可權。最後，我們通過一個管理應用程式演示了該系統，並以解耦的架構將其集成到一個現有食品安全追蹤服務中，這表明在考慮構建可信混合架構時，它可以適應許多開放資料服務。本文還在實驗部分以通過安全性測試工具的智能合約實作提供了一些可擴展性及效能的分析結果。

學位論文

基於機器學習之鳳梨品質分類

黃亭瑋(Ting-Wei Huang)

摘要隱藏中

本文將於2024/10/27開放下載。若您希望在開放下載時收到通知，可將文章加入收藏。

學位論文

最小列分解問題之演算法研究

許文弘(Wen-Horng Sheu)

著眼於癌症基因學上的應用，Hajirasouliha 與 Raphael [WABI 2014] 提出了「最小列分解問題」。此問題的輸入為一個 m 列 n 行的二元矩陣 M。「列分解」是一種作用在 M 上的操作，其定義如下：取 k > 1 個列 r^{(1)}, r^{(2)}, ..., r^{(k)} 來取代 M 中原有的的任一列 r，其中 r^{(1)}, r^{(2)}, ..., r^{(k)} 的按位元或 (bitwise OR) 之結果須等於 r。列分解操作的花費等於 M 在操作後增加的列之數量，即 k − 1。此問題的目標是找出花費最少的一系列列分解操作，使得這些操作依序作用在 M 上後所得到的矩陣是一棵完美演化樹的矩陣表示法。在近來的一篇研究論文中，Hujdurović et al. [TALG 2018] 證明最小列分解問題是個 APX-hard 問題，並提出有效率的精準演算法與近似演算法，該論文最終建議以參數化研究做為最小列分解問題未來的研究方向。令 ε(M) 表示將二元矩陣 M 轉換為一棵完美演化樹之矩陣表示法所需要的最小花費。本論文提出一個在 O*(2^{min(n, 2ε(M))}) 時間內解決最小列分解問題的精準演算法。在參數化複雜度的術語中，此成果代表最小列分解問題由 ε(M) 作為參數時，是一個「固定參數可處理」問題。此外，在最差情況下，此演算法花費至多 O*(2^n) 的時間，顯著地改進了現有最佳演算法之時間複雜度 O*(n^n)。由應用面來看，列分解操作之目的為將 m 個混合的腫瘤樣本分解為 m + ε(M) 個細胞子群體，其中樣本混合之肇因來自於現有 DNA 定序技術之限制。在此觀點下，本論文的參數化成果代表著當樣本的混合情形不嚴重時，最小列分解問題可以有效率地被解決。經過適當的延伸後，本論文的演算法可被修改為枚舉最小列分解問題的所有最佳解，此延伸演算法之預處理時間為 O*(3^{min(n, 2ε(M))})，且任兩輸出之間的時間延遲與後輸出者之大小呈線性關係。 Hujdurović et al. 的演算法經過修改後可以解決最小列分解問題的一個變化問題，稱作「最小相異列分解問題」。本論文對於最小列分解的精確演算法與枚舉演算法經過延伸後也可解決這一變化問題。此外，本論文對於最小列分解問題和最小相異列分解問題的演算法可被延伸為解決此兩問題帶有以下額外限制的版本之演算法：只有輸入指定的一個列的子集合可以被分解。現有所有針對最小列分解問題之演算法及本論文所提出之演算法皆需要預先計算一張有向圖──稱作包含關係圖──來表示輸入矩陣。過往的論文皆使用一個簡單的 O(mn^2) 演算法建構此關係圖，本論文提出了一個較有效率的建構方法法，其時間複雜度為 max{O(m^0.373 n^2), O(mn^1.373)}。

學位論文

以詞嵌入與概念擷取方法進行生物醫學縮寫的詞義消歧

陳韋諭(Wei-Yu Chen)

在醫院病歷資料與醫學文獻中，英文縮寫經常被使用。由於許多縮寫擁有多種展開形式，使它們在詞義上模稜兩可，因此縮寫的詞義消歧（Word Sense Disambiguation, WSD）成為了自然語言處理（Natural Language Processing, NLP）領域中的一個重要課題。在這篇論文中，我們提出了一個監督式機器學習的方法來解決這項問題。首先，我們使用了一個事先訓練好的詞向量（Word Embedding）模型和一個一體化醫學語言系統（Unified Medical Language System, UMLS）的概念擷取（Concept Extraction）工具，來建造四種不同的特徵（features）：詞向量特徵（word embedding features）、UMLS概念名稱特徵（UMLS concept preferred name features）、UMLS概念原文字詞組特徵（UMLS concept n-gram features）和詞性特徵（part-of-speech features）。接下來，我們選擇了支持向量機（Support Vector Machine, SVM）作為進行機器學習的模型。在我們以美國明尼蘇達大學（University of Minnesota, UMN）的一個公開資料集進行訓練與測試之後，我們能夠以最好的特徵組合與參數組合，在完整75個縮寫的資料集中得到97.17%的準確率，在部分50個縮寫的資料集中獲得96.97%的準確率，並且在部分13個縮寫的資料集中得到98.50%的準確率。最終，相較於其它論文中使用的方法，我們提出的方法能夠得到更好的表現，因此證明了本篇論文的實用性。

本文將於2026/10/21開放下載。若您希望在開放下載時收到通知，可將文章加入收藏。

學位論文

def2topic:學習辭典字義定義的主題分類

吳岱儒(Tai-Ju Wu)

本論文提出了一種給定辭典定義的主題標籤的方法，而所有主題標籤都是從同義詞詞典中提取的。在我們的方法中，字義被轉換為向量，再通過機器學習和深度學習模型從同義詞詞典中選擇合適的主題標籤。該方法包括自動提取特徵以將不同定義轉換為向量，自動給定相關字組成員的字義以生成訓練數據，以及自動學習如何為每個定義對主題進行分類。在執行時，輸入定義被轉換為詞嵌入，並使用 DL 技術進行相關程度的排序。我們提出了一個原型系統 def2topic，該系統將該方法應用於劍橋英漢詞典。評估表明，所提出系統的結果明顯優於基線系統（baseline）。

本文將於2025/10/19開放下載。若您希望在開放下載時收到通知，可將文章加入收藏。

學位論文

基於遮罩語言模型的介系詞改錯

紀冠名(Kuan-Ming Chi)

本論文提出一個介系詞改錯方法，可以在不依賴人工標注資料的情況下改正句子中潛在的介系詞錯誤。在我們的方法中，我們在可能遺漏介係詞的位置插入佔位符，並嘗試使用遮罩語言模型來替換或刪除句子中的介系詞和占位符來改正潛在的介系詞錯誤。我們的方法是將母語語料庫中的句子轉換為帶有遮罩的句子和被遮住的介係詞（或符號“[NONE]”）組成的訓練資料，用來表示遺漏、錯誤和多餘的介係詞錯誤，並用合成的資料來訓練遮罩語言模型，使之有能力改正介係詞錯誤。那些訓練資料是透過遮蓋現有介係詞或在容易出現多餘介係詞的位置插入表示遮蓋的符號來建立的，此外，我們使用 BEA-2019 和 CONLL-2014 的資料集進行評估。初步結果顯示，我們的方法跟前人的研究成果比起來有較好表現。

學位論文

基於因果擴張卷積之高效率動作辨識

王奕翔(Yih-Hsiang Wang)

摘要隱藏中

本文將於2026/10/13開放下載。若您希望在開放下載時收到通知，可將文章加入收藏。