透過您的圖書館登入
IP:18.117.182.179

清華大學電機工程學系所學位論文

國立清華大學,正常發行

選擇卷期


已選擇0筆
  • 學位論文

語音情緒辨識近年來為深度學習所賜,成果越來越斐然,然而情緒構成複雜度造成的情緒資料庫蒐集問題仍然存在:語音情緒資料難以快速累積,以及在不同語境間變異度高。初始化微調是深度學習中一個常見的解決方法,然而若是純粹以多媒體背景資料則會與語音情緒辨識存在太大的差異,還是需要不論是在初始化時給予情緒的引導,或是微調時提供更準確的方法。因此本論文提出利用大量隨手可得的多媒體資料,伴隨從其聲音及文字資訊產生的情緒激發、向性代理標記,學習給語音情緒辨識問題應用的初始化語音前端網路;接著以此初始化網路取向的取樣方法輔助微調,建立目標資料庫的語音情緒辨識模型。結果顯示在語音前端網路的及取樣方法輔助下,結果都可以勝過隨機初始化,有卓越提升的表現。

  • 學位論文

FPGA是一種可讓使用者編寫程式的數位裝置,並能夠提供數位電路有效且靈活的實現。 FPGA由配置邏輯塊組成且被路由網路包圍與限制在I/O腳的區域中。 FPGA為許多不同傳統半導體製的應用提供了一個價格更低的解決方案。 隨著單通量量子(SFQ)技術發展迅速,使用SFQ技術的FPGA將變得非常的有用。 先前的研究著重介紹了第一個高效能使用磁性SFQ技術的FPGA,這個FPGA有望以高頻低能耗的狀態下運行。 在這個論文中,我們提出一個全新的布局演算法,不同於CMOS製的FPGA,高效能磁性RSFQ的FPGA能夠滿足所有SFQ的限制。 我們準確地研究了RSFQ FPGA布局與布線問題,並且開發出了一套新穎的針對超導體FPGA的布局演算法,這個演算法旨在利用減少相連的邏輯塊的距離以最小化整體的布局面積與切換盒的擁擠狀況。 這個演算法的主要屬性是「單元分組」、「全域布局」與「細部布局」,目的是在符合超導電子與RSFQ的限制下提供一個最佳的合法布局結果。 我們將我們的布局結果與基準系統的結果進行比較,成功的減少成本(HPWL)約27%及布局區域大約20%。

  • 學位論文

人類在現今依存的世界裡透過多種不同的方式進行溝通與交流,從概念的生 成、送訊者的編碼、傳達的媒介一直到收訊者的解碼,是一連串複雜而多層次 的程序,其中亦可能因噪音(訊息之扭曲、干擾)或是回饋的產生,而為其增 添更多未知之可能性。本研究基於人類行為本質的複雜性,著重探討編碼與解 碼的過程以及行為者與現象發生之關聯性,並實際驗證於兩個任務:ㄧ)疼痛 程度評估以及 二)多媒體暴力檢測。在醫療臨床疼痛程度診斷的應用上,部分 臨床紀錄之資訊在工程研究中尚未列入考慮,本次運用多模態機器學習之模型 設計技術,提出軟層排序任務特定(Task Specific Encoder with Soft Layer Order- ing, TSEN-SLO)架構,透過參閱疼痛部位的臨床紀錄,提升在診斷疼痛程度的 準確率,而為理解各個特徵在不同族群的重要程度及其影響,該研究亦透過多 變量變異數分析,了解語音特徵在多個獨立變項(年齡、性別、疼痛程度、疼 痛部位)影響下的顯著性差異。而在多媒體內容檢索的應用上,過去研究多著 重彌合語義(semantic)資訊、擷取影視內容之摘要片段等等,而較少探討創作 者與受眾之間的關係脈絡,本次使用英國影集—黑鏡之觀者與劇本撰寫者之辭 彙特徵,運用外類別(extra-genre multimodal embedding)模型架構,初步驗證 受眾回饋具有評估多媒體暴力程度的可行性。

  • 學位論文

錯誤摸擬是指在一工程系統中進行某種故障行為的模擬,並且透過模擬的結果來觀察故障可以被偵測到的錯誤覆蓋率 (Fault coverage) 百分比。在工程系統中會希望有高的錯誤覆蓋率的結果,像可測試性設計(DFT)及自動測試圖樣產生(ATPG)等技術也是用來提高錯誤覆蓋率。然而隨著電子設備的演進,待測的工程系統已經越來越複雜,電路模擬的時間將會根據待測系統電路的複雜而成長。所以本篇論文將提高抽象層級(abstraction level) 隱藏系統複雜的細節,讓系統進行錯誤模擬的時間能夠大幅縮短並且將抽象層級錯誤模擬的結果與暫存器傳遞語言 (Register Transfer Language, RTL) 錯誤模擬的結果進行比較確保錯誤模擬的結果是否一致。 現有的暫存器傳遞語言 (Register Transfer Language, RTL)錯誤模擬器,像是 ZOIX能夠提供不同的故障模型進行模擬,但是在會因為模擬速度的限制進而限縮了模擬故障的數量。若是要能夠不失去錯誤模擬結果的正確性又能夠提升故障模模擬的速度,則是本篇論文要探討的重點。 為了能夠解決暫存器傳遞語言錯誤模擬的速度限制下,我們設計了一個高階抽象層級的錯誤模擬器並且將其模擬結果與暫存器傳遞語言 (Register Transfer Language, RTL)錯誤模擬器的結果進行比較加速的比例以及模擬結果的正確性。

  • 學位論文

人群重識別是一項重要但較少被研究的課題。相較於普通的行人重識別而言, 由於每位行人都是獨立的個體,他們會在人群中自由變換相對位置,並且會隨意 進入或者離開這個群體, 給人群重識別帶來了額外的難點。所以,人群重識別主 要針對這兩個額外的難點提出解決方案。在本人中, 我們提出了兩個方法來解 決人群重識別任務。 (1 由於人群重識別中缺少訓練數據,我們將行人重識別中的數據進行風格 轉換為人群重識別測試數據的風格。而後,我們自適應的無監督方法將人群中單 人的特征和雙人的關係特征融合進行人群重識別。 (2 在本方法中,我們把人群中的所有人看成一個圖模型。用風格變化後的 數據進行人群中相對位置變化和任意人加入離開人群進行進行模擬。組成訓練數 據。使用模擬數據訓練圖神經網絡。再進行測試。 實驗表明,我們所提出的方法得到的結果均優於現在的方法。

本文將於2025/01/18開放下載。若您希望在開放下載時收到通知,可將文章加入收藏
本文將於2025/01/18開放下載。若您希望在開放下載時收到通知,可將文章加入收藏
  • 學位論文

變頻耳聲傳射為一種誘發性耳聲傳射,傳統上,變頻耳聲傳射的誘發訊號需要由兩個揚聲器分別發射以避免揚聲器產生失真影響耳聲傳射訊號的正確性。在本篇論文中,首先,我們量測了在不同參數之誘發訊號的揚聲器失真訊號,藉此分析其特性,並且結合文獻中變頻耳聲傳射訊號強度對與誘發訊號的關係,提出了一種新的非線性量測方法,利用揚聲器近似線性的失真成長函數與耳聲傳射的飽和度,使變頻耳聲傳射能夠在僅需一個揚聲器的設備上量測。根據實驗結果,非線性量測方法能克服揚聲器產生的失真,並且得到變頻耳聲傳射訊號; 在空白實驗中,能夠消除大約 25 dB 的揚聲器失真訊號;在耳朵實驗中,非線性量測方式的結果與標準量測方式的結果的相關係數達到 0.61。

若您是本文的作者,可授權文章由華藝線上圖書館中協助推廣。
本文將於2026/01/14開放下載。若您希望在開放下載時收到通知,可將文章加入收藏