透過您的圖書館登入
IP:13.58.8.127

臺灣大學電子工程學研究所學位論文

國立臺灣大學,正常發行

選擇卷期


已選擇0筆
  • 學位論文

為了滿足執行複雜應用程序的性能要求,通常必須開發具有多核CPU且內部帶有硬體加速IP的SoC。如果應用程序越複雜,SoC中需要起動更多的硬體資源來完成所需的任務。此外,為了可靠,安全地採用先進製程實現SoC,並考慮製程、電壓及溫度因素對SoC所產生的變化,需要建立更嚴格的簽核標準,以涵蓋較悲觀的壓降影響和最壞運行條件下所引入的過於保守時序規範。 這些保守的預測不僅會造成產品設計上需採用更大的尺寸來實現,而且還會導致更多的功耗。除此之外,還會增加時序收斂的難度。因此,為了讓便攜式客戶端產品中使用的SoC的面積和功耗能盡可能縮小,並進而保持更長的電池壽命和仍能具有競爭力的性能,我們提出了幾種創新的節電設計和實現方法:(1)開發一個嵌入「設計中的關鍵時序路徑行為監控器」(Design-Dependent Critical-Path Monitor, DDCPM),此DDCPM使用了空間相關和即時採樣技術,通過嵌入在每個芯片中的相應監控器所反饋的「製程、電壓、溫度變異」(Process, Voltage, Temperature, PVT Variations) 感知響應,可以做出和特定應用程序有關的精細動態電壓頻率調整 (DVFS),以期能在運行期間獲得更小的工作電壓或更高的工作頻率。(2)架構不佳的時鐘生成(Clock Generation, CLKGEN)模塊通常會導致較長的時序傳播路徑,也較容易誘導因不同PVT效應而產生的時序變化,及時鐘樹合成(Clock Tree Synthesis, CTS)的過程也會需要較多的分析,因此時鐘偏移平衡的任務也會變得更加複雜。除此之外,時鐘延遲的大小和時鐘緩衝器使用的數量也將增加,進而消耗更多的功率。我們開發了一種「合併和替換數個多工器和分頻器」(Merging and Replacing of Multiple Multiplexers and Dividers, MRMMD)的「時鐘架構再合成」(Clock Architecture Resynthesis) 平台,能有效地識別那些架構不佳的CLKGEN,並將它們再合成為功耗低、面積小且較簡單的結構。我們的方法可以有效地減少與時鐘相關的時序路徑及時鐘緩衝器的數量,進而讓時鐘數合成 (CTS) 期間的分析和實現變得更加容易。(3)整合路徑時序重定 (Path Retiming)、時序鬆弛重分配 (Slack Redistribution) 和替換暫存器為Razor的概念,來開發能實現更低功耗的容錯設計平台。在該容錯設計平台中,我們運用改良的Razor架構去執行錯誤恢復機制,透過DDCPM監控器造就更細微的DVFS壓頻調整,來實現能維持原有性能的節電。同時,我們也提出方法來自動生成線性及可調整隨機分佈的電路觸發動作來進行靜態及動態功耗分析,以驗證運用我們的方法所得到的功耗改善。除此之外,還能有機會緩解佔有大量關鍵時序路徑的設計中經常發生的嚴重佈線擁塞問題。

  • 學位論文

科技日新月異,隨著時代的進步,智慧型裝置運用在疾病診斷愈來愈受到重視,就以近幾年的資訊科技來說,舉凡人工智慧、大數據、雲端存取及遠端運算都已經大量運用在醫療領域。這些應用可用在病患的生理監測和監控、行動照護甚至在一些突發的緊急事件上做出預警,以期能告知病患盡早就醫達到預防醫學的目標。 心房顫動(Atrial fibrillation)是心律不整的一種,其特點是心臟會呈現快速並且不規則之心律,心房顫動起初發生的持續時間非常短暫並且具有偶發性,但隨著時間推移發作時間會愈來愈長到不易緩解的程度。為了能達到提早預防,本論文使用近幾年快速崛起的深度學習及機器學習技術,提出一個系統化並且客觀的方法,在既有之大量資料的情況下,利用單導程心電訊號將病人心房顫動狀態辨識出來,提供醫師參考及輔助診斷病患的疾病。 本論文第一章為緒論,簡介研究主題的原由並提出改良方法及貢獻,第二章以及第三章為心房顫動及機器學習的背景知識介紹,從第四章開始為本論文的主要貢獻,其中包含減少特徵值和運算量並把實際患病的人數估算出來並搭配統計數據(靈敏度、特異度以及F1 Score)來衡量判斷的正確率,最後採用不同的分類法,提出不同的系統架構設計,包含心電圖訊號的前處理、特徵擷取、深度殘差網路運算、十折交叉驗證及分類器的運用,最後把判別結果輸出。接下來在第五章探討模擬結果並配合統計圖表及前人所做的數據交叉比對來驗證此系統的效能,最後一章則是結語和未來展望,提出電極擷取訊號及使用者穿戴便利性的討論,並提出未來的改良建議像是建立病況嚴重程度等級等。

  • 學位論文

醫學超音波檢查是現今非常普及且有效的診斷方式。肌肉骨骼超音波因為涉及身體的部位眾多,解剖結構複雜,且組織紋理多變,造成超音波影像辨識難度相當高。在有限的範例圖譜以及需要大量練習才能精熟的情況下,導致初學者面臨學習門檻過高的困境。因此有必要發展一套電腦輔助自動化超音波影像即時標註系統,將超音波影像中不同器官組織自動標示出來,即時呈現在螢幕上,以協助醫師檢查與診斷。本論文選擇正中神經作為主要偵測目標,以及使用目前性能強大的人工智慧深度學習來實現物體偵測技術。由於需要演算法可達到即時偵測的速度,本論文使用YOLOv3作為物體偵測演算法。為確保實驗的公平性與客觀性,實驗過程中使用不同的資料集分割方式與多重交叉驗證。為增加對特定應用領域的偵測效果,在研究方法中加入對影像額外的前處理與後處理。經實驗結果證實,後處理可有效增加偵測流暢度以及提升準確率。根據實驗數據顯示,本研究方法在平均情況下可以同時達到90%以上的準確率以及80以上的影格率。在使用解析度來調整速度與準確率之間的權衡下,準確率最高可達94.19%以及影格率最高可達87.6幀。本論文證實了使用深度學習應用於超音波物體偵測,可同時達到高準確率與即時的偵測速度。

若您是本文的作者,可授權文章由華藝線上圖書館中協助推廣。
  • 學位論文

隨著量子電腦的出現,現有的公鑰密碼演算法已不安全,因此美國國家標準暨技術研究院(NIST)開始徵集能抵抗量子電腦攻擊的後量子密碼演算法,其徵集的演算法分為公鑰加密(密鑰交換)和數位簽章,在第三輪的NIST後量子密碼學標準化進程中,NTRU Prime是其中一種公鑰加密的備選者。本篇論文在被NIST所接受的Xilinx Artix-7 FPGA上實作Streamlined NTRU Prime密碼系統。我們實現了一個脈動架構的多項式模反元素計算和Good’s trick 數論轉換多項式乘法,它們分別是密鑰生成和封裝/解封裝的核心功能。對於NIST安全級別3,密鑰生成的實作使用915個slices、10.5個BRAMs和8個DSPs;封裝/解封裝的實作使用 3270個slices,16.5個BRAMs和7個DSPs。密鑰生成的最高實現頻率為111MHz,而封裝/解封裝為77MHz,受雜湊函數所限。密鑰生成、封裝和解封裝分別需要8404μs、645μs和1523μs。據我們所知,這是首個在Xilinx Artix-7 FPGA上的硬體實作。為了與Streamlined NTRU Prime的其他最新實作進行比較,我們也在Xilinx Zynq Ultrascale+ FPGA上實作其核心功能。在幾乎相同的執行時間下,多項式模反元素計算的slice數量減少47%,而多項式乘法的slice數量減少20%且執行時間減少62%。

  • 學位論文

隨著系統級封裝 (System-in-Package)的進展,封裝技術有許多重大的進步和創新。雖然這些封裝技術增加了元件的密度,但伴隨的寄生效應可能會損害系統效能,因此發展準確的電性分析模型是相當必要的。寄生效應由晶片中的寄生電阻、寄生電容和寄生電感所產生。以前,因為電路操作頻率不高,電感效應較不明顯,所以許多研究著重在電阻和電容的提取。而現今電路的操作頻率已經來到了千兆赫茲等級,因此電感效應對電路性能已經越來越重要。在本論文中,我們提出一個的新的電感萃取方式: 基於古典電磁學原理-等效原理 (Equivalence Theorem),我們建立一個虛擬的封閉邊界包住原始源,再通過適當安排的電流和磁流以滿足邊界條件,而這些新的虛擬源在目標處再現了與原始源產生的完全相同的磁場和電場。 這是為任意形狀和位置的原始源構建宏觀模型的極致且最靈活的方法。 透過裡到外 (Inside-out)和外到裡 (Outside-in)的過程,我們成功分解互感矩陣,這可以被用於求解頻變電感和暫態分析。我們的實驗結果相對於正確參考值的誤差很低,並且在運用迭代法解線性系統時,使用分解矩陣相較沒分解的矩陣有顯著的速度提升。

若您是本文的作者,可授權文章由華藝線上圖書館中協助推廣。
  • 學位論文

市面上以鋰電池為電源供應的電子產品越來越多,包含電動車與手機等等。然而,鋰電池的安全與耐用度問題仍尚未完全解決,尤其在電動車的應用中,電池的蓄電力下降與爆炸問題,仍然是電動車存在的主要問題之一。本篇論文整理近年電池管理系統的研究,並依照其規格,設計出一微小化的量測系統。此系統亦能成為一超音波液位計,其不接觸到液體的特性,可有許多工業上的應用。 本系統由兩個晶片與兩個超音波換能器 (Transducer) 所組成,兩個晶片分別為發射器與接收器。發射器的製程為 0.18μm DMOS製程,其輸出為脈波,頻率為超音波換能器的共振頻率,目的為驅動超音波換能器。同時,發射器內部有 停滯時間控制器 (dead-time controller) 的電路,使晶片不會產生大的瞬間電流,以免在電動車內部的環境產生無法預估的化學反應。接收器的製程為0.18μm CMOS製程,晶片內部包含低雜訊放大器 (LNA)、自動增益控制器 (AGC)、帶通濾波器 (BPF)、包絡檢波器 (envelope detector),接收器的目標是讀出接受訊號的時間及振幅大小。由於超音波在傳遞時會衰減,為了讀出不受衰減影響的接收訊號,時間增益補償(time-gain compensation) 會被應用在AGC內。此外,AGC有取樣保值電路(sample and hold circuit),當晶片感應到接收訊號時,會對AGC控制增益大小的數位訊號進行取樣,並輸出此數位訊號。由於數位訊號是由計數器 (counter)所產生的,故此訊號亦可作為時間數位轉換器的輸出。 根據系統需求,整個系統內各個重要設計參數都進行詳細計算。本論文使用30V、5V、1.8V的電源電壓,接受器的類比前端輸入雜訊小於3nV/√Hz,而接收訊號時間的準確度小於5μs,兩顆晶片的總功耗約為55mW。此設計可與部分市售超音波液位計規格匹敵,能多方應用在許多產業中。

若您是本文的作者,可授權文章由華藝線上圖書館中協助推廣。
  • 學位論文

石墨烯(graphene)由於其單原子層結構,超高的電子遷移率與寬頻的吸收頻譜使其在光學元件及高頻元件中的上備受重視。本研究探討石墨烯對於量子井紅外光偵測器和熱電子晶體的效能增益。 首先在量子井紅外線光偵測器方面,我們利用石墨烯與半導體介面形成的蕭特機能障(Schottky barrier)來做光電二極體產生光電流,進而使光偵測器的效能提升。本研究還探討超晶格的組合以及光柵結構提升元件的效能與吸收頻譜,製作成石墨烯覆蓋的多彩量子井網格紅外光偵測器(multicolor quantum grid infrared photodetector ,QGIP)。歸功於與超晶格的結構,元件提供可調控的吸收光譜。而從響應度方面,由於石墨烯與半導體介面形成的光電二極體所提供額外光電流,使其響應度跟標準片相比可以大幅度的提高。本研究亦藉由模擬最佳化的光柵結構使員建在響應度上沒有帶大的變化下使暗電流大幅降低。因為上述的效能提升,石墨烯覆蓋的多彩量子井網格紅外光電探測器的偵測率能飛越性的提高。接下來我們更進一步研究了石墨烯與砷化鎵形成的蕭特機能障使超晶格彎曲來使光訊號更佳的提升。使偵測率能更進一步的增加。 而石墨烯熱電子電晶體方面,本論文探討了利用雙層氧化層(TiO2/HfO2) 作為熱電子電晶體的基極(base)與集極(collector)間的穿隧勢壘(tunneling barrier)以及在大氣下成長,數個奈米的二氧化矽作為射極與基極的穿隧勢壘的方法,來改善傳統石墨烯熱電子體低熱電子穿隧機率與漏電的問題。並且更進一步的利用多種二維材料的疊合(MoS2/h-BN)取代傳統氧化層作為基極與集極間的穿隧勢壘,更加的提升元件的性能。在直流量測方面,元件表現極高的電流密度(~ 200 A/cm2 ),共基極電流增益( ~99.2%),與共射極電流增益 (common emitter current gain ~3)。由於這些直流特性的改善,石墨烯熱電子電晶體能操作在數十吉赫茲(GHz)左右。 本研究展示了藉由石墨烯等二維材料與半導體元件的垂直傳輸結構,能大幅度的改善傳統量子井紅外線光偵測器與熱電子電晶體的效能,而這些成果亦提供成為實現下一世代更光電元件與高頻元件的重要實驗基礎。

  • 學位論文

自駕車、擴增實境、自主運行的邊緣裝置以及許多和視覺影像相關應用的需求已經蓬勃地發展。深度學習和類神經網路的演進為這些相關應用帶來巨大的進步。然而在類神經網路架構的準確率不斷提升的同時,它們執行上的效率仍然是個重要且待解決的議題。網路的效率可以指涉為幾個面向:需要的記憶體空間、計算複雜度和功耗管理。現今的類神經網路已經成長到擁有數以百萬計的參數,而其所蘊含的計算複雜度往往也都達到每秒十億個浮點數運算的數量級。要將如此龐大的模型佈署在即時處理的邊緣裝置上是很困難的,使得人們的日常生活無法受益於這些相關的科技。 在所有加速或是壓縮類神經網路的方法中,網路剪枝因為其有效性已經成為了最主要的研究方向。現在針對網路剪枝的研究大多使用應用於稀疏標籤的網路來評估他們的方法,但往往處理密集標籤相關問題的網路才是真的有被應用在資源有限的邊緣運算裝置上的需求,因此有關於密集標籤神經網路的壓縮是更迫切需要被解決的問題,不過有關這方面的研究仍十分稀少。另外,現有的方法多是從濾波器的層級來剪枝,由於剪枝的最小單位是整個濾波器,因此濾波器中卷積核間彼此的互動關係便被忽略了。 在本篇研究中,我們著重於研究應用於密集標籤的神經網路剪枝技法。針對將網路轉換成不同的稀疏度我們採取兩個不同的方法來分別處理。對於希望達到高稀疏度的網路,我們先進行剪枝處理,並進一步量化剩下的參數。此一方法的目標為達到極高度稀疏的網絡,使經由我們的壓縮方法處理過後的模型可以直接經由低功耗和低計算複雜度的硬體加速器實現。密集標籤的預測網絡在實際的使用情境下有許多的應用,因此我們選用實現雙目深度匹配演算法的模型來評估我們的方法。我們提出一個兩階段的剪枝及量化框架、引入衡量參數重要性的指標並且搭配特定的網絡微調訓練方法,在不犧牲網絡原有表現的情況下盡可能地移除不必要的參數。根據實驗結果,使用我們的方法可以使儲存網絡的記憶體用量減少99%,且在最好的情況下,可以減少99.9%硬體的消耗。而在ResNet訓練於CIFAR10和ImageNet數據集上的準確度,我們方法的表現也超越其他當前最先進的研究。 對於希望達到中等稀疏度的網路,我們提出卷積核分群剪枝方法。我們發展出一套在網絡的每一層中偵測代表性最低之卷積核的演算法。只要反覆地將代表性低的卷積核從網絡中移除,我們便能在保留重要參數的同時削減模型尺寸以及所需計算資源量。我們採用兩個最具代表性的密集標籤應用-雙目深度偵測及語意分割的問題來評估我們的方法。透過卷積核分群剪枝方法,我們可以在影響原有準確率不到1%的情況下減少網絡70%的運算量。甚至在ImageNet ILSVRC2012數據集上,同時提升0.13% ResNet-50的準確率並將所需的運算量降為原本的一半。我們提出的卷積核分群剪枝法同樣也達到目前最佳的類神經網路剪枝結果。

  • 學位論文

由於超音波能窺視體內,所以其是一項有價值的儀器能進行診斷。此外,肌肉骨骼超音波是最早進入照護端的領域且已被廣泛運用。因為其他成像工具無法在門診被臨床醫師使用,以至於肌肉骨骼超音波對於臨床醫師來說是一項可行的替代方案。然而,許多身體部位有著複雜的解剖結構和可變的組織紋理,使得初學者難以找到適合的導師,亦難從只有少量圖片的現有教科書中來學習。我們實驗室成員的前作中已經應用了基於深度學習的演算法來檢測肘關節周圍的正中神經,但仍有改進的空間。因此,在此論文,我們使用YOLOv5演算法來實現肌肉骨骼超音波精準且即時的檢測來減緩上述的問題。實驗結果表明,YOLOv5在交叉驗證中mAP達到80%以上,在測試集中mAP達到89%,這意味著和前作使用的YOLOv3相比,在交叉驗證中mAP進步了2%,而測試集中進步了7%。除此之外,YOLOv5的FPS也達到了即時的基準。

若您是本文的作者,可授權文章由華藝線上圖書館中協助推廣。
  • 學位論文

連續漸進式類比至數位轉換器是一種著名的高電能效率架構由於其電容式數位至類比轉換器和低靜態功耗。然而,外圍電路的驅動是一個嚴重的問題,因此本論文提出了一種混合架構參考電壓緩衝電路,用於採用40奈米製程的0.9伏特電壓每秒一百萬次取樣的十四位元連續漸進式類比至數位轉換器。混合架構參考電壓緩衝電路包括電荷補償電路和動態參考電壓穩定器,以調節所提出的連續漸進式類比至數位轉換器之參考電壓。本文提出的類比至數位轉換器在每秒一百萬次取樣速度下,實現了11.52的測量有效位元。整體有效面積僅為0.048186平方毫米,且無需外部去耦電容。功率消耗為19.5微瓦特,品質因數達到 170.3 分貝。 此外,應用優化的可程式化繞線系統來更快地轉換電路的製程。優化的三點,包括電晶體的創建、擺置和繞線,如此一來即使是需要對稱的電路也可以完成。

若您是本文的作者,可授權文章由華藝線上圖書館中協助推廣。