臺灣大學資訊網路與多媒體研究所學位論文｜Airiti Library 華藝線上圖書館

有鑒於社群媒體的盛行,人們現在非常熱衷於在各個社群媒體上分享自己的日常生活,而這些使用者的使用特性又與使用的地點有著強烈的關聯性,因此,如何去了解分析地點的特性便成了一個社群媒體上很重要的問題,並且在許多的應用上都扮演著重要的角色。但是, 一個具有挑戰性的困難點在於社群網路上單獨一篇的文章發佈往往不足以蘊含足夠的資訊來分析地點的性質,為了對抗這樣的瓶頸,我們同時地使用了一個地點的複數則文章以及其對應的相關資訊來進行地點類別的分類。我們在 Instagram 上蒐集了百萬則量級的文章發表, 同時也蒐集了這些文章的相對應關聯資訊,包含但不限於發表時間、 GPS、以及使用者的資料,並且使用了 Foursquare 的預先定義地點類別來做為我們的分類類別(包含了食物、夜生活、辦公、學校等......), 我們也提出了一個突破社群媒體資料收集限制的標籤數據蒐集方法。在這裏,我們運用了來自複數則發表文章的豐富資訊來訓練我們的多重模型,並且在超過十則文章的地點上,即使在充滿雜訊的條件下, 也達到了 73.18% 的分類準確度,而我們不只提出一個相當穩固的分類模型,同時,我們也運用了社群媒體上的關聯性,來提升非熱門地點的分類準確度,並且得到了超過 15% 的相對準確度提升。

若您是本文的作者，可授權文章由華藝線上圖書館中協助推廣。

學位論文

360 環景影片去手震

沈林承(Lin-Chen Shen)

這篇論文提出了一種解決360度環景影片手震問題的方法。這類型的影片又可細分成兩種：圓柱型與球型。針對傳統影片而設計的影片去手震演算法，會因為極度寬闊的視角而無法適切的運作在這類型的影片上。我們觀察到對360影片來說，相機的旋轉必須極度平滑，來保持全域的動態一致性和避免景物的搖晃效果。另外在虛擬實境的應用中，為了能讓播放畫面跟隨著使用者的視角，原始相機的旋轉也是必須被移除的。我們的方法將旋轉自其他的相機運動中抽取出來，並使用不同的策略來平滑化各個部分。首先我們會估計每個影格之間的旋轉量。在移除了旋轉後，會套用一個利用網格操作的變形方法來處理剩餘那些因平移或視差造成的抖動。不僅如此，我們還提出了一個新型的網格變形演算法，利用正二十面體與其延伸之多面體來處理球型影片。適當的旋轉會在之後被決定並加回影片中，用以保持讓畫面非常平順，或另外根據使用者需求來調整。另外，我們提供了一個傾斜校正的演算法，可用以移除令人不適的相機傾斜問題。實驗顯現我們的方法可以有效的運用在製作穩定的360環景影片上。

若您是本文的作者，可授權文章由華藝線上圖書館中協助推廣。

學位論文

藉由最佳化非平滑成本函數學習播放清單的隱表示法提升音樂推薦的排序

林家瑞(Chia-Jui Lin)

在現在的世界裡有數百萬首的歌曲，有些雲端的音樂服務像是 Youtube、Spotify、Apple Music 等收集了許多的歌曲並提供給消費者一個友善的介面，隨著這些服務的出現，更能夠幫助消費者探索這大量的音樂選擇，而為了滿足消費者的偏好，一個好的推薦歌曲方法是必要的，在學術上有許多的論文在探討音樂推薦相關的議題。而為了評斷不同的方法的表現好壞，一般來說都會使用評估指標來評量，在資訊檢索領域中有許多不同的評估指標，但大部分的評估指標都是非平滑的，這會造成最佳化的損失函數與評估指標不匹配，為了克服這個問題，我們引進排序學習來消除不匹配。在本論文中，我們將每一首歌曲以 d 個維度的隱向量表示，且使用了一個測量排序被稱為 NDCG 的評估指標來作為評估，給定一個歌曲序列，我們的模型會回傳一個預測出現在此序列後下一首的排序，實驗顯示我們的模型表現比其他方法還好，這表示我們模型的排序預測跟實際排序更為接近。

本文將於2026/12/31開放下載。若您希望在開放下載時收到通知，可將文章加入收藏。

學位論文

服務本體論預測Web服務

王凱昇(Kai-Sheng Wang)

近年來本體論被認為是設計更精確和易於使用的資訊檢索、推薦系統以及預測引擎的有力策略，這已經成為一種突出的方式以提供一個符合用戶喜好信息，我們的系統藉由利用本體論以改善服務預測的精準度來做開發。藉由透過個性化建立一個更準確的用戶輪廓，在預測服務可獲得一些額外的好處，當中包括更高的機會獲得用戶他們所期望的結果以及進一步為他們提供更好的整體體驗，因此我們決定將個人本體論結合了服務的描述擴展為服務本體論。本論文旨在於給一個情境，我們想要預測它的相關Web服務，有四個主要核心模組方法被提出，分別為(1)分析情境到實體；(2)從實體轉為一個複雜事件；(3)建構服務本體論；以及(4)利用複雜事件和服務本體論來預測相關相關Web服務。這些被提出方法的效果不但可以顧及到在服務預測過程中的情境架構，也可獲得服務預測的一些回饋，而這些回饋依賴於服務本體論，因此它可隨著時間持續學習提供更準確的預測。

學位論文

物聯網中介軟體中的複雜事件處理系統

吳佳芷(Chia-Chih Wu)

近年來，關於物聯網的研究與日俱增、相關應⽤設備與系統也漸漸出現在市⾯上，然⽽，現今物聯網應⽤系統發展中⾯臨了幾個問題：缺乏複雜事件之概念，無法有效分析由感測設備來的資料成為人類所能理解的事件。為解決這些問題，在此論文中我們將提出一個複雜事件處理系統，處理從感測設備收集到的資料，將其轉換為事件，再經由複雜事件處理引擎利用事件模式轉換為複雜事件，此外使⽤者也能⾃行定義事件模式並應用於不同情境。本論文實作複雜事件處理引擎：使⽤者可定義複雜事件模式，同時複雜事件處理系統將gateway收集之感測器資料轉換為事件輸⼊處理引擎，引擎則採⽤樹結構⽅法偵測出複雜事件。最後對複雜事件處理系統進行情境驗證與效能評估。

學位論文

自示範中學習結合與行動相關聯之資料調整法生成適用於動態場景之反應式行動法則

余宗哲(Chung-Che Yu)

近年來，研究學者們開始運用機器學習的技巧來降低調整參數以及設計各式規則的麻煩性，對機器人學而言，使用這類學習技巧的目的便是讓機器人能從資料中學得運動法則所需之各式參數；藉由自資料中學習的概念以及研究學者發現人類族群會利用教導與學習的過程來獲得新技能之事實，機器人自示範中學習 (robot learning from demonstration) （亦稱模仿學習）的概念開始受到重視。而在模仿學習 (imitation learning) 演算法發展的過程中，其研究重點從機器人模仿人類以完成任務的理論與方法上之設計，轉變成如何用適當的方法來表示欲模仿、學得之項目，在此基礎上，一個具代表性的特徵組以及學習模型對於學習的過程而言是不可或缺的。在本論文中，主要貢獻之一便是展示出使用行動特徵以及高階資訊後對於學習的影響，在結合這些資訊以及基於此些行動後的未來狀態，發展出多步特徵 (multi-step feature) 並生成相對應的特徵向量，利用此特徵向量，將可學得示範者連續性的行為，由於所提出的特徵表示法與行動有極大的相關性，故稱之為行動相關聯資料 (action-correlated data)。除了行動相關聯資料，此論文的主要貢獻為以下概念：藉由資料調整法並搭配互動式模仿學習的技巧生成具結構性的法則。在起始的示範以及學習過程之後，失敗的情境將啟動行動相關聯之資料調整法，在此概念下，將利用互動式學習法獲取額外的示範資料，而這些新取得之資料將用以訓練出新的法則，而非使用所有取得之資料重新訓練單一的法則；在只有起始示範資料且啟動互動機制相當耗費資源而不可得的情形下，所提出的學習機制將利用學習者 (learner) 以及示範資料的特性自動地將行動相關聯之資料進行調整，即使沒有使用者所提供的新示範資料，仍舊可以生成出具結構性的法則。基於室內靜態環境以及模擬的動態環境下之實驗成果，足以驗證所提出之方法之成效，使用者的示範資料能夠被有效的學習以生成反應式行動法則 (reactive action policies)，基於這些情境下的成功經驗，所提出之學習機制當可應用於自主式機器人的導航，讓機器人族群能更快地融入我們的日常生活之中。

學位論文

以複合式模型學習法探究多社群網路媒體之使用者資訊

李文瑜(Wen-Yu Lee)

臺灣大學資訊網路與多媒體研究所學位論文 (2016) 博士

近年來，社群網路的蓬勃發展逐漸地改變了人們的生活，越來越多人習慣在社群網站上分享生活的點滴；據統計，平均每一天有數百萬的多媒體資料，例如照片，被上傳至社群網站，而這樣龐大數目的多媒體資料裡極可能蘊藏著豐富的資訊；在這篇論文裡，我們期望能從大量的多媒體資料裡萃取出有用的資訊，並藉此解決人們日常生活裡常見的一些問題。從一張照片出發，我們期望建立一套資訊系統，可以找出這張照片是在哪裡拍攝的，其他人可能會對這照片給予怎樣的文字標籤來描述這拍攝的內容，又這張照片的拍攝地點附近是否有熱門的活動或事件；這樣的資訊，在日常生活裡可以有許多應用，例如在旅遊的時候，我們常會想知道自己在哪裡、眼前的事物是什麼，又或者在這附近平常會有什麼樣的活動或事件；這時只要隨手地對眼前事物拍一張照，再將這照片送入此資訊系統，系統就可以快速地提供我們這些資訊。過去找出照片拍攝地點的常見作法是利用照片的視覺特徵與地理標籤，透過與現有的資料比對，以推測出照片最可能的拍攝地點；但當照片是在室內被拍攝或是拍攝地點有多個建築物時，可能會降低這類方法的準確度；為此，此論文進一步地加入了打卡資料來輔助定位，同時提出一個有效的影像重新分群技術，來提升推測的照片拍攝地點的準確度。而對於找出照片就拍攝的內容其一般會被加註什麼樣的文字標籤，常見的技巧是利用已有文字標籤的現有照片集來預測那沒有標籤的照片其可能的文字標籤；一種有效作法是根據照片與照片之間的視覺相似度來建構圖，這圖是以照片作為節點，相似度作為連接節點與節點之間的邊的權重，之後考慮到邊的權重，將標籤自節點傳遞分享至沒有標籤的照片的節點，這種作法即使是當沒有標籤的照片數目大於有標籤的照片數目仍經常有效；而考慮到過去的方法大多是一次只傳遞單一個標籤，對於多個標籤的情況下則需要進行多次，並且現有照片的數目一直以來持續地在增長，方法的效率逐漸成為一個重要的議題；有鑑於此，此論文提出了一個基於分散式運算原理的多標籤傳遞法，來有效率地同時傳遞多個標籤。對於找出熱門活動，過往的方法多專注於觀察單一的多媒體資料集的資料變化，例如字詞的談論頻率變化，異常的變化則表示可能有活動或事件發生；而此論文考慮到不同資料集其性質都有所不同，彼此之間可能可以互補不足的地方，來提出了一個有效的兩階段式架構，能有效地結合資料流類型的資料集及打卡類型的資料集，以找出熱門的活動或事件的發生時間、發生地點及其內容資訊；由於已能找出照片可能的拍攝地點，則可以透過比較可能的拍攝地點和熱門活動或事件的發生地點來找出照片拍攝地點附近的熱門活動或事件。此論文所提的方法都已透過實驗分析來顯示這些方法的有效性。最後，此論文提出一些未來可能的研究方向。

若您是本文的作者，可授權文章由華藝線上圖書館中協助推廣。

學位論文

以感測器本體論為基礎之半自動程式碼產生

程至賢(Chih-Hsien Cheng)

由於科技的進步,越來越多的 IoT 相關產品出現在市場上,隨之而來的問題也相繼浮現。大部分市面上的產品並不具有操控互通性,想要藉由組合多種不具操控互通性的感測器產生更強大的功能是相當不容易且花時間的。除了操控互通性的問題外,市面上有各式各樣的通信協定,但卻沒有一種能主宰整個市場,因為每種通信協定在特定領域都有其不可取代的優勢。因此,要出現一種能主宰市場並讓大部分廠商都願意支援的通信協定是非常不容易的。面對這些困難,我們提出 Interoperation 系統,希望能藉由其緩解甚至解決上述問題。我們的系統利用程式碼產生器來產生控制感測器的程式並提供統一的 API 來操控感測器。並且,我們的系統支援大部分市面上看得到的主流通訊協定。因此,使用者能透過我們的系統用統一的 API 來控制各式各樣通信協定下的感測器,我們相信這能大幅度地降低使用者組合各式各樣感測器並產出擁有強大功能之服務的困難度。

本文將於2026/07/28開放下載。若您希望在開放下載時收到通知，可將文章加入收藏。

學位論文

基于視覺和慣性測量之飛行攝影機自我定位

梁橋(Qiao Liang)

隨著飛行攝影機的日益普及，自我定位技術作為保障其功能性與安全性的關鍵技術之一，其重要性與日俱增。單目攝影機和慣性測量單元 (IMU) 因為其低成本、輕重量等特點，非常適合用於飛行攝影機的自我定位。此篇論文從視覺定位和視覺慣性傳感器融合兩個方面分別進行研究，結合單目攝影機和慣性測量單元提出一種飛行攝影機自我定位之方式。本文對三種目前較為先進的用於車輛定位的單目視覺定位方法進行不同條件下的實驗，分析將其用於飛行攝影機定位時可能產生的問題，并討論各種方法的適用場景和優缺點。考慮到視覺定位的固有限制，本文引入一種基於寬鬆耦合方式的傳感器融合方法，將視覺和慣性測量相結合，並在實驗結果中驗證了方法的有效性。

若您是本文的作者，可授權文章由華藝線上圖書館中協助推廣。

學位論文

藉由多點公共互動裝置以強化社群互動與交流

朱琦(Qi Zhu)

近年來,越來越多的多媒體公共裝置出現在我們生活中。這些裝置,一方面裝飾了我們的公共空間,另一方面也向該空間內的人傳達了訊息。但是,作為社區的一部分,面向公眾的裝置還有很多的價值尚未被挖掘。我們發現即使在一個社區內生活了一段時間,我們對社區的了解也僅僅停留在表面,而且,我們很少有機會去認識同一個社區中的其他人,即使你們可能經常碰面。為解決上述問題, 我們試圖藉由多點公共互動裝置來強化社群的互動與交流。本篇論文將重點討論我們如何設計裝置的外形和互動內容來吸引人們來參與互動,具體包括兩個互相連接的互動裝置,四個不同的互動階段以及基於位置訊息,觸控信息,以及表情訊息的多種互動方式。用戶可以通過我們的公共裝置,在徜徉社區美景的同時, 偶然邂逅裝置另一端的陌生人。而隨後的用戶研究表明,用戶接受並且喜歡這樣的方式去了解社區,用我們的公共裝置區去認識更多的人。