攝影機移動下之壓縮域視訊縮小解碼技術

由於科技的迅速發展，現今人們在資訊的傳遞非常仰賴電子設備的協助，但傳送端與接收端的顯示設備可能因為長寬比的不同，導致傳送到接收端時視訊需根據接收端的顯示設備進行長寬比的調整。一般傳統的作法如線性縮小、影像裁切等方式會對影像內容造成較大的失真，這些方式已不適合使用在目前的視訊大小調整上，所以在視訊縮小需要能以非線性的方式來進行調整。內容感知視訊縮小技術(content-aware video retargeting)就是一種針對視訊進行非線性縮小的方式，主要針對影像中的重要部分如人或是移動中的物體給予較大的保留程度，反之人眼較不重視的區域就能給予較大的縮小幅度，用以達到視訊縮小的目的且能保持視訊中主體的完整性。由於傳送端與接收端顯示設備解析度不同時，接收端需根據顯示設備解析度對視訊進行大小調整，一般傳統的內容感知視訊縮小技術主要是將視訊先解碼回像素域(pixel domain)之後再對影像進行非等比例的縮放，本篇論文提出一個用於壓縮域(compressed domain)的內容感知視訊縮小解碼技術，與像素域內容感知縮小的主要差異在於在讀取到位元流(bitstream)從壓縮域解碼回像素域時能同時對視訊進行縮小，視訊縮小與單張影像縮小最大的差異在於視訊需考慮到撥放連續性的問題，本論文透過估測全域運動向量來找出前後影像內容的相對位置，並建立全域縮放圖(global scaling map)記錄下各時刻影像相同內容的位置資訊，並給予一樣的縮放幅度，在建立縮小後視訊時透過運動補償(motion compensation)變成最後重建影像，用此方式達到撥放時前後時刻內容的一致性，在有相機移動的場景下也能準確的劃分出視訊中的重要區域並加以保留。從實驗結果來看，此方式相較於解碼回像素域再進行縮小的做法能有較快的運算速度，並且對於視訊中的重要部分也有良好的保留程度。

關鍵字

壓縮域；內容感知視訊縮小；相機移動

參考文獻

[8] 許志仲 (Chih-Chung Hsu),影像視訊縮放技術之畫質增強與評估(Quality Enhancement and Assessment for Image and Video Resizing ) 國立清華大學電機工程學系博士班論文,2014

[1] Tzu-Chieh Yen, Chia-Ming Tsai, and Chia-Wen Lin, “Maintaining Temporal C oherence in Video Retargeting Using Mosaic-Guided Scaling,” IEEE Transactions on Image Processing , Vol.20, No.8, pp.2339-2351,August 2011.

[2] Yu-Shuen Wang, Hui-Chih Lin, Olga Sorkine, Tong-Yee Lee “Motion-based Video Retargeting with Optimized Crop-and-Warp,” ACM Transaction on Graphics(TOG), Vol. 29, No. 4, July 2010

[3] 黃俊嘉,用於壓縮域的內容感知視訊縮放解碼技術, 國立中正大學電機工程研究所碩士論文,2013.

[4] Jiangyang Zhang, Shangwen Li Kuo, C.-C.J, “Compressed-Domain Video Retargeting,” IEEE Image Processing ,Vol. 23, No.2 2014

國際替代計量

攝影機移動下之壓縮域視訊縮小解碼技術

未授權

主題瀏覽