淺談圖文分離技術

圖文分離技術主要應用在智慧型文件自動辨識系統的前處理部份：由光學掃瞄機掃瞄所得的數位影像資料，經過國文分離處理後，區分出文字典圖形等部份。對於文字部份，可以加強其清晰程度，以利後績的文字辨識處理。對於工程圓圓形部份，則可將其點陣式資料轉換成向量式的資料型態，以利儲存與往後之修改。對於照片類型的圓形資料，則進行半色調處理或資料壓縮，以提高傳輸及儲存的效率。圖文分離處理通常分為兩階段第一階段為區塊劃分(block segmentation)，目的是將文件分割成一塊塊較小的局部區域，並希望這些小區塊中只包含一種型態的資料，以便進行下一階段的歸類。較常使用的區塊劃分方法有連續黑點塗抹法(constrained run length algorithm)、遞迴投影切割法(recursive X-Y cuts)、和連接元件產生法(connected component generation)、…等。第二階段為區塊歸類(blook classification)，目的是才已經過區塊金劃分後所得的各個區域，進一步區分成不同的類型，如：文字、工程園、照片、…等。通常有傳立葉光吉普分析法(Fourier spectra analysis)、灰階分佈國分析法(gray-level histograms analysis)、幾何性質分析法、連續黑/白點長度分析法(black/white run length analysis)、相關性分析法、…等方法。本文的目的即對這些區塊劃分、歸類的方法做一簡單的介紹。

關鍵字

圖又分離；區塊劃分；區塊歸類

國際替代計量

淺談圖文分離技術

全文下載

主題瀏覽

淺談圖文分離技術

摘要

關鍵字

延伸閱讀

國際替代計量

本網站使用Cookies