透過您的圖書館登入
IP:18.119.118.210

摘要


圖文分離技術主要應用在智慧型文件自動辨識系統的前處理部份:由光學掃瞄機掃瞄所得的數位影像資料,經過國文分離處理後,區分出文字典圖形等部份。對於文字部份,可以加強其清晰程度,以利後績的文字辨識處理。對於工程圓圓形部份,則可將其點陣式資料轉換成向量式的資料型態,以利儲存與往後之修改。對於照片類型的圓形資料,則進行半色調處理或資料壓縮,以提高傳輸及儲存的效率。圖文分離處理通常分為兩階段第一階段為區塊劃分(block segmentation),目的是將文件分割成一塊塊較小的局部區域,並希望這些小區塊中只包含一種型態的資料,以便進行下一階段的歸類。較常使用的區塊劃分方法有連續黑點塗抹法(constrained run length algorithm)、遞迴投影切割法(recursive X-Y cuts)、和連接元件產生法(connected component generation)、…等。第二階段為區塊歸類(blook classification),目的是才已經過區塊金劃分後所得的各個區域,進一步區分成不同的類型,如:文字、工程園、照片、…等。通常有傳立葉光吉普分析法(Fourier spectra analysis)、灰階分佈國分析法(gray-level histograms analysis)、幾何性質分析法、連續黑/白點長度分析法(black/white run length analysis)、相關性分析法、…等方法。 本文的目的即對這些區塊劃分、歸類的方法做一簡單的介紹。

延伸閱讀


國際替代計量