文件影像反白與漸層文字之偵測與二值化

目的在文件的文字辨識技術的應用中，需要具備優良的文字擷取技術做前處理，將文字從各類文件中擷取出來，方能進行後續的運用。但在現今的文件影像的背景卻越來越複雜，文件影像不再是簡單的白底黑字。在OCR軟體的前處理中，二值化是最關鍵的步驟，若是無法正確的將文字與背景分割，則將直接導致低辨識率，圖1-3為一般的OCR軟體的前處理流程圖。本研究主要是建立一套適合用於彩色文件影像，做文字偵測、擷取與二值化的整合系統，來處理反白、漸層且位於複雜背景中之文字，提高彩色文件在OCR上的辨識率。設計／方法／門俓本文透過利用反白與漸層文字之特性來進行進一步的影像處理，找出反白與漸層文字與一般淺底深字之間的差異。發現彩色文件影像包含許多不同的物件，例如：不同顏色的字、圖形、風景或背景顏色等，甚至這些物件會有彼此交疊的現象，一般光學文字識別軟體己無法處理非單純背景的文件影像，研究限制／影響本研究對於與背景的顏色相近之文字，其辨識率仍低。實用的影響在有效的擷取文件影像中的文字之後並將其儲存在文字檔，則能大幅度降低儲存的空間。創新／價值商業的文字辨識系統(optical character recognition; OCR)，主要應用於偵測及辨識文字文件影像，但這是針對文字附加在背景單純（單一顏色且與文字有強烈對比）的情形下，才有較高的辨識正確率，而對於反白與漸層文字則難以辨識。

關鍵字

光學文字辨識；影像二值化；文字偵測

國際替代計量

文件影像反白與漸層文字之偵測與二值化

全文下載

主題瀏覽

文件影像反白與漸層文字之偵測與二值化

摘要

關鍵字

延伸閱讀

國際替代計量

本網站使用Cookies