透過您的圖書館登入
IP:18.118.145.114
  • 會議論文

文件影像反白與漸層文字之偵測與二值化

摘要


目的 在文件的文字辨識技術的應用中,需要具備優良的文字擷取技術做前處理,將文字從各類文件中擷取出來,方能進行後續的運用。但在現今的文件影像的背景卻越來越複雜,文件影像不再是簡單的白底黑字。在OCR軟體的前處理中,二值化是最關鍵的步驟,若是無法正確的將文字與背景分割,則將直接導致低辨識率,圖1-3為一般的OCR軟體的前處理流程圖。 本研究主要是建立一套適合用於彩色文件影像,做文字偵測、擷取與二值化的整合系統,來處理反白、漸層且位於複雜背景中之文字,提高彩色文件在OCR上的辨識率。 設計/方法/門俓 本文透過利用反白與漸層文字之特性來進行進一步的影像處理,找出反白與漸層文字與一般淺底深字之間的差異。 發現 彩色文件影像包含許多不同的物件,例如:不同顏色的字、圖形、風景或背景顏色等,甚至這些物件會有彼此交疊的現象,一般光學文字識別軟體己無法處理非單純背景的文件影像, 研究限制/影響 本研究對於與背景的顏色相近之文字,其辨識率仍低。 實用的影響 在有效的擷取文件影像中的文字之後並將其儲存在文字檔,則能大幅度降低儲存的空間。 創新/價值 商業的文字辨識系統(optical character recognition; OCR),主要應用於偵測及辨識文字文件影像,但這是針對文字附加在背景單純(單一顏色且與文字有強烈對比)的情形下,才有較高的辨識正確率,而對於反白與漸層文字則難以辨識。

延伸閱讀