在各類常見工業應用及智能相機的市場定位中,OCR識別的需求一直是最多最豐富的需求也是大家最關註的方向,本文以智能相機為商品依托,結合實際需求展現各場景下的OCR識別類型及方法
首先關註一個核心問題:什麽場景下的OCR識別需求分別對應選擇什麽型號智能相機,以及是否需要深度學習?
一、字符識別
對於一些產線商品位置固定,OCR 特征清晰明顯,對比度高、背景簡單的字符,可 以通過傳統方式即阈值分割的形式進行讀取的需求,相機字符識別自帶的模型可以應對 現場如點陣、刻蝕、壓印出來的字符。自帶的模型內部已經訓練了幾百萬張樣本,基本涵盖了絕大部分應用場景。
二、特征匹配(位置修正)+字符識別
對於一些商品在視野內可能位置會變動、商品位置不固定但前景和背景灰度差較大、幹擾較少的實際場景,可以開啟位置修正對字符識別進行輔助定位,來保證商品移動、旋轉等各種情況下都可以定位到要識別的字符。
註:開啟位置修正後,需保證模板區域始終在相機視野內,否則特征匹配不到會持續NG。
三、DL 字符識別
在一些字符形態大小不統一,對比度低,背景存在幹擾,字符粘連,畸變等場景, 傳統方法效果一般,這個時候可以用到深度學習,在常見工業如,食藥品包裝,電子工業,煙草工業薄膜,半導體晶源等等已經達成全工業覆盖,不需要進行過多的模型訓練,就可以達成字符的高效識別檢測,準確率基本在三個九以上。
四、DL字符定位+DL字符識別
在很多實際的OCR檢測需求中,字符位置不固定,字符大小不統一,甚至一些需求僅檢測視野內某個特定區域內的字符,應對這類情況,往往需要深度學習定位和深度學習識別搭配起來使用,提高準確率和穩定性達到預期效果。
食品工業噴墨會導致字符大小、深淺、形態和位置都會有變化,傳統方法無法準確定位到字符,引入深度學習定位和深度學習識別有效解決難題。
面對僅檢測紅框內字符(出界即NG)的實際需求,傳統算法模塊無法達成檢測需求,引入深度學習定位進行輔助,定位框框選目標區域,搭配出界過濾使能完美解決應用難點。
外包裝工業需要對箱體噴墨進行OCR識別,字符位數、長短、大小、位置及拍照距離都存在變化,且應對字符分段、噴墨深淺不一、存在劃痕等幹擾,深度學習都可以穩定定位並識別。
OCR識別仍然是智能相機的主要應用方向之一,對于OCR識別的優化和更新也是智能相機的重點叠代方向,智能相機會結合市場需求和建議不斷優化算法庫以適應並解決愈發多樣性的檢測場景和任務。
相關商品
相關文章