首先關(guān)注一個(gè)核心問題:什么場(chǎng)景下的OCR識(shí)別需求分別對(duì)應(yīng)選擇什么型號(hào)智能相機(jī),以及是否需要深度學(xué)習(xí)?
一、字符識(shí)別
對(duì)于一些產(chǎn)線產(chǎn)品位置固定,OCR 特征清晰明顯,對(duì)比度高、背景簡(jiǎn)單的字符,可 以通過傳統(tǒng)方式即閾值分割的形式進(jìn)行讀取的需求,相機(jī)字符識(shí)別自帶的模型可以應(yīng)對(duì) 現(xiàn)場(chǎng)如點(diǎn)陣、刻蝕、壓印出來的字符。自帶的模型內(nèi)部已經(jīng)訓(xùn)練了幾百萬張樣本,基本涵蓋了絕大部分應(yīng)用場(chǎng)景。
二、特征匹配(位置修正)+字符識(shí)別
對(duì)于一些產(chǎn)品在視野內(nèi)可能位置會(huì)變動(dòng)、產(chǎn)品位置不固定但前景和背景灰度差較大、干擾較少的實(shí)際場(chǎng)景,可以開啟位置修正對(duì)字符識(shí)別進(jìn)行輔助定位,來保證產(chǎn)品移動(dòng)、旋轉(zhuǎn)等各種情況下都可以定位到要識(shí)別的字符。
注:開啟位置修正后,需保證模板區(qū)域始終在相機(jī)視野內(nèi),否則特征匹配不到會(huì)持續(xù)NG。
三、DL 字符識(shí)別
在一些字符形態(tài)大小不統(tǒng)一,對(duì)比度低,背景存在干擾,字符粘連,畸變等場(chǎng)景, 傳統(tǒng)方法效果一般,這個(gè)時(shí)候可以用到深度學(xué)習(xí),在常見行業(yè)如,食藥品包裝,電子行業(yè),煙草行業(yè)薄膜,半導(dǎo)體晶源等等已經(jīng)實(shí)現(xiàn)全行業(yè)覆蓋,不需要進(jìn)行過多的模型訓(xùn)練,就可以實(shí)現(xiàn)字符的高效識(shí)別檢測(cè),準(zhǔn)確率基本在三個(gè)九以上。
四、DL字符定位+DL字符識(shí)別
在很多實(shí)際的OCR檢測(cè)需求中,字符位置不固定,字符大小不統(tǒng)一,甚至一些需求僅檢測(cè)視野內(nèi)某個(gè)特定區(qū)域內(nèi)的字符,應(yīng)對(duì)這類情況,往往需要深度學(xué)習(xí)定位和深度學(xué)習(xí)識(shí)別搭配起來使用,提高準(zhǔn)確率和穩(wěn)定性達(dá)到預(yù)期效果。
食品行業(yè)噴墨會(huì)導(dǎo)致字符大小、深淺、形態(tài)和位置都會(huì)有變化,傳統(tǒng)方法無法準(zhǔn)確定位到字符,引入深度學(xué)習(xí)定位和深度學(xué)習(xí)識(shí)別有效解決難題。
面對(duì)僅檢測(cè)紅框內(nèi)字符(出界即NG)的實(shí)際需求,傳統(tǒng)算法模塊無法實(shí)現(xiàn)檢測(cè)需求,引入深度學(xué)習(xí)定位進(jìn)行輔助,定位框框選目標(biāo)區(qū)域,搭配出界過濾使能完美解決應(yīng)用難點(diǎn)。
外包裝行業(yè)需要對(duì)箱體噴墨進(jìn)行OCR識(shí)別,字符位數(shù)、長(zhǎng)短、大小、位置及拍照距離都存在變化,且應(yīng)對(duì)字符分段、噴墨深淺不一、存在劃痕等干擾,深度學(xué)習(xí)都可以穩(wěn)定定位并識(shí)別。
OCR識(shí)別仍然是智能相機(jī)的主要應(yīng)用方向之一,關(guān)于OCR識(shí)別的優(yōu)化和更新也是智能相機(jī)的重點(diǎn)迭代方向,智能相機(jī)會(huì)結(jié)合市場(chǎng)需求和建議不斷優(yōu)化算法庫以適應(yīng)并解決愈發(fā)多樣性的檢測(cè)場(chǎng)景和任務(wù)
廣州艾韋迅科技是??低旽IKVISION旗下的??禉C(jī)器人HikRobot??抵悄茏x碼器/工業(yè)相機(jī)經(jīng)銷商,供應(yīng)??低旽IKVISION讀碼器同時(shí)為 為電子、物流、FPD顯示屏、半導(dǎo)體、汽車制造等領(lǐng)域提供專業(yè)機(jī)器視覺解決方案,???a href="http://sjchj.cn/tiaoma_dutou/" target="_blank" >工業(yè)讀碼器助力用戶快速準(zhǔn)確實(shí)現(xiàn)工業(yè)自動(dòng)化。