OCR (Optical Character Recognition,光學(xué)字符識(shí)別)是指電子設(shè)備(例如掃描儀或數(shù)碼相機(jī))檢查紙上打印的字符,通過(guò)檢測(cè)暗、亮的模式確定其形狀,然后用字符識(shí)別方法將形狀翻譯成計(jì)算機(jī)文字的過(guò)程;即,針對(duì)印刷體字符,采用光學(xué)的方式將紙質(zhì)文檔中的文字轉(zhuǎn)換成為黑白點(diǎn)陣的圖像文件,并通過(guò)識(shí)別軟件將圖像中的文字轉(zhuǎn)換成文本格式,供文字處理軟件進(jìn)一步編輯加工的技術(shù)。如何除錯(cuò)或利用輔助信息提高識(shí)別正確率,是OCR的課題,ICR(Intelligent Character Recognition)的名詞也因此而產(chǎn)生。衡量一個(gè)OCR系統(tǒng)性能好壞的主要指標(biāo)有:拒識(shí)率、誤識(shí)率、識(shí)別速度、用戶界面的友好性,產(chǎn)品的穩(wěn)定性,易用性及可行性等。

文字特征抽?。?jiǎn)我宰R(shí)別率而言,特征抽取可說(shuō)是 OCR的核心,用什么特征、怎么抽取,直接影響識(shí)別的好壞,也所以在OCR研究初期,特征抽取的研究報(bào)告特別的多。而特征可說(shuō)是識(shí)別的籌碼,簡(jiǎn)易的區(qū)分可分為兩類:一為統(tǒng)計(jì)的特征,如文字區(qū)域內(nèi)的黑/白點(diǎn)數(shù)比,當(dāng)文字區(qū)分成好幾個(gè)區(qū)域時(shí),這一個(gè)個(gè)區(qū)域黑/白點(diǎn)數(shù)比之聯(lián)合,就成了空間的一個(gè)數(shù)值向量,在比對(duì)時(shí),基本的數(shù)學(xué)理論就足以應(yīng)付了。而另一類特征為結(jié)構(gòu)的特征,如文字影像細(xì)線化后,取得字的筆劃端點(diǎn)、交叉點(diǎn)之?dāng)?shù)量及位置,或以筆劃段為特征,配合特殊的比對(duì)方法,進(jìn)行比對(duì),市面上的線上手寫輸入軟件的識(shí)別方法多以此種結(jié)構(gòu)的方法為主。

種方式靈活性比較高,但是經(jīng)常會(huì)出現(xiàn)噴碼機(jī)堵嘴的現(xiàn)場(chǎng),導(dǎo)致噴印字符不全或者漏噴的現(xiàn)象;第二種方式在打碼過(guò)程中容易出現(xiàn)打印重疊、少打、漏打等現(xiàn)象;針對(duì)以上問(wèn)題大多數(shù)工廠采用人工方式進(jìn)行檢測(cè),但這樣會(huì)極大的影響生產(chǎn)速度。
欣維視覺(jué)可針對(duì)噴碼的產(chǎn)品進(jìn)行質(zhì)量檢測(cè),將產(chǎn)品中出現(xiàn)的字體模糊、噴碼變形、字符錯(cuò)誤、點(diǎn)狀字符無(wú)法連接等噴碼質(zhì)量缺陷進(jìn)行分揀并剔除,保障所有產(chǎn)品噴碼質(zhì)量的一致性。