OCR的概念是在1929年由德國科學(xué)家Tausheck提出來的,后來美國科學(xué)家Handel也提出了利用技術(shù)對文字進行識別的想法。而早對印刷體漢字識別進行研究的是IBM公司的Casey和Nagy,1966年他們發(fā)表了篇關(guān)于漢字識別的文章,采用了模板匹配法識別了1000個印刷體漢字。早在60、70年代,世界各國就開始有OCR的研究,而研究的初期,多以文字的識別方法研究為主,且識別的文字僅為0至9的數(shù)字。

20世紀70年代初,日本的學(xué)者開始研究漢字識別,并做了大量的工作。中國在OCR技術(shù)方面的研究工作起步較晚,在70年代才開始對數(shù)字、英文字母及符號的識別進行研究,70年代末開始進行漢字識別的研究,到1986年,我國提出“863”高新科技研究計劃,漢字識別的研究進入一個實質(zhì)性的階段,清華大學(xué)的丁曉青和中科院分別開發(fā)研究,相繼推出了中文OCR產(chǎn)品,現(xiàn)為中國漢字OCR技術(shù)。

圖像輸入、預(yù)處理:圖像輸入:對于不同的圖像格式,有著不同的存儲格式,不同的壓縮方式,目前有OpenCV,CxImage等開源項目 。預(yù)處理:主要包括二值化,噪聲去除,傾斜較正等二值化:對攝像頭拍攝的圖片,大多數(shù)是彩像,彩像所含信息量巨大,對于圖片的內(nèi)容,我們可以簡單的分為前景與背景,為了讓計算機更快的,更好的識別文字,我們需要先對彩進行處理,使圖片只前景信息與背景信息,可以簡單的定義前景信息為黑色,背景信息為白色,這就是二值化圖了。

第四:物體的運動速度
在圖像獲取獲取過程中,圖像模糊精度取決于物體運動速度和相機曝光時間,所以物體運動速度快很可能導(dǎo)致圖片成像模糊,此外其他設(shè)備(工業(yè)相機、工業(yè)鏡頭、光源等)也會間接影響檢測。
第五:軟件的測量精度
測量精度一般在1/2-1/4個像素,原因是測量軟件精度過小,從圖像上提取的特征點信息就越少。
通過上述的5個問題可以看出機器視覺系統(tǒng)設(shè)計時會出現(xiàn)很多因素的干擾,所以我們需要不斷的去改善和升級技術(shù)去規(guī)避掉這些難以避免的問題,也相信技術(shù)的創(chuàng)新,很多問題都能別解決。