噪聲去除:對(duì)于不同的文檔,我們對(duì)噪聲的定義可以不同,根據(jù)噪聲的特征進(jìn)行去噪,就叫做噪聲去除傾斜較正:由于一般用戶,在拍照文檔時(shí),都比較隨意,因此拍照出來的圖片不可避免的產(chǎn)生傾斜,這就需要文字識(shí)別軟件進(jìn)行較正。版面分析:將文檔圖片分段落,分行的過程就叫做版面分析,由于實(shí)際文檔的多樣性,復(fù)雜性,因此,目前還沒有一個(gè)固定的,的切割模型。

文字特征抽?。?jiǎn)我宰R(shí)別率而言,特征抽取可說是 OCR的核心,用什么特征、怎么抽取,直接影響識(shí)別的好壞,也所以在OCR研究初期,特征抽取的研究報(bào)告特別的多。而特征可說是識(shí)別的籌碼,簡(jiǎn)易的區(qū)分可分為兩類:一為統(tǒng)計(jì)的特征,如文字區(qū)域內(nèi)的黑/白點(diǎn)數(shù)比,當(dāng)文字區(qū)分成好幾個(gè)區(qū)域時(shí),這一個(gè)個(gè)區(qū)域黑/白點(diǎn)數(shù)比之聯(lián)合,就成了空間的一個(gè)數(shù)值向量,在比對(duì)時(shí),基本的數(shù)學(xué)理論就足以應(yīng)付了。而另一類特征為結(jié)構(gòu)的特征,如文字影像細(xì)線化后,取得字的筆劃端點(diǎn)、交叉點(diǎn)之?dāng)?shù)量及位置,或以筆劃段為特征,配合特殊的比對(duì)方法,進(jìn)行比對(duì),市面上的線上手寫輸入軟件的識(shí)別方法多以此種結(jié)構(gòu)的方法為主。

隨著條碼技術(shù)應(yīng)用領(lǐng)域的擴(kuò)大,人們對(duì)條碼技術(shù)的需求層次也在不斷提高,人們不但要求條碼技術(shù)能夠解決計(jì)算機(jī)的數(shù)據(jù)輸入速度、數(shù)據(jù)輸入正確性等問題,而且希望條碼技術(shù)還能解決將更多信息印刷在更小面積等其他一些問題。到了80年代后期,一種能夠在更小面積上表示更多信息的新條碼產(chǎn)生了,這就是二維條碼。由于二維條碼在平面的橫向和縱向上都能表示信息,所以與一維條碼比較,二維條碼所攜帶的信息量和信息密度都提高了幾倍,二維條碼可表示圖象、文字、甚至聲音。