對比數(shù)據(jù)庫:當輸入文字算完特征后,不管是用統(tǒng)計或結構的特征,都須有一比對數(shù)據(jù)庫或特征數(shù)據(jù)庫來進行比對,數(shù)據(jù)庫的內(nèi)容應包含所有欲識別的字集文字,根據(jù)與輸入文字一樣的特征抽取方法所得的特征群組。對比識別這是可充分發(fā)揮數(shù)算理論的一個模塊,根據(jù)不同的特征特性,選用不同的數(shù)學距離函數(shù),較有名的比對方法有,歐式空間的比對方法、松弛比對法(Relaxation)、動態(tài)程序比對法(Dynamic Programming,DP),以及類神經(jīng)網(wǎng)絡的數(shù)據(jù)庫建立及比對、HMM(Hidden Markov Model)…等的方法,為了使識別的結果更穩(wěn)定,也有所謂的專家系統(tǒng)(Experts System)被提出,利用各種特征比對方法的相異互補性,使識別出的結果,其信心度特別的高。

字詞后處理:由于OCR的識別率并無法達到,或想加強比對的正確性及信心值,一些除錯或甚至幫忙更正的功能,也成為OCR系統(tǒng)中必要的一個模塊。字詞后處理就是一例,利用比對后的識別文字與其可能的相似候選字群中,根據(jù)前后的識別文字找出合乎邏輯的詞,做更正的功能。字詞數(shù)據(jù)庫:為字詞后處理所建立的詞庫。OCR后的關卡,在此之前,使用者可能只是拿支鼠標,跟著軟件設計的節(jié)奏操作或僅是觀看,而在此有可能須特別花使用者的精神及時間,去更正甚至找尋可能是OCR出錯的地方。

一個好的OCR軟件,除了有一個穩(wěn)定的影像處理及識別核心,以降低錯誤率外,人工校正的操作流程及其功能,亦影響OCR的處理效率,因此,文字影像與識別文字的對照,及其屏幕信息擺放的位置、還有每一識別文字的候選字功能、拒認字的功能、及字詞后處理后特意標示出可能有問題的字詞,都是為使用者設計盡量少使用鍵盤的一種功能,當然,不是說系統(tǒng)沒顯示出的文字就一定正確,就像完全由鍵盤輸入的工作人員也會有出錯的時候,這時要重新校正一次或能允許些許的錯,就完全看使用單位的需求了。結果輸出

白條、黑條的寬度不同,相應的電信號持續(xù)時間長短也不同.但是,由光電轉(zhuǎn)換器輸出的與條形碼的條和空相應的電信號一般僅10mV左右,不能直接使用,因而先要將光電轉(zhuǎn)換器輸出的電信號送放大器放大.放大后的電信號仍然是一個模擬電信號,為了避免由條形碼中的疵點和污點導致錯誤信號,在放大電路后需加一電路,把模擬信號轉(zhuǎn)換成數(shù)字電信號,以便計算機系統(tǒng)能準確判讀。