當前位置₪╃: 首頁>關於我們>光虎新聞

OCR光學字元識別技術

  • 作者₪╃:

  • 來源₪╃:光虎光電科技(天津)有限公司

  • 訪問量₪╃:504

  • 釋出時間₪╃:2022-06-13 08:47:25

什麼是OCR光學字元識別₪╃↟╃•?


OCR (Optical Character Recognition··,光學字元識別)是指電子裝置(例如掃描器或數碼相機)檢查紙上列印的字元··,透過檢測暗╃☁│·、亮的模式確定其形狀··,然後用字元識別方法將形狀翻譯成計算機文字的過程╃✘✘↟。衡量一個OCR系統性能好壞的主要指標有₪╃:拒識率╃☁│·、誤識率╃☁│·、識別速度╃☁│·、使用者介面的友好性··,產品的穩定性··,易用性及可行性等╃✘✘↟。


在工業領域··,光學字元識別 (OCR) 是一項機器視覺任務··,包括從影象中提取文字資訊╃✘✘↟。

OCR是高精度文字識別技術··,並且對中等顆粒圖形噪聲無懈可擊╃✘✘↟。它們還適用於識別使用點陣列印機制作的字元╃✘✘↟。該技術為部分遮擋或變形的字元提供了令人滿意的結果╃✘✘↟。


識別過程的效率主要取決於文字分割結果的質量╃✘✘↟。大多數識別案例都可以使用提供的一組識別模型完成╃✘✘↟。在其他情況下··,可以輕鬆準備新的識別模型╃✘✘↟。


OCR光學字元識別技術步驟


為了實現最準確的識別··,有必要進行仔細的文字提取和分段╃✘✘↟。從影象獲取文字的總體過程包括以下步驟₪╃:


從影象中讀取文字


壹 |
貳 |
叄 |
肆 |
伍 |

獲取文字位置

從背景中提取文字

分段文字

使用準備好的OCR模型

字元識別




獲取文字位置


文字的位置是固定的··,它由稱為掩碼的框描述╃✘✘↟。例如··,個人身份證是按照正式規範製作的╃✘✘↟。每個資料欄位的位置是已知的╃✘✘↟。經過良好校準的視覺系統可以拍攝文字位置幾乎恆定的影象╃✘✘↟。

 




文字位置不是固定的··,但它與輸入影象上的特徵元素或特殊標記(光學標記)相關╃✘✘↟。要獲取文字的位置··,必須找到光學標記╃✘✘↟。這可以透過模板匹配╃☁│·、1D 邊緣檢測或其他技術完成╃✘✘↟。


未指定文字的位置··,但可以透過影象閾值輕鬆地從背景中分離字元╃✘✘↟。然後可以使用 Blob 分析技術找到正確的字元╃✘✘↟。

 




從背景中提取文字


文字提取過程中的主要複雜情況可能是光線不均勻╃✘✘↟。某些技術(如光規範化或邊緣銳化)有助於查詢字元╃✘✘↟。




原始影象

 

光規範化後的影象 



使用 Fourier 變換進行低頻影象阻尼後的影象


 


使用不均勻的光線取樣圖

經過光規範化處理的不均勻光線影象


此時··,已提取的文字區域已準備好進行分段╃✘✘↟。



分段文字


文字區域分割是將區域拆分為行和單個字元的過程╃✘✘↟。只有當每個區域包含一個字元時··,識別才可能實現╃✘✘↟。

 


使用區域形態過濾器將文字拆分為行的過程


當文字文字行分開時··,每行必須拆分為單獨的字元╃✘✘↟。



使用拆分割槽域得到多個字元的字元分割


接下來··,提取的字元將從圖形表示形式轉換為文字表示形式╃✘✘↟。


呼叫OCR模型庫


透過呼叫OCR模型庫··,使識別到的字元以文字形式與模型庫進行比對··,匹配資料最相似的模板··,得出準確的字元資訊╃✘✘↟。


字元識別


通常來說需要選擇適當的字元規範大小··,來分類字元的大小╃✘✘↟。





【來源₪╃:光虎光學內部培訓資料】
                                                                                         

光虎光學專業生產由德國設計的工業鏡頭╃✘✘↟。
以高精度雙遠心鏡頭為核心··,涵蓋高效能FA定焦鏡頭╃☁│·、變倍鏡頭等產品╃✘✘↟。
可實現為客戶定製化研發生產╃✘✘↟。光虎光學還代理歐美日機器視覺全系列產品╃✘✘↟。
如面陣與線掃工業相機╃☁│·、智慧相機╃☁│·、3D相機╃☁│·、紅外與紫外相機╃☁│·、光源╃☁│·、影象採集卡╃☁│·、機器視覺軟體及其他周邊產品╃✘✘↟。


婷婷色婷婷开心五月四房播播,亚洲国产精品日韩av专区,午夜a片无码区在线观看,偷窥厕所aaaaaa片偷窥