隨著人工智能的發(fā)展,在生活中有許多方便高效的應用,如人臉識別、證書識別與認證、名片識別、車牌識別等。,這些都方便了我們的日常生活。同樣,這些技術也可以為我們的日常業(yè)務流程提供智能高效的解決方案。
日常交易和清算業(yè)務交易中有各種電子郵件、傳真等文件,主要包括交易確認文件、存款協(xié)議、敲門指令、跨行收費、線下中標公告、海外券商確認單等。這些文檔需要手動識別并提取到系統(tǒng)中。利用光學字符識別技術,可以識別和糾正文檔圖像內(nèi)容,提取關鍵字段元素并與相關系統(tǒng)連接,減少人工輸入,提高工作效率,減少人工輸入錯誤。
典型的光學字符識別技術路線如下圖所示:
在光學字符識別技術中,圖像預處理通常旨在糾正圖像的成像問題。輸入的文字通過掃描儀進入電腦后,紙張的厚度、平滑度、打印質(zhì)量等都會造成文字失真,造成斷筆、粘連、污漬等干擾。因此,在進行文本識別之前,需要對有噪聲的文本圖像進行處理。因為這種處理工作是在字符識別之前,所以叫做預處理。預處理一般包括灰度化、二值化、幾何變換(透視、畸變、旋轉等)。),畸變校正,模糊去除,圖像增強和光線校正,線和字分割,平滑,歸一化等。
最重要的環(huán)節(jié),也是影響識別準確率的環(huán)節(jié),是文本檢測和文本識別。文本檢測是檢測文本的位置、范圍和布局,包括布局分析和文本行檢測。文本檢測的主要問題是哪里有字符,字符的范圍有多大。
文本識別是基于文本檢測,識別文本的內(nèi)容,主要是識別每個字符是什么。對于文本圖像,提取特征并將其扔給分類器,分類器將對其進行分類,并告訴您該特征應該識別哪個文本。分類器一般通過模板匹配、判別函數(shù)、神經(jīng)網(wǎng)絡分類、基于規(guī)則的推理等方法來設計。分類器通常在實際識別之前進行訓練,這是一個有監(jiān)督的學習過程。有很多成熟的分類器,比如SVM,CNN。將圖像中的文本信息翻譯成文本信息。
識別出的文本可以通過詞庫中的匹配詞典進行修正,比如相似詞的處理:“分”和“Xi”是相似的,但如果遇到“分數(shù)”這個詞,就不應該識別為“Xi數(shù)”,因為“分數(shù)”是一個正常的詞。這需要語言模型來糾正,通常需要再次檢查以確保其正確性。
劇終
OCR技術步驟多,算法復雜。但是隨著識別算法的不斷完善和成熟,字符編碼庫更加準確,OCR識別的準確率也大大提高。目前,OCR字符特征的主流算法識別率幾乎達到95%。同時有成熟的OCR引擎,可以幫助開發(fā)者提高開發(fā)效率。
前期我們在部分業(yè)務中測試了近1000份文檔,整體成功率在97%以上。通過引入OCR技術,將優(yōu)化業(yè)務流程,減少人工提取操作,提高清算估價業(yè)務的自動化水平,使業(yè)務流程更加簡單高效。
1.《ocr技術 OCR技術簡介》援引自互聯(lián)網(wǎng),旨在傳遞更多網(wǎng)絡信息知識,僅代表作者本人觀點,與本網(wǎng)站無關,侵刪請聯(lián)系頁腳下方聯(lián)系方式。
2.《ocr技術 OCR技術簡介》僅供讀者參考,本網(wǎng)站未對該內(nèi)容進行證實,對其原創(chuàng)性、真實性、完整性、及時性不作任何保證。
3.文章轉載時請保留本站內(nèi)容來源地址,http://f99ss.com/guonei/1296980.html