丝袜人妻一区二区三区_少妇福利无码视频_亚洲理论片在线观看_一级毛片国产A级片

【12306驗證碼識別】專題搜狗識圖搜索率先實現(xiàn)12306圖形驗證碼自動識別

最近,sunguou瀏覽器宣布成功實現(xiàn)了12306圖形驗證碼的自動識別,從而實現(xiàn)了全自動訂票體驗。

據(jù)悉,搜狗瀏覽器之所以成為市面上首款、也是唯一一款實現(xiàn)了新版12306驗證碼自動識別的瀏覽器軟件,正是借助了深厚的搜狗識圖搜索技術積淀,和強大的大數(shù)據(jù)處理能力, 打出了“OCR技術+圖像分類技術”相結合的組合拳。

與以往的文字、數(shù)字驗證輸入不同,中國鐵路客戶服務中心(12306)推出的新版圖形驗證碼,要求用戶在填寫好登錄名和密碼之后,需要根據(jù)文字提示,識別并點擊驗證圖片中的對應選項,只有準確地選取圖形驗證碼才能登陸成功。由于識別難度較大,該方式一經(jīng)推出,隨即引發(fā)不少網(wǎng)友吐槽:買火車票前,還得先測智商?

該驗證系統(tǒng)推出后,雖然不少搶票軟件聲稱不受影響,但選圖仍需用戶手動操作完成,事實上新版圖形驗證碼對于搶票軟件而言,著實帶來了一道難題。通常,該類軟件會借助光學字符識別技術(簡稱:OCR技術),支持自動驗證碼輸入,為用戶節(jié)省登錄時間,提高搶票效率。而對于此前12306的文字、數(shù)字驗證碼來說,OCR技術更為適用。而12306推出新版圖形驗證碼以后,僅憑OCR技術來解決新問題,就顯得有些“捉襟見肘”了。

究其原因,首先需要了解OCR其背后的技術原理。通常,OCR識別包括預處理、二值化、去噪、傾斜校正、字符切割、字符識別、后處理等幾個步驟。簡言之,通過捕捉圖像并識別文字,OCR技術使得電腦可以像人一樣閱讀。

而12306新舉措,使得驗證碼輸入由傳統(tǒng)相對簡單的字母數(shù)字識別輸入,升級為用戶需要根據(jù)描述文字從候選多張圖片中勾選對應類別的一個選擇過程。也就是說,12306新驗證碼識別由原來的填空題,升級為多選題,由于答案的個數(shù)是不確定的,可以說變成了一個不定項選擇題。那么,這一問題就不難理解了,原本基于文字就能獲得較高識別率的OCR技術,卻無法解決候選圖片的類別判定,因此就不能破解新版圖形驗證碼。

針對這一難題,搜狗識圖搜索率先提出解決方案,打出“OCR技術+圖像分類技術”相結合的組合拳,加之以搜狗深度學習技術和大數(shù)據(jù)分析處理功力,實現(xiàn)了對12306新版圖形驗證碼的自動識別。

在OCR技術的基礎上,搜狗識圖搜索更進一步,借用了圖像分類的思想,首先將經(jīng)過變形處理的描述文字圖像通過OCR技術識別成文本,再通過圖像分類技術,對于多張候選圖像識別出其分類信息,然后將文本和分類信息進行自動匹配,從而實現(xiàn)驗證碼的自動識別過程。這樣,憑借“OCR技術+圖像分類”這套組合拳,搜狗識圖搜索就完成了圖像識別最為關鍵的第一步,有效解決了OCR技術無法實現(xiàn)圖像識別的問題。

當然,在初步識別圖像的基礎上,想要準確地選取圖形驗證碼,還需要提高識別精度。目前,搜狗識圖搜索對于大部分的12306圖形驗證碼能夠?qū)崿F(xiàn)自動破解,其圖像識別精度在該技術領域,已經(jīng)達到了國內(nèi)領先水平。

而取得這一成績的背后,依靠的正是搜狗深度學習技術和大數(shù)據(jù)積累。目前,伴隨互聯(lián)網(wǎng)科技高速發(fā)展,“深度學習”這一被機器學習大師Hinton等人于2006年提出的新概念,其覆蓋領域愈來愈廣泛,它通過多層次的學習而得到對于原始數(shù)據(jù)的不同抽象層度的表示,進而提高分類和預測等任務的準確性。此次,搜狗識圖搜索成功將其應用于圖像識別領域,通過模擬人認知圖片的過程,多層次地模擬和學習,大幅提高了圖片分類和識別的準確性。截至目前,搜狗深度學習技術已經(jīng)積累千萬量級的模擬訓練數(shù)據(jù),達到了行業(yè)領先水平。

另一方面,搜狗面向全網(wǎng)圖像標注而積累的大數(shù)據(jù),也同樣起到了非常重要的作用。如果說,深度學習技術是急先鋒的角色,那么大數(shù)據(jù)則是充實補給的后方陣地,對于深度學習而言,需要大量數(shù)據(jù),正如康奈爾大學創(chuàng)意機器人實驗室主任胡迪.利普森所言,深度學習極度“數(shù)據(jù)饑渴”,如果它們得到越多的數(shù)據(jù),就學習得越快越好?!蹦壳?,搜狗全網(wǎng)圖像標數(shù)據(jù)庫已經(jīng)沉淀了數(shù)千萬量級的數(shù)據(jù),而這也為搜狗圖像識別精度大幅提升奠定了堅持基礎,并使其實現(xiàn)圖形驗證碼識別真正成為可能。

1.《【12306驗證碼識別】專題搜狗識圖搜索率先實現(xiàn)12306圖形驗證碼自動識別》援引自互聯(lián)網(wǎng),旨在傳遞更多網(wǎng)絡信息知識,僅代表作者本人觀點,與本網(wǎng)站無關,侵刪請聯(lián)系頁腳下方聯(lián)系方式。

2.《【12306驗證碼識別】專題搜狗識圖搜索率先實現(xiàn)12306圖形驗證碼自動識別》僅供讀者參考,本網(wǎng)站未對該內(nèi)容進行證實,對其原創(chuàng)性、真實性、完整性、及時性不作任何保證。

3.文章轉(zhuǎn)載時請保留本站內(nèi)容來源地址,http://f99ss.com/keji/2096621.html

上一篇

12306驗證碼識別,干貨看這篇!12306圖片驗證碼識別率達70% 從未用過明星照片

下一篇

2012蘋果發(fā)布會,干貨看這篇!曾經(jīng)的輝煌 現(xiàn)在的平凡 回顧諾基亞手機歷代產(chǎn)品

12306驗證碼識別,干貨看這篇!12306圖片驗證碼識別率達70% 從未用過明星照片

12306驗證碼識別,干貨看這篇!12306圖片驗證碼識別率達70% 從未用過明星照片

12306驗證碼識別相關介紹,據(jù)12月11日《TechWeb報道》報道,網(wǎng)民難以識別12306網(wǎng)站照片驗證碼,據(jù)一家瀏覽器企業(yè)統(tǒng)計,用戶一次成功8%,兩次成功的比例僅為27%。 但中國鐵道科學研究院電子計算技術研究所副所長朱建生對...

12306驗證碼識別 12306史上最奇葩驗證碼:正常用戶可輕松識別 搶票軟件被拒之門外

為了防范搶票軟件,12303官網(wǎng)經(jīng)常更換驗證碼,但無非就是或復雜或簡單的字母加數(shù)字而已。如今登陸12306,驗證碼部分首先顯示一個碩大的白框,中間寫著“點此開始驗證”,點擊后才會出現(xiàn)驗證碼圖片,而且有八個之多,用戶需要根據(jù)提示,點擊選中圖中所有的相關物品,比如賀卡、雕像、貝殼、玻璃瓶、搟面杖、熱氣球等,倒都是日常生活中能見到的,看不清或者沒把握的...