
美國馬里蘭大學(xué)(University of Maryland)的4名研究人員近日發(fā)表一自動化系統(tǒng)unCAPTCHA,宣稱可破解由Google打造的語音版reCAPTCHA,且準確率高達85.15%,并已藉由GitHub釋出了該系統(tǒng)。
Google的reCAPTCHA為全球最受歡迎的CAPTCHA系統(tǒng)之一,透過圖像來驗證來者是人類或機器人,以保護網(wǎng)路服務(wù)不被龐大的機器人所侵襲,估計至少有數(shù)十萬個網(wǎng)站采用reCAPTCHA。至於語音版的reCAPTCHA則是專為視障人士所設(shè)計,它在吵雜的背景環(huán)境中以不同的速度、音調(diào)或口音念出數(shù)字,并要求使用者填入所聽見的數(shù)字。
而unCAPTCHA系統(tǒng)即是基於語音轉(zhuǎn)換成文字的技術(shù),先下載語音版的CAPTCHA,把這些語音切割成個別的數(shù)字音頻,再將各個數(shù)字音頻上傳到網(wǎng)路上的各種語音轉(zhuǎn)文字服務(wù),然後把這些服務(wù)的回應(yīng)修改成數(shù)字,例如倘若聽起來像是「True」,那麼可以假設(shè)這個數(shù)字是「Two」,整合這些不同服務(wù)的結(jié)果,并將數(shù)字回傳至答案上。
unCAPTCHA所利用的線上語音轉(zhuǎn)換文子服務(wù)涵蓋了IBM、Google Cloud、Google Speech Recognition、Sphinx, Wit-AI與Bing Speech Recognition。
在研究人員的測試中,unCAPTCHA辨識個別數(shù)字的準確率高達92%,而整串CAPTCHA的準確率也達到85%以上。