隨著人類生活的每一個領域都越來越自動化, 我們拚命的尋找和人造智能的差異, 雖然像 AlphaGo 這樣的機器人能夠自學掌握遊戲, 但至少他們永遠不可能寫一本書, 做愛, 成為國家公民, 或者欣賞自然風景之美, 對吧?
你想錯了, 以上這些它們都做到了.
我必須告訴你, 人工智慧破解了一個被人們廣泛使用的工具: 驗證碼, 用於區分人類和機器人的工具.
驗證碼是煩人的謎題, 可能會要求你填寫扭曲的圖片中的文本, 或者點擊圖片中所有的汽車. 根據最近在科學雜誌上發表的一篇研究, 一種新型的 AI 能夠以高達 66.6 % 的準確率決某些類型的驗證碼. 作為對比, 人類的準確率為 87% , 而機器只要能夠達到 1 % 的準確率, 則被認為已經破解驗證碼.
驗證碼 (CAPTCHA) , 全稱全自動區分計算機和人類的圖靈測試, 發明於 20 世紀 90 年代後期, 最初用於防止欺詐和垃圾郵件機器人. 基本的想法是建立一個人類容易破解, 而計算機很難破解的難題.
計算機很擅長計算, 閱讀純文字也不難, 在動態和靜態圖片中識別物體的能力也越來越強, 但當這些映像稍微扭曲時, 電腦就陷入了死迴圈. 原因在於, 我們可以訓練計算機識別所有字型中的 'M' , 但這些 M 卻可以以無數種方式進行扭曲, 計算機不具備概括能力.
從一小部分例子中學習和概括的能力是我們的大腦與計算機的差異之一, 這種能力使我們能夠輕鬆地解決驗證碼. 正如科學雜誌上介紹的那樣, 紮克伯格和貝佐斯資助的人工智慧公司 Vicarious 的研究人員開發了機率機器視覺演算法, 該演算法能夠理解並通過驗證碼測試, 因為它可以從一些小例子中進行概括.
其他研究人員已經訓練了深度學習演算法來破解驗證碼, 但是這些演算法通常需要數百萬個標記的案例來訓練演算法, 而且只能解決一種特定的樣式. 而 Vicarious 的人工智慧可以破解各種文本的驗證碼風格, 並且效率更高.
借鑒了 '實驗神經科學數據' 的見解, Vicarious 的研究人員提出了一種稱為遞歸皮層網路的機率演算法, 該演算法將驗證碼作為一個基於文字訓練映像的形狀和外觀的集合 (例如字母表面的平滑性) .
其他神經網路能夠識別那些由人工標記過數百萬次的單詞和字母的訓練樣本. 而遞歸皮層網路更接近真實的人類大腦對視覺線索的反應. RCN 首先根據字母輪廓和少數幾個未被扭曲的示例字母的外觀生成模型, 然後用它來確定在扭曲的驗證碼短語中對應的是哪個字母.
正如研究人員在文章中寫到的, 如果一台機器能以高於 1% 的準確率解決這個問題, 那麼驗證碼就被破解了. Vicarious 演算法提供了多種不同的驗證碼風格, 並且在破解方面具有非常高的成功率. 它解決 reCAPTCHA 的準確率為 66.6% , BotDetect 的準確率為64.4% , 雅虎驗證碼的準確率為 57.4% , Paypal 驗證碼準確率為 57.1% , 所有這些只需要 '非常少的訓練數據' . 例如, 對於 reCAPTCHA, 演算法每個字元只訓練了五個非失真的案例.
其他現有技術的神經網路將需要比實際驗證碼字元串大 5 萬倍的訓練集, 而不僅僅是清晰的字元. 作為一個基準, 研究人員使用不同的神經網路模型來達到 89.9% 的準確率, 但是它需要 230 萬訓練映像才能到實現, 而且當驗證碼做出很小的改變時, 準確率就會大大下降.
新演算法的主要改進在於, Vicarious 的研究人員建立了一個神經網路, 該神經網路將根據形狀和外觀建立字母模型 可以用來 '理解' 驗證碼. 而不是通過數百萬個驗證碼實例來訓練神經網路破解特定類型的驗證碼.
研究人員在建立了可以解決各種驗證碼的神經網路, 意味著人類將不得不開始尋找更強大的機器人訓練機制. Google 開創的一個解決方案就是音頻 reCAPTCHA, 就像文本驗證碼一樣, 但通過語音. 最近馬里蘭大學的一個計算機科學家團隊建立了 unCaptcha, 一個免費的演算法, 可以在幾秒鐘內解決 reCAPTCHA , 準確率達到 85% 以上.
儘管驗證碼在可預見的將來仍然可能被用作互聯網的第一道防線, 但它不能保證網站的訪客百分之百是真人. 不久之後, 我們可能會使用銀翼殺手中的 '人性測驗' 來登陸網站.