驗證碼擋不住, 美企開發 AI 演算模型成功突破 CAPTCHA 驗證

當人們在網站上註冊或購物時, 經常會出現映像驗證碼的輸入要求, 為了區分出「真人」, 圖片上會出現線條及扭曲分隔開的文字, 讓計算機難以識別, 但這種方式最近被一款人工智慧 (AI) 破解了.

NPR 報導, 新創公司 Vicarious 表示, 他們已經運用 AI 開發出一種演算法模型, 可以通過「全自動區分計算機與人腦的公開圖靈測試」, 也就是現在十分常見, 被稱為 CAPTCHA 的驗證機制.

CAPTCHA 主要是在圖片上顯示一組驗證碼, 由混亂的字母, 波紋線和一些背景雜訊組合而成, 類似測試在過去對於計算機判讀來說十分困難, 也因此 CAPTCHA 的能力也被一些 AI 研究人員當作測試的關鍵基準.

這並非第一次有人成功破解 CAPTCHA 的驗證, 大約在 10 年前, 一家科技公司就曾經被販賣票卷的 Ticketmaster 起訴, 原因是繞過 CAPTCHA 系統大量購買演唱會門票.

但過去這項例子中, 主要是利用 CAPTCHA 中特定的弱點, 防止程序出現細微的變化藉以繞過系統, 但 Vicarious 聯合創始人 Dileep George 指出, 這項新的研究卻是「從根本上」打倒了 CAPTCHA.

過去多是採用深度學習 (Deep learning) 來訓練 AI 對特定事物作出反應, 透過這樣的訓練, AI 將能逐漸學會識別圖片中的不同字母, 但一旦字母互相重迭, AI 便會變的難以識別.

George 解釋, 深度學習只是複製人腦工作的一部分方式, 就像人們也會從經驗中學習一樣. 但人類小孩並不需要看過大量, 不同形式的字母才能區別, 即使出現的字母比較大又是斜體, 小孩依然能夠輕鬆辨識出來.

George 表示, 他們發現大腦在接受視覺時, 會自然出現一些假設, 但過去使用的深度學習並沒有相同情況. 為了讓 AI 也具有這種特性, Vicarious 團隊改為採用遞歸皮質網路 (RCN) 技術, 讓 AI 即使在較少的培訓之下, 也能夠更好的推理出看到的內容.

在訓練階段, AI 在看到字母后便會建構出它所認知的字母模型概念, 理解並猜測字母的輪廓, 內部, 背景等, 之後新的圖片出現時, AI 便會試著運用過去建立的理解去解釋這張圖片, 當字母出現部分重迭, 它便能理解部分的缺失是因為字母的部分隱藏在另一個字母后面.

Vicarious 團隊提到, CAPTCHA 有非常多種類型, 但無論哪種只要被演算法達到 1% 以上的準確度, 就能夠被視為破解. 而這款 AI 演算法模型在 reCAPTCHAs 的測試中, 準確率達到 66.6%, BotDetect 上達到 64.4%, Yahoo 和 PayPal 上則都達到 57% 左右.

雖然 Vicarious 的演算模型確實在通過 CAPTCHA 驗證機制上達到不錯的成效, 但這項研究的主要目標其實是要讓機器人在視覺上能像人類一樣理性思考, 和破解 CAPTCHA 並沒有太大關係.

George 表示, 團隊的長遠目標是建立像是人腦一樣的 AI, CAPTCHA 只是一個自然而然的測試, 因為這正好能夠檢測系統是否能像人腦一樣工作.

George 強調, 機器人需要認識周遭的世界, 能夠理解並操作物體, 在人們打算應用的領域中, AI 必須要在較少的培訓之下, 運用快速推論, 非常靈活的方式處理事情.

「這是技術的必然進步方向, 人們必須接受這件事: 計算機將會像人腦一樣工作. 」

目前尚不清楚這項研究對資訊安全會有多大影響, George 指出, Google 已經開始從基於文字的 CAPTCHA 轉移到更進步的測試之中, 隨著人工智慧越來越聰明, 這些驗證機制也必須找出新的方式, 來確保用戶的人類身分.

2016 GoodChinaBrand | ICP: 12011751 | China Exports