計算機專家尼克拉斯·卡利尼 (Nicholas Carlini) 和大衛·瓦格納 (David Wagner) 成功欺騙Mozilla最流行的DeepSpeech開源文本-語音轉換系統. 給出任意一段音頻聲波, 科學家就可以製作出另一段音頻聲波, 相似度超過99.9%, 轉錄時科學家可以選擇任意短語, 速度最高可以達到每秒50字元. 攻擊的成功率高達100%, 不論想要轉錄的語音是怎樣的, 最初所說的源短語是怎樣的, 都可以成功. 如果輸入的是任意波形的聲音, 但不是語音, 比如輸入音樂, 科學家可以將語音插入音頻, 你無法識別它是語音; 讓語音保持靜默, 就可以將音頻隱藏到文本-語音轉換系統.
也就是說, 從理論上講, 科學家可以處理任意音頻檔案, 欺騙文本-語音轉換器, 讓它們相信音頻是其它東西. 當今的世界到處都是智能音箱和語音助手, 新攻擊技術無疑是一枚重磅炸彈.