機器翻譯產品早在 2010 年就開始出現, 但更多的應用主要是在旅遊, 社交, 商業等 C 端場景, 而會議同傳仍然是該領域的至高挑戰.
創立了 17 年的博鼇亞洲論壇第一次使用 AI 同傳, 不僅是這個年度國際頂尖論壇所做出的重要改變, 也是「騰訊同傳」一次不小的考驗. 以至於馬化騰在朋友圈也對準備上崗博鼇的騰訊同傳不無關切, 「新嘗試, 多包涵. 」
據騰訊公司 QQ 瀏覽器及「騰訊翻譯君」負責人李學朝接受知曉程序專訪時介紹, 從 4 月 9 日, 騰訊同傳正式投入使用於博鼇亞洲論壇開幕前各場分論壇的情況來看, 騰訊同傳可以在嘉賓自由多語發言切換的情況下, 完成翻譯結果;使用過程中也發現一些壞的例子, 團隊已及時進行修複, 符合對 AI 同傳的預期.
然而, 此前的小試牛刀之後, 也會在今天迎來大考. 博鼇亞洲論壇今天上午正式舉行開幕儀式, 作為開幕式同傳支援之一, 騰訊同傳將與人工同傳一起, 為會議提供雙語紀要服務.
李學朝告訴知曉程序, 此次騰訊同傳主要採用「現場投屏」, 「小程序」2 種模式. 現場參會的他國領導人, 政要以及國際友人可以通過會場大屏幕即時觀看演講文字版;而遠程觀看這場開幕式的用戶, 則可以掃描騰訊同傳小程序碼, 獲取會議的中英文雙語演講內容, 並可「點擊聽譯文」收聽演講.
銜枚疾走的「騰訊翻譯君」
騰訊人工智慧同聲傳譯解決方案由 2 個部分組成: 「騰訊翻譯君」+「微信智聆」.
李學朝介紹說, 博鼇亞洲論壇上實際的同傳實現原理是, 微信智聆把人聲識別為文字, 騰訊翻譯君再把文本翻譯成目標語言, 再通過語音合成進行播報.
其中「微信智聆」團隊早在 2011 年就開始成立;相較而言, 「騰訊翻譯君」要晚的多, 這個由 MIG 內部孵化的團隊成立時間為 2016 年. 騰訊翻譯君與微信智聆合體為騰訊同傳則是在 2017 年.
伴隨著騰訊的潛心布局, 翻譯領域的技術變革也正迅疾發生. 2016 年初, 騰訊開始研發 AI 翻譯產品, 當時整個行業都在採用的是 SMT 的統計機器翻譯技術, 其背後的核心演算法是基於短語的機器翻譯, 錯誤率較高.
技術的奇點出現在 2016 年底. 穀歌在機器翻譯方面取得重大突破, 所發布的神經網路機器翻譯系統(Google Neural Machine Translation), 簡稱 GNMT, 實現了迄今為止機器翻譯質量的最大提升.
正是看到這一突破, 騰訊翻譯君團隊很快調轉走向, 採用了 NMT 技術. 翻譯君團隊基於神經網路演算法和騰訊的數據開發了 TNMT 演算法. 不僅在騰訊內部勝出, 也很快確立了自己的核心優勢.
如今, 「騰訊翻譯君」已經支援 15 個語種, 每天翻譯請求超過 4 億. 而在博鼇亞洲論壇之前, 騰訊同傳已經有近百場的實戰, 其中包括 VMWARE 中國女性發展論壇, 2018 年騰訊年會, 2018 微信公開課 Pro, 騰訊媒體 + 峰會等. 會議現場中文語音識別準確率平均可達 97%, 翻譯可接受度超過 92%.
一直以來, 同聲傳譯的難點已經被行業所共知. 李學朝對知曉程序說, 在大型會議之前, 騰訊是不能拿到發言稿的, 這需要騰訊同傳完全擬人化地應對現場的各種狀況.
比如說, 在 2018 年年初騰訊年會上, 馬化騰就臨場決定使用沒有經過準備的騰訊同傳. 「但使用結果出來後, 大家對翻譯君和微信智聆這套同傳方案更有了底氣. 」李學朝說.
不過到了博鼇亞洲論壇, 現場情況的複雜性對騰訊同傳又提出了更高要求. 針對論壇專業度高, 覆蓋度廣的特殊場景, 騰訊翻譯君還通過定製化術語支援, 領域自適應等技術進一步優化翻譯結果. 微信智聆也專門針對博鼇論壇嘉賓的國家, 地區語言特徵進行專項優化訓練, 並通過工程優化實現多人, 多語種會話的並行識別, 保證現場的識別準確率.
不過, 李學朝告訴知曉程序, 雖然騰訊翻譯君已經支援 15 個語種, 但此次博鼇亞洲論壇還僅使用中英雙語翻譯.
「騰訊同傳」的進擊之道
在博鼇, 騰訊成為業界首個創新支援同傳雙語內容多渠道查看和回放的 AI 同傳服務, 包括會議現場投屏, 小程序查看, 語音收聽, 會議紀要回放等.
而騰訊同傳小程序也是在本屆論壇初次亮相.
李學朝說, 在翻譯君上線之初, 主要的切入點是旅遊場景下的個人用戶市場. 為個人消費者提供文本翻譯, 語音翻譯, 拍照翻譯, 口語跟讀測評等多類型翻譯服務, 並能通過手機 App, 微信公眾號, 微信小程序, PC 網頁版等渠道使用.
隨著機器翻譯和翻譯需求的井噴, 越來越多的領域開始浮現出對線上化, 智能化, 效率化的翻譯要求. 翻譯君從剛開始的口語, 旅遊等, 逐漸擴展到微信, QQ, 「王者榮耀海外版」(Arena of Valor)等社交領域, 以及 QQ 瀏覽器, QQ 郵箱, 甚至延伸到金融, 教育, 硬體等各個行業.
相比較其他產品, 騰訊翻譯君的快速拓展, 仍然體現了騰訊的平台優勢, 以及騰訊團隊對於線上場景的理解. 「擁有過硬的技術產品之後, 我們也充分利用好騰訊強大的平台, 公司有很多用戶場景和需求可以滲透進去. 所以, 我們能夠不斷地從平台接入騰訊翻譯, 因為我們業務在出海, 可以逐漸找到更多落地的場景. 」李學朝表示.
而對於最重要的兩個移動平台, App 與小程序, 騰訊翻譯君採取了分別不同的運營策略. 比如, 口語跟讀是時下翻譯應用很重要的使用場景, 騰訊翻譯君觀察到這點後, 在 app 內設置雙語海報, 口語學習等功能內容, 從而提高了玩家黏性.
至於小程序, 更多是在微信生態內, 以其無需下載, 即用即走的特點為翻譯君帶來更大的訪問量, 更多的體驗用戶, 主要突出最核心的實用功能——翻譯. 李學朝告訴知曉程序, 目前, 騰訊翻譯君小程序主要為個人用戶所使用;而在博鼇亞洲論壇正式啟動上線的騰訊同傳小程序, 則服務於會議需求, 對接給 B 端, 並提供給對會議感興趣的參會者與遠程參會者.
而在企業級客戶服務對接方面, 李學朝也表示, 騰訊同傳現在主要有兩種方式. 第一種是線下伺服器的模式, 採取專門 VIP 式的服務, 由翻譯君團隊和微信團隊的技術人員到現場支援. 第二種是雲服務, 聯合騰訊雲共同提供. 當用戶和公司有需求的時候, 通過騰訊雲可以體驗和滿足.
AI 與人工同傳, 是交戰還是交融?
人工智慧同傳的快速發展, 也留給了行業一個經久的叩問, AI 到底會不會替代人工?
事實上, 伴隨著騰訊同傳在博鼇亞洲論壇的首日亮相, 有關翻譯準確率的問題也引發了行業關注. 對此, 騰訊方面回應稱, 由於各種「新奇」的語料知識, 專業名詞, 五湖四海的英語流派熔於一爐, 再加上話筒雜訊, 回聲等環境音的幹擾, 的確對騰訊同傳構成較大挑戰.
「騰訊同傳還在學習和成長之中, 對於一些專有名詞倒裝句, 以及中英文流利切換的嘉賓演講, 還需要繼續加強學習. 」騰訊同傳不是做替代者, 而是行業的賦能者.
至於網傳由於現場翻譯效果不佳, 4 月 9 日下午, 騰訊在海澱希格瑪大廈緊急招募人工同傳補位的消息, 知曉程序向騰訊同傳求證, 得到回應稱, 這完全是一個烏龍.
騰訊同傳告訴知曉程序, 所謂的邀請人工同傳, 並非為騰訊同傳團隊用於現場 AI 同傳, 而是服務於騰訊新聞團隊做閉門採訪等專業報道. 而且, 本次會議的多數場次本來就採用了 AI 同傳與人工同傳互相配合的形式, 並無再次邀請的必要.
李學朝也認為, 「語言是一種交流工具, 機器翻譯與人工翻譯各有其擅長的應用場景和服務. 」比如, 機器翻譯可以每天提供億級翻譯次數, 有對新領域的定製術語快速掌握的能力, 這是人工翻譯難以複製的;而翻譯員所能整合的人際了解, 模糊語義的掌握等, 這些是機器翻譯短期內不容易達到的.
畢竟, AI 所習得的僅僅是「智能」, 而人類擁有的卻是「智慧」.