謝耘: 人工智慧技術的本質與系統性創新的意義【中国好品牌网】

任何事物只有放在它所存在的環境中, 才能準確理解它的本質. 今天, 大數據, 人工智慧等概念由於商業炒作等多方面的原因, 已經變得模糊不清了. 許多具體的技術也被罩上了奪目的光環, 或有意被賦予了能夠引發奇妙想象的名字, 如 '深度學習' .

下面, 我們來看一下資訊技術產業中的不同要素, 在從科學到應用的這個鏈條上, 各自處於什麼樣的位置. 為了不陷入不必要的細節而又能揭示本質, 我們將這個鏈條分為五個環節: 科學原理, 基礎共性技術, 具體應用技術, 基礎系統原理/技術及具體應用系統, 見圖1.

圖1 從科學原理到應用系統, 圖片來源: 作者供圖, 下同

科學原理是對基本運動規律的認識總結, 而技術是對規律的運用. 所以新的科學原理的提出, 常常會對社會產生深刻而廣泛的影響. 正因為科學原理的意義如此之大, 所以 '科學' 也常常被盜用. 許多技術性的產出, 也被帶上了 '科學' 這個帽子. 在計算機領域, 圖靈機與計算複雜性理論基本上屬於科學原理這個範疇. 也正因為如此, 計算機才被冠以了 '科學' 的稱謂.

從根本上看, 人工智慧熱潮在90年代的冷卻, 是因為人們在人工智慧領域經過了幾十年的努力, 沒有能夠理解一般意義上的智能過程的本質, 因而也就沒有能夠取得科學意義上的原理性突破, 在理論上抽象出類似數字基本計算那樣的基本智能操作, 用以支撐更為高級複雜的智能過程. 所以人工智慧領域的產出, 雖然豐富而且影響巨大, 但是卻始終沒有達到科學原理的高度.

在一個產業中, 會有一些基礎性共性技術, 有時也被稱為核心技術, 它們支撐著整個產業. 在資訊技術產業中, 作業系統, 資料庫, 整合電路等就屬於這個層面的技術. 這些技術的進步, 對整個產業的影響也是全局性的. 正是整合電路技術的進步, 促成了2010年前後整個資訊技術產業發生了曆史性的轉折 (見《轉折——眺望IT巔峰》第二章第三節) . 人工智慧領域不僅沒有科學原理層面的成果, 而且至今也沒有能夠產生支撐一個產業的基礎共性技術, 不論我們給那些技術/方法起個什麼樣的名字.

在基礎共性技術之上, 還有面向不同問題的具體應用技術去解決不同類型的問題. 在這個層面, 我們才遇到了人工智慧的蹤影. 如我們在《轉折——眺望IT峰》一書第八章第二節中所述: '當人們意識到我們沒有能力用一些普適的基本邏輯化規則或機制去有效地解決各種 '智能問題' 時, 人工智慧的研究便紮入到了各種具體的問題之中. 針對不同類型的問題, 發展出了花樣繁多的解決方法, 也取得了很大的進展. …….也正因為如此, 人工智慧目前更多地是被當成了一些具體的應用工具方法, 融入到了不同類型的應用之中, 以自己具體的技術性名稱出現, 默默無聞地發揮著自己的作用. 這些年關於人工智慧的一本經典的教科書的名字是 '人工智慧——一種現代方法' , ……它的副標題 'A Modern Approach' 就是指試圖採用 '智能體' (Agent) 的概念將人工智慧在各個不同領域中的方法整合到一個統一的框架之中. '

其實, 用智能體這個概念整合與人工智慧相關的技術方法, 也是沒有辦法的辦法, 顯示出了這個領域的一種無奈的現實: 只有實用的一些具體技術方法, 缺少科學原理或基礎共性技術的支撐, 也沒有基礎性系統級的有效理論. 這些年被熱捧的 '深度學習' , 也是這個層面的技術.

'深度學習' 這個概念包括了深度信念網路, 卷積神經網路, 迴圈與遞歸網路等多種不同的具體網路模型與相應的演算法, 用來解決不同類型的問題. 它們實際上是藉助計算機的 '暴力' 計算能力, 用大規模的, 含有高達千萬以上的可調參數的非線性人工神經網路, 使用特定的 '學習/訓練' 演算法, 通過對大量樣本的統計處理, 調整這些參數, 實現非線性擬合 (變換) , 從而實現對輸入數據特徵的提取與後續的分類等功能.

它是解決特定類型問題的一些具體的方法, 而不是具有像人那樣的一般意義上的學習的能力, 儘管這個名字確實引發了許多不了解這個技術的人的這方面的想象. 其實, 資訊技術領域內的絕大部分技術, 基本都屬於這個層面, 包括與大數據相關的技術, 而且它們也都屬於輔助智能性質的技術. 所以, 大數據, 人工智慧與其它的技術彼此的界限日益模糊.

這些具體的實用性技術, 包括 '深度學習' (人工神經網路) , 常常是實驗性技術, 在應用於一個新的具體問題之前, 我們無法確定它是否能夠有效地解決這個問題, 或者能夠將問題解決到什麼程度.

正因為如此, 以深度學習為例, 在《深度學習》 (【美】伊恩·古德費洛等著, MIT Press出版, 2016年) 這本被認為是 '深度學習' 領域奠基性的經典教材中, 作者為了闡述深度學習的這種實驗性特徵, 專門設置第11章來討論這個問題, 它的題目取為 '實踐方法論' .

在這一章的開頭, 作者寫了這樣一段話: '要成功地使用深度學習技術, 僅僅知道存在哪些演算法和解釋它們為何有效的原理是不夠的. 一個優秀的機器學習實踐者還需要知道如何針對具體應用挑選一個合適的演算法以及如何監控, 並根據實驗反饋改進機器學習系統. 在機器學習系統的日常開發中, 實踐者需要決定是否收集更多的數據, 增加或減少模型容量, 添加或刪除正則化項, 改進模型的優化, 改進模型的近似推斷或調整模型的軟體實現. 嘗試這些操作都需要大量時間, 因此確定正確的做法而不盲目猜測尤為重要. ' 這段話比較完整地揭示了深度學習這個具體技術的實驗性特徵.

人工智慧的這種狀態多少有點像傳統領域在現代科學出現以前, 人們通過經驗摸索, 也能夠設計製造出很多不同類型的精巧工具來解決各種具體的問題的狀況. 而具體的實用技術再豐富精妙, 也未必能夠產生出更深一層的原理性, 普適性的成果. 中國歷史上無數的能工巧匠都沒有能夠讓中國趕上現代科技發展的潮流, 就說明了這個問題.

以上各層的產出, 都還不能直接服務於人. 所以在它們之上, 還有把技術變成實用產品/系統的原理與技術. 在此為了簡便我們只分了兩層. 特別需要指出的是, 由於人工智慧等技術屬於具體應用技術, 而不是系統級技術, 所以事實上它們自己無法成為構造實際應用系統/產品的基礎, 而必須依附於系統級原理與相關技術才能發揮作用. 雖然當初有過主要基於人工智慧技術構造系統的努力, 比如日本的第五代計算機, 今後這種努力也不會完全消失. 但是, 從人工智慧技術的客觀本質來看, 將其作為具體層面的應用技術來使用, 才是合理的選擇.

對底層技術發揮自身價值起決定性作用的, 是基礎系統原理及相關的技術. 比如馮諾依曼架構就屬於這個範疇. 它之所以成為了計算機領域的核心成就, 就是因為這個架構使得我們能夠利用相關的具體技術設計製造出實際可以使用的計算機系統產品, 藉助計算機系統產品讓相關的具體技術在各個領域裡發揮出自己應有的價值.

這一層的基礎系統原理及相關的技術與具體的應用領域相對獨立, 所以其影響也是全局性的. 它們不僅包括了獨立基礎性系統的原理與相關係技術, 還包括了大量獨立系統之間的交互連結組成更宏觀的基礎性大系統的原理與相關技術. 互聯網, 雲計算就屬於這個類別. 在網路化的資訊技術領域, 組成宏觀大系統的原理與技術在起到日益重要的作用. 當然獨立基礎性系統的創新, 是大規模互聯繫統的前提, 其作用更為基礎.

這一層基礎系統原理與相關技術層面的創新的重要性, 遠遠超過了那些具體應用技術, 至少可以與基礎共性技術比肩, 有些甚至接近科學原理. 所以馮諾依曼架構在計算機領域才有了如此崇高的地位. 而人腦的強大功能, 不僅僅體現在具體的智力能力上, 還體現在它的系統層面. 這種系統層面的優勢, 在本章第一節中我們用實例指出, 它不僅僅是在於大量神經元之間的分布式聯接而形成的高度分布的網路, 在下一節我們還會從另外一個方面分析人腦在系統層面的一個重要的, 沒有被充分重視的特徵.

同屬於這個層面的除了互聯網, 雲計算以外還有最近備受關注的 '區塊鏈' . 2009年伴隨比特幣出現的區塊鏈技術, 最能說明系統層面的突破, 如何能夠讓下層具體的應用技術發揮出最大的價值了.

2008年11月, 一個自稱為 '中本聰' 的匿名人士在互聯網上發表了一篇簡短但影響重大的文章: 'Bitcoin: A Peer-to-Peer Electronic Cash System' (比特幣: 一個對等網路上的現金系統) . 2009年1月3日, 中本聰自己在比特幣系統裡建立了第一個區塊 (創世塊) , 由區塊鏈支撐的比特幣系統開始運轉, 區塊鏈技術正式登場. 該技術的示意見圖2.

仔細研究區塊鏈中的具體技術我們就會發現, 區塊鏈所使用的解決具體問題的技術, 如非對稱加密, 防篡改, 對等網路等等, 都是現有的技術, 沒有任何一個是中本聰發明或改進過的. 僅僅使用這些現成的技術, 中本聰卻創造出了一個在開放互聯網上分布式運行, 不用監管, 人人可以參與記賬, 賬目公開透明, 同時又是可信, 可靠, 安全, 精準無誤的現金系統.

如果說雖然至今還沒有基本的可行性, 但是無數人依然在嚮往創造出與人有著同樣智能, 甚至超越人的智能化系統的話, 一個這樣的現金系統在被創造出來之前, 可以說基本任何人都沒有想到過要去實現這個目標, 也不會相信有人能夠把它創造出來. 這是一個建立在現有資訊具體技術之上, 超出了所有人想象的資訊技術奇蹟.

這個奇蹟依靠的不是解決具體問題的技術的新突破, 而是一個創新的系統性原理與設計. 中本聰充分利用了分布式開放網路環境下人的行為特徵, 巧妙地創造出了可以運行在開放的互聯網上的基於區塊鏈的分布式系統. 比特幣中保證賬務記錄準確無誤的所謂 '共識演算法' , 正是這個分布式系統的系統級運行機制的一部分. 或者說共識演算法是通過分布式系統的系統級運行機制的設計而實現的. 區塊鏈技術之所以難以被準確把握與理解, 就在於它的許多本質的特性是由系統級機制決定的, 而不是依靠單點技術來實現.

不論區塊鏈的技術未來會有什麼樣的應用, 它的出現本身都給我們帶來了非常深刻的啟示.

首先, 它讓我們在資訊技術產業中看到了一個活生生的, 利用成熟的具體技術做系統級創新所能夠創造出來的, 超出所有人想象, 超出了具體技術所能夠達到的, 奇蹟般的顛覆性效果. 系統的重要性, 在上個世紀八十年代就被高度重視了. 當時在科技界有著著名的三論之說, 即資訊理論, 控制論與系統論. 對系統論的高度重視, 是對近代科技發展曆程認識深化的結果. 錢學森做出的最重要的一個曆史性貢獻, 就是把系統論的觀點與方法深深地植入了中國的許多領域, 特別是航天領域.

在傳統的產業中我們也能看到大量的系統性創新對具體技術的超越. 我們簡單看一下航空工業的例子. 早期的飛機所採用的動力是活塞發動機. 後來在上個世紀三十年代末, 德國率先將噴氣式飛機送上了天. 隨後渦輪噴氣發動機成為了航空動力的主角. 這兩種發動機在科學原理上是相同的, 都是利用燃料燃燒導致氣體膨脹而將熱能轉化為機械能. 但是兩者的系統級原理卻完全不同. 渦輪噴氣發動機是航空動力系統的一次基礎性系統級顛覆式創新. 它所帶來的進步, 不是活塞發動機在任何具體層面的技術或材料的改進所能夠比擬的. 它給航空產業帶來了天翻地覆的變化.

在今天的軍事領域, 決定戰場優勢的也不再僅僅是具體兵器在傳統意義上的先進性, 而是海陸空天一體化的超級系統. 這是當代戰爭一個質的飛躍.

其次, 面對區塊鏈帶來的令人瞠目的結果, 我們不僅要發問: 在資訊技術產業開啟了其黃金時代的大門之後, 是否有會有更多的, 超出我們想象的, 基於系統級的創新不斷出現, 從而對人類社會的各個領域產生顛覆式的影響?

相比於區塊鏈創造的奇蹟, 我們把自己的想象集中於工具智能的提高上, 雖然很有道理, 但視野可能過於偏狹了. 目前區塊鏈的奇蹟與比較複雜的智能技術沒有太多的直接聯繫, 更不是對人的智能活動的重複或模仿, 但卻有驚人的顛覆性衝擊. 當然, 如果區塊鏈在未來得到廣泛應用, 各種具體的智能技術融入其中也是必然的趨勢.

在當今資訊技術產業的熱點中, 與大數據和人工智慧相比, 由於它的專業性區塊鏈是一個相對寂寞的技術. 但正是它, 給我們開啟了一扇獨特的觀察資訊技術產業未來發展的窗戶, 提供了一個獨特的視角, 它所揭示的潛在可能, 對我們有效地把握資訊技術產業乃至整個人類文明的未來發展或許具有更本質而重要的意義.

當前資訊技術應用系統越來越多地成為了軟體的設計, 而正如我們在《轉折—眺望IT巔峰》第二章第一節中指出的那樣, '與實物產品的設計開發相比, 軟體開發幾乎是在一個無限資源的虛擬空間裡的隨意發揮. 以至於軟體設計開發甚至被認為是一種純精神化的藝術創作過程. ' 正是這種隨意創作的自由, 才出現了區塊鏈的奇蹟, 也將催生更多的, 超出我們今天最浪漫的想象邊界的, 各種不同系統規模的顛覆性系統級創新.

許多系統將要實現的功能在整體上將遠遠超出今天我們對人工智慧的期待, 它們不會擁有人這樣的主體地位, 但是在功效上卻會極大地超越人在智能上作為一個個體所能達到的高度與廣度——就像輔助體能的機械性工具在體能的各個方面實現的對人的全面超越. 而這些系統所具有的 '智能' 在性質上將會與人的智能有重大區別, 正如區塊鏈系統展示給我們的那樣. 這些系統正在被逐步創造出來, 並將形成一個空前複雜的虛擬世界.

在充分重視人工智慧等具體應用技術的進展與帶來的衝擊的同時, 我們應該展開我們的想象, 更加重視基礎系統級原理及相關技術的創新. 資訊技術產業發展的未來, 可能更多地由這個層面的顛覆式創新所決定. 而人工智慧等具體的技術, 將在這些創新中, 找到更好的, 更大的發揮舞台.

《轉折——眺望IT巔峰》一書中詳細介紹的以主體虛擬映像為核心的智能系統是資訊技術產業中基礎系統原理與技術層面的, 具有系統性智能意義的一個重要的創新, 代表了資訊類應用未來的一個極為重要的方向, 是人類在智能追求上的一個巨大進步, 也是人類輔助智能類工具的一個質的飛躍.

作者簡介: 謝耘博士, 首都科技領軍人才, 清華大學電子工程系博士. 著有《我的職場十年》, 《成長——從校園到職場》, 《轉折——眺望IT巔峰》.