狂熱背後, 你需要知道AI技術是如何發展起來的

上世紀40年代, 人工智慧的基本框架就已經存在, 自那以後, 各種組織就一直在人工智慧的發展上進行創新. 近年來, 大數據和先進的深度學習模型將人工智慧的發展推向了前所未有的高度. 這些新的技術成分最終會產生科幻小說中所設想的智能機器, 還是維持目前的人工智慧趨勢, 只是 '把相同的酒裝在了更高檔的瓶子裡' ?

'這實際上是新酒, 但有各種各樣的瓶子, 而且有不同的年份, ' James Kobielus說, 他是Wikibon的數據科學, 深度學習和應用開發的首席分析師.

Kobielus補充說, 實際上, 大部分的舊酒仍然相當可口; 新一代的人工智慧的使用了以前的方法並建立在這些方法之上. 例如, Apache的大數據框架Hadoop所運用的技術.

然而, 如今關於人工智慧的狂熱, 是由於一些前人工智慧候選者缺乏特定的發展. 根據Kobielus的說法, 現有的技術使我們更接近那些看起來像人類一樣 '思考' 的機器. '其中最重要的是大數據, ' 他在位於麻薩諸塞州馬爾伯勒的CUBE公司的工作室裡說. 為什麼大數據激發了人們對人工智慧的興趣? 因為這對於訓練深度學習模型來說是一個巨大的幫助, 使其能夠做出更像人類的推斷. Kobielus和Dave Vellante一起在人工智慧和機器智能領域有了技術突破. Dave Vellante是Wikibon的首席分析師, 他還是SiliconANGLE的直播工作室的聯合主持人.

人工智慧革命將會被演算法化

人工智慧在智能對話方面的長足進步, 也反映了其飛速的營收增長. 研究機構Tractica LLC的調查顯示, 2016年, 人工智慧軟體市場規模為14億美元, 到2025年將增至598億美元. '人工智慧在幾乎所有行業的垂直領域都有應用和用例, 被認為是下一個重大的技術轉變, 類似於工業革命, 計算機時代和智能手機革命等過去曾經發生的轉變, ' Tractica LCC的研究主管Aditya Kaul說. 其中一些垂直領域包括金融, 廣告, 醫療, 航天和消費領域.

下一場工業革命將圍繞人工智慧軟體展開, 這聽起來可能像一個想象力豐富的書獃子的幻想. 但即使在矽谷之外, 這種情緒也在蔓延. 《時代》周刊最近專門刊登了一篇題為《人工智慧: 人類未來》的特稿. 但是, 這種人工智慧的設想在科幻小說和科技圈的狂熱沼澤中已經存在了幾十年. 在過去的幾年裡, 這項技術發展得如此之快嗎? 從今天的人工智慧和可預見的未來, 我們能從現實中得到什麼?

首先, 人工智慧是一個寬泛的標籤——實際上更多的是一個熱門短語, 而不是一個精確的技術術語. Kobielus說, 人工智慧指的是 '任何幫助機器像人類一樣思考的方法' . 但是, 從最嚴格的意義上來說, 機器 '思考' 難道不是與人類大腦截然不同的思維嗎? 機器不會真的思考, 不是嗎? 這要看情況. 如果說 '思考' 的同義詞是 '推斷' 的話, 那麼機器可能被認為與大腦是對等的.

當人們討論人工智慧的時候, 他們通常會談論人工智慧最受歡迎的方式——機器學習. 這是一種數學應用, 原理是從數據集中推斷出某種模式. Kobielus說: '很長時間以來, 人們利用軟體從數據中推斷出模式. ' 一些已有的推理方法包括支援向量機, 貝葉斯邏輯和決策樹. 這些技術並沒有消失, 並在日益增長的人工智慧技術領域被繼續使用著. 機器學習模型或在數據上訓練的演算法能夠做出自己的推斷, 這通常被稱為人工智慧的輸出或見解. 這種推斷不需要預先編程到一個機器上, 需要編程的只有模型本身.

機器學習模型的推斷基於統計學的可能性, 這在某種程度上類似於人類理解的過程. 來自數據的推論可以以預測, 相關性, 分類, 分類, 識別異常或趨勢等形式出現. 對於機器來說, 學習模式是分層的. 數據分類器名為 '感知器' , 通過對感知器進行分層, 便形成了一個人工神經網路. 感知器之間的這種神經網路關係激活了它們的功能, 包括非線性的感知器, 比如tangents. 通過這個神經過程, 一個層的答案或輸出就成為了下一層的輸入. 最後一層輸出的便是最終結果.

神經元的深層學習層

深度學習網路是有著大量的感知器層的人工神經網路. 網路的層次越多, 它的深度就越大. 這些額外的層會提出更多的問題, 處理更多的輸入, 併產生更多的輸出, 從而抽象出更高層次的數據.

Facebook的自動人臉識別技術是由深度學習網路驅動的. 通過將更多圖層組合在一起, 可以更豐富地描述映像. '你可能會問, 這不就是一張臉嗎? 但是, 如果它是一個場景識別深度學習網路, 它可能會識別出這是一個與一個名叫戴夫的人對應的臉, 他碰巧也是這個家庭場景中的父親. ' Kobielus說.

現在已經有了具備1,000個感知器層的神經網路, 軟體開發人員仍在探索更深層次的神經網路可以實現的功能. 最新款蘋果iPhone的人臉檢測軟體依賴於一個20層的卷積神經網路. 2015年, 微軟公司的研究人員通過一個152層的深度殘差網路贏得了ImageNet計算機視覺大賽. 微軟研究主管彼得·李表示, 得益於一種防止數據稀釋的設計, 該網路能夠從圖片中收集到的資訊, 超過了典型的20層或30層的深度殘差網路. 他說: '我們可以從中學到很多微妙的東西. '

除了映像處理之外, 新的人工智慧和深度學慣用例也層出不窮, 從執法部門到基因組學都能找到相關應用. 在去年的一項研究中, 研究人員利用人工智慧預測了歐洲人權法院數百起案件的判決結果. 他們預測人類法官最終決定的準確率達到了79%.

具備了 '思考' 的能力, 並且擁有豐富的資源, 甚至還有機器比人更準確地得出結論. 最近, 斯坦福大學研究人員的深度學習演算法比人類放射科醫生更擅長診斷肺炎. 這種名為 'CheXNet' 的演算法使用了一種121層的卷積神經網路, 這些神經網路被訓練在一組超過10萬張胸部X光映像上.

人工智慧模型在學習中不斷進步

這突顯出深度學習的一個關鍵問題: 演算法本身和訓練它們的數據一樣好. 它們作出的預測的準確率基本上與訓練它們的數據集的大小成正比. 並且這個培訓過程需要專家的監督. Kobielus說: '你需要一個由數據科學家和其他擅長統計建模的開發人員組成的團隊, 他們擅長獲取培訓數據, 並對其進行標記 (標籤在那裡起著非常重要的作用) , 而且他們擅長於通過開發者操作以迭代的方式開發和部署某一種模型. '

機器學習模型的標籤數據確實至關重要, 但人類的眼睛仍然是工作的最佳工具. IBM公司去年表示, 他們已經在招聘很多人, 只是為了給人工智慧標記數據. 多倫多大學的研究人員Parham Aarabi和Wenzhi Guo探索出了人類的大腦和神經網路結合在一起的方式. 他們開發了一種演算法, 從明確的人類指令中進行學習, 而不是通過一系列的例子. 在映像識別中, 訓練師可能會告訴演算法, 天空通常是藍色的, 並且位於圖片的頂部. 與傳統的神經網路訓練相比, 他們的方法效果更好. Kobielus說: '如果不訓練演算法, 你就不知道演算法是否有效. ' 他還總結道, 大量的訓練都會在雲或其他集中的環境中進行, 而分散的 '物聯網' 設備 (比如自動駕駛汽車) 將會在現場做出決定.

2016 GoodChinaBrand | ICP: 12011751 | China Exports