मैं एक सिंह हूँ, विज्ञान और प्रौद्योगिकी के सह-संस्थापक के अनुसार, यूसीएलए डॉ सांख्यिकी, 15 साल के लिए कृत्रिम बुद्धि में अनुसंधान, पूर्ण अध्ययन प्रयोगशाला संस्थापक यान लेकन प्रोफेसर में एक शोधकर्ता के रूप में 2010 में काम किया, एक छवि लक्ष्य का पता लगाने पास्कल चैंपियन, 2017 में प्राप्त प्राप्त करने के लिए मानकों और प्रौद्योगिकी NIST के राष्ट्रीय संस्थान और राष्ट्रीय खुफिया रिसर्च प्रोजेक्ट्स एजेंसी IARPA उन्नत विश्व चैम्पियनशिप मान्यता। हाल ही में, कृत्रिम बुद्धि, निवेशकों, उद्यमियों, विद्वानों ऐ गर्म प्रवृत्ति पर अध्ययन की एक बड़ी संख्या है और समाज के सभी क्षेत्रों पर इसके प्रभाव, वहाँ ऐ प्रौद्योगिकी और औद्योगिक विकास के बारे में कई गलत धारणाओं, यह आसान भ्रामक है मैक्रो विषय हैं। आम तौर पर तीन क्षेत्रों में विभाजित किया जाता है: एआई कितना बड़ा है? असली एआई खिलाड़ी कौन है? एआई दृश्य कहाँ है? वैज्ञानिक शोधकर्ताओं और उद्यमियों के नजरिए से डबल बात मेरी मुख्य बिंदु होते हैं: ऐ सीमाओं केवल नेता यह संभव है सही रूप में समझ और विस्तार करने के लिए, शीर्ष कंपनियों, क्योंकि संभावित ऊर्जा बनाने के लिए दृष्टि, ऐ के भविष्य, अद्वितीय, कोई इतिहास किसी भी गाइड है, भविष्यवाणी करने का कोई अधिकार नहीं है ए एस पैटर्न देखने के लिए "एस" वक्र "एस" आकार का अपना इतिहास और ऐ के लिए पूर्वानुमान मॉडलिंग वक्र, चार्ट खर्च (अवग्रह समारोह, भी तंत्रिका नेटवर्क न्यूरॉन्स सक्रियण समारोह चिह्नित करने के लिए प्रयोग की जाने वाली होता है)। क्षैतिज अक्ष समय का प्रतिनिधित्व करता है और ऊर्ध्वाधर अक्ष मशीन खुफिया के स्तर का प्रतिनिधित्व करता है। वक्र पर बिंदु समय में एक निश्चित बिंदु खुफिया की दुनिया के उच्चतम स्तर का प्रतिनिधित्व करता है। 2013 ऐ (गहरी सीखने) के एक नए युग की शुरुआत है, विकास के लगभग पांच साल की तुलना में विकास 2013 मशीन खुफिया स्तर मूल रूप से नगण्य हो सकता है। लाल रेखा का प्रतिनिधित्व करता है निराशावादियों (कम ज्वार ऐ, ऐ फोम, आदि), के बाद जल्द ही 2017 विकास ठहराव, नीली रेखा उम्मीद का प्रतिनिधित्व करता है, वहाँ तेजी से विकास होने के बाद 2017 पर बल लायक, नीले और लाल दो घटता ऐ के इतिहास का एक ही समझ है। लेकिन बाजार तर्क या देखने के लिए अध्ययन पर कई उच्च जोखिम अनुसंधान में एक और वक्र उच्चतम स्तर से ऐ स्तर को देखने के लिए वहाँ एक बड़ा अंतर है। अलग अलग स्थानों की ऐ पैटर्न विश्लेषण, एस-वक्र के तीन पहलुओं व्याख्या की जा सकती है : 1, एआई के पिछले विकास और एआई के भविष्य के विकास की सीमा और दर की भविष्यवाणी 2, एआई और व्यावसायिक परिदृश्यों के विकास के स्तर के बीच का रिश्ता 3, प्रत्येक खिलाड़ी का स्थान और अंतर विशेष रूप से, हम एक उदाहरण के रूप में मान्यता के लिए विकास की बात करते हैं पिछले पांच साल में ऐ के साथ शुरू, संभावना 95% एन व्यक्तियों से एक चेहरा लगता है, और ऊर्ध्वाधर अक्ष पहचानने पैमाने (एन आकार) है । प्रौद्योगिकी अभिसरण नहीं है, लेकिन इस दृश्य को अनलॉक करने के लिए अंतर को बढ़ाया जाएगा 2017 चेहरा मान्यता NIST 20 लाख लोगों को, के उच्चतम स्तर पैमाने शायद 2016 में की तुलना में अधिक की पहचान एक करोड़ दो सौ गुना बढ़ाने के लिए और 2017 में चेहरा पहचानने की दुनिया की सबसे आधिकारिक परीक्षण 2015 की तुलना में समय की संख्या में सुधार कर सकते पहचान कर सकते हैं ( ), हम दूसरी वोकॉर्ड टीम से 2% आगे हैं (वोकॉर्ड एक अन्य टेस्ट सेट में 10% से ऊपर टेनेंट मेरिट से ऊपर है), जिसे सामान्यतः तकनीकी स्तर के अभिसरण के रूप में जाना जाता है, एक या दो उच्च प्रतिशत अंक कोई मतलब नहीं (नकद में प्रतियोगिता के मूल्य का एहसास करना मुश्किल है।) यह गलतफहमी दो पहलुओं से व्याख्या की जानी चाहिए: पहला पहलू, एक सौ मिलियन, में एल्गोरिथ्म एक अरब 20% करने के लिए 5% की तेजी से प्रवर्धन अनुपात को बढ़ावा मिलेगा। यह सामान्य एल्गोरिथ्म प्रदर्शन वक्र का नियम है। महत्वपूर्ण अंतर पहचानने पैमाने, लेकिन यह भी मुश्किल में के अतिरिक्त ( अनुभव से कठिन) के आंकड़ों पर मान्यता दर मतभेद। एल्गोरिथ्म, अश्वेतों, महिलाओं, बच्चों, बड़े अवधि, रोड़ा अधिक कठिन समूहों और श्रेणियों की पहचान करने के लिए। इन उपवर्गों पर है, अलग अलग एल्गोरिदम के प्रदर्शन के बीच मतभेद बड़ा हो जाएगा मूल्यांकन खुद के तहत बड़े पैमाने पर एक सरल शैक्षिक प्रस्ताव है, लेकिन यह भी डेटा का समर्थन करने के वास्तविक प्रदर्शन दो अरब डेटा पर मनाया जा सकता है की एक बहुत कुछ की आवश्यकता बहुत कम लोगों को, संयुक्त राज्य अमेरिका जैसे परीक्षण सेट के 2 अरब स्थापित करने के लिए मुश्किल है। यह चेहरा पहचानने अनुसंधान चिकित्सकों के एक नंबर नहीं साक्षात्कार प्राप्त कर सकते हैं, इस गलतफहमी का पहला स्रोत है। एल्गोरिथ्म का एक दूसरा पहलू "प्रौद्योगिकी के क्षेत्र में कोई अंतर नहीं।" सुधार करने के लिए और बड़े पैमाने का विस्तार पहचाना जा सकता है, यह अतिरिक्त व्यावसायिक परिदृश्यों अनलॉक हो जाएगा। करोड़पति पहचान पैमाने दृश्य प्रमाणीकरण, रिमोट प्रमाणीकरण से मेल खाती है, इस श्रेणी में फोन गिरावट अनलॉक। तर्क छूता है इस दृश्य में स्थापित किया जा सकता है लेकिन सुरक्षा जांचकर्ताओं एक सौ मिलियन और एक अरब जोड़े दस बार इन दृश्यों, नहीं पहचान अपराधियों कुछ समस्याओं से भी अधिक में मांग की तुलना में अधिक कठोर के मामले का समाधान, लेकिन अंतर की संभावना पता लगाने के लिए लगभग लाइन। थीसिस "गैर-महत्वपूर्ण अनुप्रयोगों," अत्यधिक भ्रामक के साथ एक समस्या नहीं है। नवीनतम सुरक्षा मामलों में, एक चेहरा खोज की सड़क कैमरा वीडियो की वान रोड या यहां तक कि सैकड़ों एल्गोरिथ्म पर बहुत अधिक मांगों को संग्रहीत करते हैं, यह सोचते हैं कि प्रत्येक चैनल प्रवाह 30,000 है, सभी वीडियो के बीच में, खोज एल्गोरिथ्म प्रदर्शन की आवश्यकताओं को दस अरब के बराबर इसके अलावा में 100 अरब की दर पर पहचान की जा सकती है। दृश्य आवश्यकता आगे एक हज़ार बार बढ़ाने के लिए अन्य की तुलना में इस प्रदर्शन। अंत अलग एल्गोरिदम उसी अनुपात में बढ़ जाता है के आधार पर उत्पाद के लिए अंतर अनुभव करते हैं। वैश्विक जातीय पहचान, आतंकवाद के विरुद्ध, कवरेज आवश्यकताओं की आव्रजन व्यवसाय मान्यता बहुत अधिक है अंत में, एल्गोरिदम के एल्गोरिथ्म और 99% से 99.99% मान्यता दर, को छोड़कर परिदृश्यों अनलॉक किया जा सकता है। (जैसे सार्वजनिक सुरक्षा प्रणाली नवाचार टीम के रूप में) अनलॉक करने के लिए इन नए परिदृश्यों, एल्गोरिथ्म खड़ी क्षेत्रों के सबसे हरावल और अग्रणी टीम संयुक्त प्रयासों, न ही यह साक्षात्कार सामान्य सुरक्षा चिकित्सकों परिवर्तन के क्षेत्र में अग्रणी है, जो गलतफहमी का एक अन्य स्रोत है अनुभव करने में सक्षम हो जाएगा है। तीन स्तरों में तकनीकी स्तर होड़: विजन (दृष्टि), इनसाइट (जानकारी), निष्पादन (निष्पादन) कैसे तुलना की तकनीकी ताकत का आकलन करने के? सबसे आम परीक्षण चैम्पियनशिप, वास्तविक मामलों, बोली पी परिणाम, कागज, आदि ये ऐ टीम के शीर्ष 10 के बीच भेद करने में सक्षम नहीं हो सकता है, लेकिन यह सर्वश्रेष्ठ टीम भेद करना मुश्किल है। ; समझ इनसाइट, एल्गोरिदम और उद्देश्य दुनिया के वितरण की प्रकृति में अंतर्दृष्टि, निष्पादन, निष्पादन, एल्गोरिदम, डाटा अधिग्रहण, इंजीनियरिंग और अन्य विशिष्ट कंप्यूटिंग मंच विजन, दृष्टि, रणनीति या पैटर्न, प्रौद्योगिकी प्रवृत्तियों निर्णय: मैं तीन प्रौद्योगिकियों के विखंडन। के लिए: निष्पादन सबसे बुनियादी एल्गोरिथ्म,, क्या स्तर को प्राप्त करने, विशेष रूप से सामान्य ढांचे में जाना जाता है, बुनियादी अंकगणितीय, दृश्य डेटा, कंप्यूटिंग प्रयोगात्मक मंच, उत्पाद अनुप्रयोगों, उदाहरण के लिए सहित तेजी से कार्यान्वयन, के बाद के बाद AlphaGo बाहर कितनी तेजी से पुन: पेश कर सकते हैं .; भाषण मान्यता कितनी तेजी से सबसे अच्छा परिणाम दुनिया भर में इस स्तर पकड़ कर सकते हैं। निष्पादन के साथ, नहीं खुला स्रोत मंच एल्गोरिथ्म में मदद कर सकते टीमों निष्पादन की इसी मैदान के स्तर को बढ़ा विशिष्ट क्षेत्रों में विशेषज्ञों कर सकते हैं।, चीन विश्व स्तरीय टीम होना चाहिए । गूगल दुनिया में पहली बार है, यदि हां, तो यह शतरंज, चेहरा पहचान, आवाज की पहचान खेल रहा है या नहीं, चीन के स्तर कुछ पहलुओं में फेसबुक, माइक्रोसॉफ्ट, एप्पल, अमेज़न गणित की तुलना में अधिक है, और यहां तक कि कुछ थोड़ा मजबूत नहीं होना चाहिए। ज्यादातर लोगों तुलना तकनीक, मूल रूप से इस स्तर पर। लेकिन अधिक महत्वपूर्ण, अधिक से अधिक बिजली की दो स्तरों से ऊपर है। परे है कि परत इनसाइट है, प्रौद्योगिकी के गहरी समझ का अध्ययन। गणितीय एल्गोरिदम, मॉडल की व्याख्या, उद्देश्य दुनिया अंतर्दृष्टि का वितरण शामिल है। (कैसे एल्गोरिथ्म भी अभिनव एल्गोरिथ्म का उपयोग करने पर जो है, मार्गदर्शन) डेटा का उपयोग कैसे, कंप्यूटिंग शक्ति पर इनसाइट मार्गदर्शन। इस परत गूगल की तुलना में बेहतर करने के लिए तय कर सकते हैं, या बनाए रखने के लिए विकास का एक ही गति गहरी सीखने एल्गोरिथ्म ढांचे मानी जाती है, एक ही स्तर पर डेटा का भारी मात्रा में है, लेकिन हर किसी को। वहाँ एक बड़ी खाई है चेहरा पहचानने एल्गोरिथ्म प्रदर्शन ट्यूनिंग का एक उदाहरण के लिए, हम 200 मिलियन लोगों के चित्र प्रशिक्षण (चित्रों के अरबों के एक सबसेट), प्रभावी मॉडल मापदंडों का सामना करना पड़ता आदेश के 1 अरब तक पहुंचने के लिए प्रयोग किया जाता है, इस दिव्य ऑब्जेक्ट के गुणों के मानव चेहरे के बारे में उचित मान्यताओं, प्रकाश, आयु, जाति सहित के उपयोग , मोशन ब्लर, छवि संकल्प, आदि, मॉडल, डेटा का एक संयोजन अनुकूलित करने के लिए कैसे, कैसे त्वरण की गणना करने के महत्वपूर्ण अंतर (निष्पादन ऊपर उल्लेख किया गया है) प्रदर्शन ट्यूनिंग और मॉडल सीखने दक्षता पर है। यही कारण है कि एल्गोरिदम बल की गणना की है, डेटा की स्थिति के इंटरनेट दिग्गजों जरूरी एक एकल ए कार्य में दुनिया के शीर्ष तीन करने में सक्षम नहीं हैं। विजन: पूर्वानुमान के रुझान जीवन पर प्रभाव की भविष्य की दिशा को परिभाषित करने, कल्पना करें कि प्रौद्योगिकी की गहरी समझ के उत्पादन, लेकिन यह भी प्रौद्योगिकी के अभिनव क्षमताओं की कल्पना, और प्रौद्योगिकी, रचनात्मकता, दृष्टि प्रौद्योगिकी के व्यापार मूल्य के अलावा। उत्तर कहां और कितनी तेजी से आ रहा है मजबूत निष्पादन, इनसाइट निश्चित रूप से अच्छा है, लेकिन कोई विजन हो सकता है; मजबूत विजन, इनसाइट निश्चित रूप से एक प्रथम श्रेणी है, लेकिन गरीब VIE निष्पादन अध्ययन में दो स्वामी हिंटन के क्षेत्र का सबसे मजबूत वैश्विक अत्यंत दुर्लभ गहराई के साथ एक मजबूत टीम हो सकता है .. और LeCun मेरी भावनाओं के बारे में बात करते हैं। 2010 में, शैक्षिक समुदाय, कई लोग प्रशिक्षण डेटा के लाखों लोगों के साथ, एल्गोरिथ्म के आधार पर 2012 LeCun आविष्कार में मशीन सीखने, हिंटन टीम के लिए बड़ा डेटा के महत्व के बारे में बात कर रहा है, इसी अवधि के दौरान ImageNet ;. पर विश्व स्तरीय सफलता प्रगति, LeCun टीम केवल एक लाख से भी कम समय लिया, लेकिन डेटा पहले दो महीनों के हिंटन ImageNet परिणामों में प्रकाशित, LeCun टीम अपने स्वयं के एल्गोरिथ्म उपयोग नहीं कर सकते प्रयोगों हिंटन पुन: पेश करने नतीजतन, हेंटन ने एल्गोरिदमिक कार्यान्वयन और सुझावों की घोषणा के बाद, LeCun टीम के परिणाम ने आसानी से हिंतरन टीम को मात कर दिया। दो स्वामी, शानदार विजन है तीस साल के लिए सीखने की गहराई दिशा में जोर दिया। लेकिन अपने मतभेदों के साथ-साथ मतभेद विजन इस विश्वास महत्वपूर्ण हो सकता है समय में अंतर इनसाइट (चाहे अधिक अंतर्दृष्टि आगे बढ़ाने के लिए) बनाता है लाता है, पूर्ण अध्ययन एल्गोरिथ्म खेलने सफलताओं की स्थिति प्रशिक्षण डेटा के आकार में शामिल हैं, मॉडल नियमितीकरण को प्राप्त, सक्रियण समारोह चयन, साथ ही समय में GPU कंप्यूटिंग में महत्वपूर्ण अंतर, आदि इन को समझने के रूप में, जब सिद्धांत स्पष्ट नहीं है, यह पूरी तरह से (सहित हिंटन पर निर्भर हो सकता है यह शानदार पीएचडी छात्र।) अंतर्दृष्टि में यह अंतर लेकुन टीम को एल्गोरिथम ढांचे के उपयोग और लक्षित प्रदर्शन के बारे में नहीं जानता था लेकिन कुंजी कार्यान्वयन को नहीं पता था, लेकिन लेकुन टीम को बाद में बेहतर था निष्पादन (बड़े-पैमाने पर सिस्टम ट्यूनिंग), थोड़े समय में अधिकांश पशु विशेषज्ञों के विश्वास के बीच इस सूक्ष्म अंतर पर एल्गोरिदम का प्रदर्शन अंत में, जो ध्यान देने योग्य है, से आता है। क्यों विजन महत्वपूर्ण है? रडार की तरह, दूसरों के लिए, यह एक ब्लाइंड स्पॉट है, विजन आप को देखने के लिए, यह विश्वास करना देखने की अनुमति देता है, मैं इतना शांत विश्वास करते हैं। इतना ही नहीं आदेश एक रणनीतिक लाभ के साथ-साथ किसी को भी, और प्रलोभन हस्तक्षेप बाहर करने के लिए प्राप्त करने के लिए। विजन यह कैसे पहचान करने के लिए? बहुत मुश्किल है, या यहाँ तक असंभव है, केवल एक ही लोगों द्वारा की सराहना कर सकते, केवल एक ही लोग हैं, जो आप जो देखते हैं के साथ स्वाद। विजन है द्वारा सराहना कर सकते हैं, विजन के जैसे स्वाद स्कोरिंग मुश्किल है 99% है विशेषज्ञ सहकर्मी नहीं देखते हैं, का मानना है कि हो सकता है नहीं है, इसलिए महान है और अक्सर गलतफहमी के साथ होगा। LeCun गहराई से अध्ययन करने से पहले परीक्षण वास्तविक डेटा सत्यापित करने के लिए है, यह है एक साधारण बात मुख्यधारा के अमेरिकी अकादमिक हलकों द्वारा मान्यता प्राप्त होना करने के लिए मुश्किल है, और भी शीर्ष सम्मेलन प्रकाशित नहीं आजकल, लगभग सभी शोधकर्ताओं को गहरी शिक्षा के साथ लेबल किया जाता है। लेकिन न्यायाधीश विजन टीम को फ़िल्टर नहीं किया एक पैटर्न है। सामान्य तौर पर, चाहे शैक्षिक या व्यापार, एक महान सफलता है, हम एक सुसंगत निवेश और कई साल पहले गहरी के बाद जुताई। अन्य क्षेत्रों में अगले साल या क्या मॉडल कर रहे हैं (की जरूरत है खड़ी, प्लेटफार्म, आदि), कोई विजन के रूप में वर्गीकृत कोई समस्या नहीं होनी चाहिए। VIE की समाप्ति के साथ, मुझे लगता है, बाधाओं को ऐ केवल लोगों को, शीर्ष लोग हैं। वितरण और व्यापार निर्णय के भविष्य सीमाओं की ऐ प्रौद्योगिकी नेताओं के एक नए युग बदला नहीं जा सकता है, हम ऐ के मूल तत्वों (कलन विधि, गणना शक्ति विकसित करने का फैसला, डेटा और दृश्य) और अधिकार की डिग्री आवश्यक वजन। निष्पादन और इनसाइट एक शीर्ष टीम, सबसे प्रभावी डेटा एल्गोरिथ्म पता करने के लिए कहां, कैसे लेबल करने के लिए। इनसाइट उपयोग और विजन एक शीर्ष टीम है है, सफलता प्रौद्योगिकी पता करने के लिए पहले सबसे अधिक व्यापार लाया गया है कहां और कब मूल्य दृश्य आते हैं एआई भविष्य: कोई इतिहास नहीं सीख सकता है, न ही भविष्यवाणी करने के लिए आधिकारिक है ऐ विकास, तकनीकी कैसे विखंडन के बारे में बात, ऐ। ऐ के भविष्य गहरी सीखने के एक नए युग के आधार पर के बारे में बात करते हैं, बहुत 30 साल के इतिहास पर ऐ से अलग है, यह आवेदन पत्र की एक किस्म है, वास्तविक दृश्य में, बड़े पैमाने पर डेटा के प्रदर्शन की पुष्टि प्रौद्योगिकी, न सिर्फ सिद्धांत या अवधारणा। हालांकि विकास के पिछले पांच वर्षों में, लोगों की उम्मीदों के योग्य, आज, देखते हैं बहुत से लोग है कि नए ऐ जल्द ही अतीत में के रूप में उतार जाएगा चिंतित। लेकिन मुझे लगता है, बस ऐ के एक नए युग की शुरुआत है। मैं नई एअर इंडिया के तीन विशेषताओं की संक्षिप्त रूपरेखा करता हूं: 1, ए एक नया आयाम है, जो कि सबसे महत्वपूर्ण बात यह निर्धारित करता है कि अंत में एआई कितना है। कैसे ऐ प्रौद्योगिकी नवाचार और विकास, व्यापार बदलने का तरीका कोई इतिहास किसी भी गाइड है, वहाँ कोई अधिकार सही ढंग से निर्धारित कर सकते हैं। ऐ सिर्फ एक तकनीक नहीं है, लेकिन यह भी सभी ऐ सफलता प्रौद्योगिकियों के लिए एक सफलता मानव-कंप्यूटर संपर्क, खोज, रोबोटिक्स, कंप्यूटिंग चिप, दवा में शामिल हैं, फार्मास्युटिकल साइंस और लगभग सभी विषयों। 2, एआई का तेजी से विकास, मजबूत कूद एस-वक्र से, आप पिछले पांच वर्षों में, ऐ और एक एकल वर्ग का तेजी से विकास (चेहरा पहचान) विकास के समय के साथ एल्गोरिथ्म देख सकते हैं, लेकिन मैं और अधिक भविष्य के लिए आगे देख रहा हूँ, कि है, 2018 में वक्र एस वक्र के बाद कैसे खड़ी। ऐ प्रत्येक दृश्य के साथ संयुक्त बहु-आयामी और तकनीकी गहराई के विकास के बारे में लाया, ओवरले अनुभव अधिक प्रभाव बहु-आयामी तकनीक से दृष्टि से लाना होगा, यह, श्रवण, अर्थ को समझने के लिए, गति नियंत्रण के बाद होगा कुछ साल तेजी से ब्रेक हो जाएगा, और पिछले 30 सेंटीमीटर के उपयोगकर्ता अनुभव खुफिया के इंटरनेट से हालात का इंटरनेट से भर में, के साथ बातचीत में बुद्धिमान टर्मिनल प्रवेश की चिप संयोजन, हर जगह स्मार्ट हैं। 3, एआई एक कदम आगे, महान क्षमता लाएगा एस-वक्र में, विभिन्न स्थितियों में टीमों को क्षैतिज अक्ष के समय में अंतर ही नहीं, बल्कि प्रमुख प्रौद्योगिकी के संचयी प्रभाव (वक्र एकीकृत) और अधिक बहुभिन्नरूपी (एकाधिक ऐ वक्र तकनीक) के साथ एआई प्रौद्योगिकी के ओवरले का लाभ मिलता है। इससे एआई एक क्रॉस-इंडस्ट्री के विनाशकारी निर्णय को न केवल एक उद्योग, दूसरे स्थान और दूसरे स्थान के बीच की खाई का निर्धारण करता है, बल्कि एआई के अग्रणी उद्योगों में नेताओं को एआई के पिछड़े दिखने वाले उद्योगों का लाभ उठाने में सक्षम बनाता है। एआई भविष्य, अद्वितीय; देखने की वजह से, इसलिए विश्वास करो
|