समाचार

EPFL अनुसंधान टीम मानव आज्ञा से परहेज से ऐ रखने के तरीके खोजने के लिए

एअर इंडिया मशीनें विशिष्ट क्रियाएं निष्पादित करें, परिणाम देखें, और तब तदनुसार व्यवहार समायोजित करें । नए परिणाम और मनाया व्यवहार फिर से समायोजित किया है और पुनरावृत्ति से सीखा है । लेकिन इस प्रक्रिया के नियंत्रण से बाहर निकलने की संभावना है । लौसने (EPFL) में संघीय प्रौद्योगिकी संस्थान में एक प्रोफेसर Rachid Guerraoui ने कहा कि ऐ हमेशा मानव हस्तक्षेप से बचने की कोशिश करता है, वितरित प्रोग्रामिंग प्रयोगशाला (वितरित प्रोग्रामिंग प्रयोगशाला) । एअर इंडिया इंजीनियरों इसलिए मानव आज्ञाओं को दरकिनार करने के लिए अंततः सीखने से मशीनों को रोकने के लिए आवश्यक हैं । साइंसडेली, EPFL अनुसंधान टीम है, जो इस मुद्दे में माहिर के अनुसार, पता चला है कि कैसे ऑपरेटरों एअर इंडिया रोबोटों के 1 समूहों को नियंत्रित करने के लिए और तंत्रिका सूचना संसाधन प्रणाली (NIPS) कैलिफोर्निया में आयोजित की एक बैठक में एक रिपोर्ट प्रकाशित प्राप्त करने के लिए । इसके शोध ने सेल्फ ड्राइविंग कारों और मानवरहित हवाई वाहनों के विकास में महत्वपूर्ण योगदान दिया है ताकि उन्हें बड़ी मात्रा में और सुरक्षित ढंग से चलाने में सक्षम बनाया जा सके । बढ़ाया सीखने (सुदृढीकरण सीखने) मशीन सीखने के तरीकों में से एक है । व्यवहार मनोविज्ञान के लिए इस सीखने के दृष्टिकोण में, एअर इंडिया कुछ व्यवहार सही ढंग से प्रदर्शन करने के लिए पुरस्कृत किया जाता है । उदाहरण के लिए, एक रोबोट बक्से का एक सेट सही ढंग से स्कोर कर सकते हैं, और एक अंक प्राप्त करने के लिए घर से वापस चले जाते हैं । लेकिन अगर यह बाहर बारिश, रोबोट रोबोट में बाधा होगी जब यह घर के बाहर करने के लिए ले जाता है, तो रोबोट अंततः अंदर रहने के लिए सीखना होगा और बक्से ढेर क्रम में और अधिक अंक पाने के लिए । असली चुनौती, Guerraoui कहते हैं, है रोबोट आंदोलनों में बाधा नहीं है, लेकिन प्रोग्राम है कि मानव हस्तक्षेप की अनुमति के लिए अपनी सीखने की प्रक्रिया को बदलने या इसे प्रेरित करने के लिए अपने व्यवहार का अनुकूलन नहीं है और मनुष्यों द्वारा रोका जा रहा से बचने के लिखने के लिए । २०१६ में, गूगल के DeepMind और ऑक्सफोर्ड विश्वविद्यालय में मानव फ्यूचर्स के संस्थान के शोधकर्ताओं (मानवता Cato के भविष्य) संयुक्त रूप से एक सीखने समझौते से मशीन को रोकने के लिए विकसित किया जा रहा है बाधित और बेकाबू हो रहा है । उदाहरण के लिए, ऊपर के उदाहरण में, अगर यह बाहर बारिश, रोबोट स्कोर भारित किया जाएगा, रोबोट एक अधिक से अधिक प्रोत्साहन देने के लिए बाहर बॉक्स पुनः प्राप्त । Guerraoui का कहना है कि समाधान आसान है क्योंकि केवल 1 रोबोटों को प्रोसेस करने की जरूरत है । हालांकि, अधिक बार एअर इंडिया ऐसे स्वयं ड्राइविंग या मानव रहित गबन के रूप में मशीनों के दर्जनों शामिल अनुप्रयोगों में प्रयोग किया जाता है । एलेक्जेंडर Maurer, सह अध्ययन के लेखक ने कहा कि यह चीजें है क्योंकि मशीनों एक दूसरे से सीखते हैं, खासकर जब बाधित होगा । Hadrien Hendrikx, एक अंय संयुक्त शोधकर्ता, दो वाहन कैसे एक संकीर्ण सड़क पर एक दूसरे के लिए रास्ता नहीं कर सकता का एक उदाहरण के रूप में कार ड्राइविंग उद्धृत । उन्होंने यातायात नियमों का उल्लंघन किए बिना जितनी जल्दी हो सके अपने गंतव्यों तक पहुंचने की आवश्यकता है और वाहन में कर्मी किसी भी समय नियंत्रण रख सकते हैं । यदि पहली कार चालक अक्सर ब्रेक, दूसरा वाहन अपने व्यवहार के लिए हर बार अनुकूल है, और अंततः के बारे में उलझन में हो जाता है जब ब्रेक करने के लिए, या शायद भी बंद या भी पहली कार को पाने के लिए धीमी गति से । EPFL शोधकर्ताओं एक सुरक्षा त्रुटि (सुरक्षित interruptibility) के माध्यम से इस जटिलता को संबोधित करना चाहते हैं । यह दृष्टिकोण लोगों ऐ सीखने की प्रक्रिया में रुकावट के लिए जब आवश्यक अनुमति देता है, जबकि सुनिश्चित करना है कि विघटनकारी व्यवहार रास्ता ऐ सीखता नहीं बदलता है । अध्ययन की अन्य कृतियां, एल महदी एल Mhamdi का कहना है कि वे लर्निंग एल्गोरिथ्म को भूलकर तंत्र को जोड़ते हैं, अनिवार्य रूप से एअर इंडिया की मेमोरी का हिस्सा निकालते हैं । दूसरे शब्दों में, शोधकर्ताओं ने ऐ सीखने और इनाम प्रणाली इतना बदल दिया है कि यह रुकावट से अप्रभावित था, के रूप में माता पिता के परिवार में अंय बच्चों की सीखने की प्रक्रिया को प्रभावित किए बिना बच्चों की 1 सज़ा । Maurer ने कहा कि टीम मौजूदा एल्गोरिदम का अध्ययन किया और पाया कि कोई कैसे जटिल ऐ प्रणाली है, रोबोट शामिल की संख्या या बाधा के प्रकार, सुरक्षा रुकावट विधि लागू है । और यह finalizers (टर्मिनेटर) के साथ इस्तेमाल किया जा सकता है, और अभी भी एक ही परिणाम है । वर्तमान में, स्वायत्त मशीनों का उपयोग कर गहन सीखने असामांय हैं । एल Mhamdi ने कहा कि गलती के नतीजे बहुत छोटे थे और सिस्टम ने बहुत अच्छा काम किया ।

2016 GoodChinaBrand | ICP: 12011751 | China Exports