nvidia कुशल कंप्यूटिंग समाधान वास्तुकार एक्सल Koehler हाल ही में nvidia नई पीढ़ी वोल्टा gpu वास्तुकला और नवीनतम Cuda 9 समानांतर कंप्यूटिंग मंच और प्रोग्रामिंग मॉडल एक nvidia gpu प्रौद्योगिकी संमेलन में वोल्टा के लिए बनाया शुरू की । दावा है कि वोल्टा एक नया धारावाहिक है प्रवाह बहुप्रोसेसर (स्ट्रीमिंग बहुप्रोसेसर; SM) वास्तुकला, CUDA 9 डाटाबेस भी उंनयन के एक नंबर से पता चलता है, बेहतर प्रदर्शन के लिए एक नया कार्यक्रम डिजाइन मॉडल दिखा । अंदर एचपीसी रिपोर्ट के अनुसार, Koehler के अनुसार, एचपीसी के वर्तमान क्षेत्र कंप्यूटिंग के लिए बढ़ती मांग में, तंत्रिका नेटवर्क की जटिलता भी विस्फोट है, इस बाजार की प्रवृत्ति में, Nvidia ने वोल्टा वास्तुकला आधारित Tesla V100 प्रोसेसर शुरू किया, सूचना केंद्र कृत्रिम बुद्धि प्रदान ( एअर इंडिया), एचपीसी और ड्राइंग आवश्यकताओं, गहराई से सीखने (गहरी सीखने) और एचपीसी के लिए सबसे तेज और सर्वाधिक उत्पादक ग्राफिक्स प्रोसेसर (GPU) होने का दावा । नई एसएम Microarchitecture के लिए, Koehler कहते हैं, वोल्टा GV100 एसएम एक नया निर्देश सेट वास्तुकला (इसा), एक सरलीकृत रिलीज तर्क इकाई (मुद्दा तर्क), और एक बड़े, तेजी से L1 कैश के साथ उत्पादकता के लिए एक बदल दिया उत्पाद है, SIMT मॉडल और समर्थन tension त्वरण में सुधार करने के लिए, एक विशेषता यह है कि पास्कल एसएम की पिछली पीढ़ी की तुलना में, वोल्टा एसएम 128KB करने के लिए साझा स्मृति के साथ l1 $ एकीकृत करने के लिए प्रमुख प्रौद्योगिकियों को एकीकृत करता है, कम विलंबता और स्ट्रीमिंग प्रभाव बनाने, जैसे स्ट्रीमिंग l1 $4 गुना अधिक बैंडविड्थ है, 5 बार सुधार करने की क्षमता बार, और पास्कल की साझा स्मृति अंतर की पिछली पीढ़ी के साथ छोटा कर सकते हैं । एक और विशेषता है कि Koehler उल्लेख करने की क्षमता है कि एक स्वतंत्र थ्रेड शेड्यूलिंग का समर्थन करता है कि चौंका देने वाला निष्पादन (uned निष्पादन) अलग से बंटी बयान डेटा, और करने की क्षमता के लिए ठीक सुक्ष्म समानांतर एल्गोरिदम, और निष्पादन अभी भी एक एकल अनुदेश के लिए संगत एकाधिक थ्रेड्स की स्कीमा है । नई HBM2 मेमोरी वास्तुकला एक एकल पैकेज में संचालन और स्मृति को एकीकृत करता है, और अधिक बैंडविड्थ और उच्च ऊर्जा दक्षता के साथ, और V100 भी ९५% दरम उपयोग प्राप्त कर सकते हैं, जो पिछली पीढ़ी P100 के ७६% दरम उपयोग करने के लिए बेहतर है । वोल्टा GV100 वास्तुकला के एकाधिक सेवा प्रसंस्करण (सांसदों) सुविधाओं को भी बढ़ाया, सांसदों को सीधे करने के लिए GPU (काम कतार) के भीतर कतार काम चलाने के कार्यों को हस्तांतरण की अनुमति है, जिससे प्रक्षेपण विलंबता को कम करने और प्रवाह में सुधार । अनुमान में लागू, यह दावा है कि वोल्टा सांसदों को प्रभावी ढंग से एक बैच प्रणाली के बिना तैनाती के लिए आस्थगित किया जा सकता है । समग्र GPU प्रदर्शन की तुलना में, Nvidia का दावा है कि प्रशिक्षण में P100 से V100 त्वरित, निष्कर्ष त्वरित, HBM2 बैंडविड्थ, nvlink बैंडविड्थ, इस तरह के प्रदर्शन की गति के रूप में, प्रशिक्षण की गति १२.५ बार समय के त्वरित वृद्धि सहित ।