نفيديا كفاءه الحوسبة حل المهندس المعماري أكسل كوهلر مؤخرا عرض نفيديا الجيل الجديد الجرافيك قواتا العمارة وأحدث كودا 9 الحوسبة المتوازية منصة ونموذج البرمجة التي بنيت لقواتا في مؤتمر التكنولوجيا نفيديا الجرافيك. يدعي ان قواتا لديها جديده المسلسل تدفق multiprocessor (يتدفقون multiprocessor ؛ SM) العمارة ، وقاعده البيانات كودا 9 كما يظهر عددا من ترقيات ، ويظهر نموذج تصميم برنامج جديد لتحسين الأداء. وفقا لتقرير داخل HPC ، وفقا لكوهلر ، والمجال الحالي لل HPC في زيادة الطلب علي الحوسبة ، وتعقد الشبكة العصبية أيضا تنفجر ، في هذا الاتجاه السوق ، وعرض نفيديا العمارة قواتا القائم علي تسلا V100 المعالج ، وتوفير مركز معلومات الذكاء الاصطناعي الذكاء الاصطناعي) ، HPC ومتطلبات الرسم ، والمطالبة بان تكون أسرع وأكثر إنتاجا معالج الرسومات (GPU) للتعلم العمق (التعلم العميق) و HPC. ل sm Microarchitecture الجديدة ، ويقول كوهلر ، قواتا GV100 sm هو منتج أعاده تصميم للانتاجيه مع الهندسة المعمارية مجموعه جديده (عيسى) ، وتبسيط المنطق وحده الإفراج (مساله منطق) ، وكبيره ، أسرع التخزين المؤقت L1 ، لتحسين نموذج SIMT ودعم تسريع tensor ، ميزه واحده هي انه بالمقارنة مع الجيل السابق من باسكال sm ، قواتا sm يدمج التكنولوجيات الرئيسية لدمج l1 $ مع الذاكرة المشتركة تصل إلى 128 كيلوبايت ، وخلق انخفاض الكمون والآثار المتدفقة ، مثل الجري l1 $4 5 مرات القدرة علي التحسين ، ويمكن ان تقصر مع الجيل السابق من الفجوة الذاكرة باسكال المشتركة. ميزه أخرى ان كوهلر يذكر هو القدرة علي الحصول علي جدوله الموضوع المستقلة التي تدعم التنفيذ المتداخل (interleaved التنفيذ) من بيانات التفريع المتباينة ، والقدرة علي تنفيذ خوارزميات موازيه grained غرامه ، والتنفيذ لا يزال مخطط خيوط متعددة المقابلة لتعليم واحد. هندسه الذاكرة الجديدة HBM2 يدمج العمليات والذاكرة في حزمه واحده ، مع مزيد من النطاق الترددي وزيادة كفاءه الطاقة ، و V100 يمكن أيضا تحقيق 95 ٪ درام الاستفادة ، والتي هي متفوقة علي الاستفادة من 76 ٪ درام من الجيل السابق P100. ويتم أيضا تعزيز الهندسة المعمارية GV100 قواتا الخدمات المتعددة (mps) الميزات ، مما يسمح للعملاء أعضاء البرلمان لنقل مباشره تشغيل المهام إلى طوابير العمل داخل الجرافيك (طوابير العمل) ، التالي الحد من الكمون الإطلاق وتحسين الانتاجيه. وفي الاستدلال ، فانها تدعي انه يمكن الاستدلال بفعالية علي أعضاء البرلمان في قواتا للنشر دون نظام دفعات. في العام الجرافيك مقارنه الأداء ، نفيديا المطالبات التي V100 من P100 في التدريب المعجل ، تسارع الاستدلال ، HBM2 باندوتز ، nvlink عرض النطاق الترددي ، مثل سرعه الأداء ، بما في ذلك سرعه النمو السريع للتدريب من 12.5 مرات مرات.