انویدیا کارآمد معمار حل محاسبات Axel کوهلر به تازگی معرفی معماری پردازنده گرافیکی ولتا نسل جدید انویدیا و Cuda 9 آخرین سکوی محاسبات موازی و مدل برنامه نویسی ولتا در انویدیا پردازنده گرافیکی فناوری کنفرانس ساخته شده. ادعا میکند که ولتا جدید multiprocessor سریال جریان (جریان multiprocessor; SM) معماری CUDA 9 پایگاه همچنین نشان می دهد تعداد ارتقاء نمایش مدل جدید طراحی برنامه برای بهبود عملکرد. با توجه به داخل HPC گزارش بر اساس کوهلر زمینه کنونی HPC در افزایش تقاضا برای محاسبات پیچیدگی شبکه عصبی نیز انفجار، در این روند بازار، انویدیا معرفی ولتا معماری مبتنی بر پردازنده تسلا V100, ارائه اطلاعات (هوش مصنوعی) مرکز هوش مصنوعی)، HPC و طراحی مورد نیاز، ادعا می شود سریع ترین و سازنده ترین پردازنده های گرافیکی (GPU) برای عمق یادگیری (آموزش صحیح) و HPC. برای بهره وری با دستور العمل جدید معماری (عیسی)، ساده انتشار منطق واحد (موضوع منطق) و بزرگ، سریع تر تنظیم برای Microarchitecture SM جدید می گوید کوهلر ولتا GV100 SM دوباره طراحی محصول است حافظه نهان L1، به منظور شتاب SIMT مدل و پشتیبانی تانسور یکی از ویژگی های است که در مقایسه با نسل قبلی پاسکال SM SM ولتا ادغام فن آوری های کلیدی به l1$ با حافظه اشتراکی تا 128 کیلوبایت, زمان تاخیر پایین تر ایجاد و جریان اثر، مانند جریان l1$ 4 برابر برابر پهنای باند بیشتر است 5 بار بار توانایی برای بهبود، و می تواند با نسل قبلی پاسکال حافظه مشترک فاصله کوتاه. یکی دیگر از ویژگی که کوهلر است توانایی به موضوع مستقل که مبهوت مي کند زمان بندی (اعدام ناپیوسته) از واگرا انشعاب بیانیه داده و توانایی انجام الگوریتم های موازی ریز دانه اشاره، و اجرای طرح موضوعات متعدد مربوط به آموزش واحد هست. معماری جدید حافظه HBM2 عملیات و حافظه را در یک بسته با پهنای باند بیشتر و بهره وری انرژی بالاتر، ادغام و V100 همچنین می تواند دستیابی به 95% در درام بهره برداري که نسبت به استفاده درام 76% از نسل قبلی P100. ویژگی های پردازش (آر) سرویس های متعدد معماری ولتا GV100 نیز، اجازه می دهد مشتریان نمایندگان مجلس به طور مستقیم انتقال کارهای در حال اجرا به کار صف درون GPU (کار صف)، موجب کاهش زمان تاخیر در راه اندازی و بهبود توان عملیاتی پیشرفته هستند. در استنتاج اعمال آن ادعا می کند که ولتا نمایندگان مجلس می تواند به طور موثر برای استقرار بدون سیستم دسته استنباط. در کلی GPU مقایسه عملکرد, انویدیا ادعا می کند که V100 از P100 در آموزش شتاب استنباط شتاب، HBM2 پهنای باند پهنای باند nvlink مانند سرعت عملکرد و سرعت رشد آموزش شتاب 12.5 بار بار.