Кроме того, глубина обучения производительности обучение также утверждал, что в 3 раза быстрее. NVIDIA к новому поколению Вольта архитектура, предназначенная для углубленного обучения и жизни?@goodchinabrand.com

NVIDIA эффективное вычислительное решение архитектор Аксель Келер недавно представил NVIDIA нового поколения Вольта GPU архитектура и новейшие CUDA 9 параллельной вычислительной платформы и программирования модель построена для Вольта в NVIDIA GPU технологии Конференции. Утверждает, что Вольта имеет новый многопроцессорный последовательный поток (потоковый многопроцессорный; SM), в базе данных CUDA 9 также показан ряд обновлений, демонстрирующих новую модель разработки программ для повышения производительности. Согласно внутреннему отчету HPC, согласно Келер, в настоящее время поле HPC в увеличивая требовании для вычислять, сложность нейронной сети также взрывает, в этом тенденции рынка, NVIDIA представило зодчество Вольта основанное V100 Tesla, обеспечивая информационный центр искусственный интеллект ( AI), HPC и чертеж требования, утверждают, что самый быстрый и производительный графический процессор (GPU) для углубленного обучения (глубокое обучение) и HPC. Для новой SM микроархитектуры, Келер говорит, Вольта гв100 SM является переработанный продукт для производительности с новой архитектурой набора инструкций (ISA), упрощенный блок логики релиза (логика вопроса), и большой, более быстрый кэш L1, Для улучшения модели SIMT и поддержки ускорения, одна особенность в том, что по сравнению с предыдущим поколением Pascal SM, Вольта SM интегрирует ключевые технологии для интеграции L1 $ с разделяемой памятью до 128KB, создавая более низкие задержки и потоковые эффекты, такие как потоковая передача L1 $ имеет в 4 раза больше пропускной способности, в 5 раз больше возможностей для улучшения, и может сократить с предыдущим поколением общей памяти Паскаля пробел. Еще одной особенностью, Келер упоминается, является возможность иметь независимое расписание потоков, поддерживающее поэтапное выполнение (пошаговое выполнение) из различных данных операторов ветвления, а также возможность выполнять детализированные параллельные алгоритмы, И выполнение по-прежнему является схемой нескольких потоков, соответствующих одной инструкции. Новая архитектура памяти хбм2 интегрирует операции и память в единый пакет с большей пропускной способностью и более высокой энергоэффективностью, а V100 может также достигать 95% использования DRAM, что превосходит 76% DRAM использования предыдущего поколения P100. Также улучшены функции гв100 архитектуры Вольта (MPS), позволяющие клиентам MPS напрямую передавать выполняющиеся задачи в рабочие очереди графического процессора (рабочие очереди), сокращая тем самым задержку запуска и повышая пропускную способность. Примененный в умозаключении, он утверждает, что Вольта MPS можно эффективно выводить для развертывания без пакетной системы. В общем сравнении характеристики GPU, NVIDIA утверждает что V100 чем P100 в тренировке ускорять ход, выведение ускорять ход, хбм2 пропускную способность, нвлинк пропускную способность, как скорость представления, включая скорость тренировки ускорять ход рост 12,5 времен времен.