Новости

От Китайской академии наук до Шлюмберже: рождение ультра-высокопроизводительных чипов Китая

Прибытие 5G ускоряется.

В настоящее время 5G находится на критическом этапе определения стандартов. В июне этого года международная стандартная организация 3GPP скоро завершит первую версию международного стандарта 5G. В то же время политика будет по-прежнему благоприятной. 24 апреля Национальная комиссия развития и реформ Министерство финансов издало уведомление о сокращении 5G. Стандартная плата за пользование частотой использования общедоступной системы мобильной связи ......

Технология 5G может не только поддерживать плавную функциональную совместимость различных типов роботов (включая 20,11 + 3,93% диагностических запасов), включая автомобили, но также реализует смартфоны, умные дома, искусственный интеллект, большие данные и облачные вычисления. Улучшенная базовая технология качества.

Столкнувшись с этой продолжающейся волной 5G, является ли китайская чип-индустрия готовой? Хотя это давно, китайский Zhizhi, представленный Huawei Hass, все еще с нетерпением ждет. В настоящее время в области baseband Huawei Hass Это единственная китайская компания, которая может сравниться с Qualcomm. Это результат накопления Huawei различных элементов более чем за 30 лет. Это также не ночное событие.

На начальном уровне компании также есть специальная компания: Silang Technology, родившаяся в Институте автоматики Академии наук Китая и бывший Национальный специализированный исследовательский центр по разработке инженерных технологий (созданный в 1992 году), бывший директор центра, бывший Институт автоматизации Китайской академии наук Директор Wang Donglin возглавил команду и впервые разработал микропроцессор MaPU - высокопроизводительный микропроцессор. MaPU впервые добился глобальной оптимизации для алгебраических алгоритмов и является очень программируемым. Он был успешно выпущен в 2015 году.

MaPU может не только полностью реализовать производительность программируемых процессоров международных гигантов, но и потреблять электроэнергию, сравнимую с потребностью в ASIC. На основе MaPU Silang Technology разработала три основные области процессоров: UCP для связи 5G для мультимедийных приложений. UMP и HPP для области гиперкомпьютинга. В то же время он также оснащен процессором доменов AI: Deep neural network engine NNE.

Недавно, в Институте автоматики Китайской академии наук, инвестиционное сообщество опросило основателя и главного ученого Ван Дунлиня из технологии Schlumberger. Ван Дунлинь впервые предложил архитектуру алгоритма на основе алгоритма глобального масштабирования на основе этой архитектуры, а также вычислительную мощность и производительность энергопотребления MaPU на основе этого архитектурного дизайна. По сравнению с международным передовым уровнем.

Основатель и главный научный сотрудник Systech Ван Донглин

Высокопроизводительный микропроцессор MaPU

Ван Донглин представил, что наибольшей особенностью MaPU является высокая вычислительная мощность и низкое энергопотребление.

В настоящее время существует несколько типов процессоров, которые обычно используются на рынке. Один тип - это программируемый процессор, такой как процессор Intel, TI. Он программируется и адаптируется, но при выполнении математического алгоритма его процессор Уровень использования, как правило, составляет около 15%, а высокая энергия - до 20%. Частота использования процессора процессоров TI составляет только 40-50%. То есть эти процессоры имеют такую ​​высокую частоту. Несколько ресурсов, но эффективность его выполнения невысока.

Существует также решение ASIC, которое не требует программирования. Оно использует аппаратное обеспечение для управления потоком алгоритмов и управления алгоритмом. Это фактически ускоритель алгоритма, поэтому эффективность выполнения может быть очень высокой, и она может быть почти на 100%.

Очевидно, что существует огромная разница в потреблении энергии между программируемыми процессорами и ASIC. Проблема с ASIC заключается в том, что они очень эффективны, но алгоритмы неизменны. Если алгоритм немного изменится, этот чип не может быть использован.

MaPU может достичь эффективности, близкой к ASIC (использование вычислительных ресурсов может достигать более 90%), а также высокопрограммируемым с обоими преимуществами.

В качестве примера возьмем суперкомпьютерный чип. Производительность и энергопотребление MaPU являются самыми высокими в мире

По мнению Ван Дунлиня, основная проблема современных программируемых процессоров заключается в том, что это традиционная архитектура с низкими уровнями команд и попытки локального параллельного выполнения с использованием внеочередного многоэмиссионного и других методов во время выполнения. Это вызвало вычислительные ресурсы в чипе. Коэффициент использования невелик, объем данных IO большой, динамическое энергопотребление велико, а общее соотношение производительности и мощности невысоко. Для сегодняшнего общества было нелегко удвоить огромную вычислительную мощность микропроцессора и чрезвычайно низкое энергопотребление. Если его можно применять по всему алгоритму Чтобы рассмотреть параллельные характеристики разных измерений, такие как время и пространство, и использовать эти параллельные характеристики для общей оптимизации, скорость использования калькуляторов в ядре будет значительно улучшена. Поэтому Ван Донглин и его команда провели тщательные измерения и эксперименты. Предложено решение глобальной оптимизации уровня алгебраического алгоритма.

«Одна команда может реализовать алгебраический алгоритм, поэтому он называется алгебраической инструкцией. Наборы команд традиционных архитектур - это все инструкции на уровне арифметики». Ван Дунлинь сказал, что MaPU обновляет его до арифметических инструкций на уровне алгебры, а «MaPU использует алгебраические инструкции». Архитектура аппаратной архитектуры динамической реконструкции с нулевой задержкой трубопровода (адаптированная к алгоритму) обеспечивает такую ​​же базовую архитектуру алгоритма, что и ASIC, и реализует глобальный процесс выполнения оптимизации всего алгоритма.

Короче говоря, MaPU может поддерживать как глобальную оптимизацию на уровне приложений, так и высокую реконфигурируемую вычислительную архитектуру и архитектуру хранения на уровне программного обеспечения, которые могут быть гибко адаптированы к области (связь 5G, мультимедиа, суперкомпьютер или руководство Различные типы алгоритмов в интеллектуальном), можно сказать, что MaPU сочетает в себе преимущества ASIC, FPGA и CPU, и это мягкая ASIC, которая почти сравнима с отношением мощностей ASIC.

«Оперативные микропроцессоры MaPU-Algebra, которые генерируют основные оригинальные инновации в параллельных алгебраических операциях, системы команд систем параллельной системы хранения и аппаратные архитектуры, увеличивают аппаратную поддержку микропроцессора от скалярных / суперскалярных операций до алгебраических операций, увеличивая порядки величины Энергоэффективность вычислительного интенсивного полевого микропроцессора », - резюмирует Ван Донглин.

Затем, учитывая удельный коэффициент производительности и энергопотребления, Ван Донглин дал набор интуитивных сравнительных данных:

Например, в качестве суперкомпьютерного чипа Aurora H1.0, чип объединяет 32 процессорных ядра HP, а возможность обработки с плавающей запятой с двойной точностью будет достигать 4 659 ГФЛОП @ 64. Предполагаемая потребляемая мощность составляет всего около 40 Вт, а отношение производительности / мощности достигает 116 ГФЛОП @ 64. / W, сначала в мире.

Поэтому, после массового производства MaPU, его оригинальные архитектурные преимущества, мы надеемся, позволят Китаю добиться крупного прорыва в архитектуре микропроцессора, выпустить огромную вычислительную мощность с одинаковым соотношением энергии и провести независимую инновацию и развитие китайской электронной промышленности.

В ответ президент Китайской академии наук Бай Чунли заявил в средствах массовой информации в марте этого года: «В исследованиях и разработках высокотехнологичной продукции Академия наук Китая вскоре выпустит микропроцессор с полностью независимыми правами интеллектуальной собственности - алгебраическим процессором MaPU, который достигнет международного уровня. Считается, что после выхода процессоров серии MaPU они будут светить в мире компьютеров, коммуникаций и других областей рынка бытовой электроники.

«Трое детей MaPU»

На основе MaPU Smart Technology разработала еще три мощных полевых процессора: UCP в поле связи 5G, UMP в мультимедийном поле и HPP в поле Hypercomputing.

UCP: первая в мире полная реализация программного обеспечения радио.

UCP - это усовершенствованный универсальный коммуникационный процессор MaPU для мобильной связи, являющийся ядром чипа процессора базовой станции базовой станции 5G, ядро ​​UCP может завершить комплексный FFT с фиксированной запятой 5.8G в секунду, в секунду может завершить кодирование LDPC на 55GBPS и декодировать 2,5 Гбит / с. Согласно предварительным расчетам, процессор основной полосы частот с двадцатью ядрами UCP может удовлетворить все требования к обработке основной полосы частот для базовой станции с 5 антеннами с 5 антеннами.

«Если вы используете FPGS для построения системы 5G, вам понадобится несколько соединений для достижения системного решения, а системы на основе FPGA будут в целом<400-600MHz, 片间互联总线带宽受限, 运算能力受限, 这将成为实现5G系统的瓶颈. ' 王东琳说.

В настоящее время ядро ​​UCP является ведущим в мире процессорным ядром, которое реализует полную программно-определенную систему обработки полосы пропускания беспроводной связи 5G по приемлемой цене. Ван Дунлинь определяет UCP как программно определенное радио, которое полностью реализует обработку полосы пропускания в области мобильной связи.

В дополнение к производителям оборудования для базовых станций, ядра UCP также могут быть предоставлены производителям терминалов 5G. В связи со стандартом 5G все терминалы должны быть повторно встроены для размещения базового диапазона основного блока 5G (исходное ядро ​​основной полосы или ядро ​​DSP не могут иметь дело с приемом нисходящей линии 5G И большой объем операций во время передачи по восходящей линии связи, это также возможность для ядра UCP. Оборудование беспроводной связи «все-в-одном», широкополосные самоорганизующиеся сетевые терминалы в различных областях также является способностью UCP демонстрировать свои возможности с помощью полной программной радиотехнологии.

UMP: благодаря своему смартфону, смарт-телевизоры могут быть обновлены онлайн с аудиовизуальным опытом и могут обеспечить супер-двигатели для видео, видео и других приложений высокой четкости.

UMP - второй «малыш» Mapu для смартфонов, микропроцессорный ядро ​​интеллектуального телевидения.

UMP изобрел более эффективную архитектуру параллельной обработки, основанную на базовой архитектуре MaPU, что делает соотношение производительности и мощности различных типов операций обработки видеоизображений сопоставимыми с характеристиками ASIC. В некоторых отношениях он даже превосходил, сохраняя при этом высокопрограммируемую функцию.

«Эта функция позволяет домашнему телевизору с использованием технологий видео и аудио обработки ТВ для улучшения визуального и звукового сопровождения в Интернете, это не имеет аналогов в чипе ASIC TV». Ван Дунлинь сказал: «Также можно быстро внедрять новые продукты с помощью алгоритмов и улучшений программного обеспечения» .

4 чипа с ультравысоким разрешением (до 8 Вт), состоящие из 4 ядер UMP и 1 ядра ARM, могут удовлетворить все требования к обработке видео и аудио для телевизоров высокой четкости 4K и управления телевизионной системой на базе Android. Звуковые и визуальные эффекты могут быть сопоставимы с аудиосистемой Sony. С самым высоким телевизором Samsung. 14 ядер UMP + 1 чип ядра Super TV от ARM для удовлетворения всех потребностей в обработке и вычислении 8K Ultra HD TV.

Вместе с ядром NNE, разработанным Silang в сильном нейронном сетевом движке AI, будь то смарт-телевизор или смартфон, он может обеспечить высокую производительность в видео высокой четкости, машинное зрение, взаимодействие с человеческим компьютером и более низкие отечественные бытовые электроники. Стоимость будет значительно улучшать пользовательский интерфейс. Первый супермодульный процессор будет завершен в 2018 году и может быть применен для производителей смарт-телевизоров для продвижения приложения.

По сравнению с новейшим процессором Intel, основной процессор HPP почти на порядок превышает потребление энергии.

В настоящее время второе поколение MaPU «kid» HPP уже является зрелым продуктом.

«Основные возможности MaPU, полученные благодаря инновациям в области архитектуры, по-прежнему чрезвычайно интенсифицированы». Поэтому Ван Дунлинь надеется построить суперкомпьютерный микропроцессор для расширенной базовой технологии HP Mapu (высокопроизводительная обработка) для универсальных вычислений для удовлетворения потребностей высокопроизводительных серверных приложений. ,

Таким образом, был разработан Aurora H1.0, суперпроцессорный микропроцессор MaPU (который, как ожидается, будет завершен в конце года). Коэффициент производительности и мощности Aurora H1.0 был разработан намного лучше, чем другие микропроцессоры в мире. , Он может использоваться как основной процессор суперкомпьютерной системы и суперсервера.

Ван Донглин дал набор данных:

Суперкомпьютер на базе HPP Aurora H1.0 имеет ту же производительность, что и новейший Xeon Phi от Intel, но он может быть переконфигурирован с 16/32/64/128 битами, а соотношение производительности / мощности улучшено почти на порядок: предоставление эквивалентного 64-битного плавающего Точечная вычислительная мощность, когда Aurora H1.0 (2x16 HPP ядер) потребляет 40 Вт, а процессор Intel Xeon Phi составляет 300 Вт.

NNE: обработка верхней глубокой нейронной сети

Еще один продукт SFRON: ускоренный нейронный сетевой движок NNE унаследовал и разработал MaPU «Модель оптимизации концентрированной окружной системы хранения» и оптимизировал ее для глубоких нейронных сетей. Преимущество заключается в том, что для основной нейронной сети пропускная способность всей сети высока. Требования к доступу к памяти и низкое энергопотребление сопоставимы с потребностями в ядрах нейронных сетей Nvidia, но они более эффективны. NNE NNE поглощает концепцию глобальной оптимизации MaPU, когда речь идет о системах хранения и глубоких конфигурациях нейронных сетей.

«NNE может поддерживать глубокое обучение, особенно поддерживает интеллектуальные рассуждения, была оптимизирована специально для распознавания видеоизображения и имеет выдающиеся преимущества в структурировании обнаружения, распознавания и видеоизображения». Ван Дунлинь.

Сценарий приложения, который можно ожидать, - это умное вождение. В этом случае UMP может обрабатывать многокамерные изображения с высокой скоростью и извлекать объекты для идентификации. NNE отвечает за понимание условий обработки, условий автомобиля и предоставление ключевой информации, необходимой для принятия решений и управления движением. UCP отвечает за предоставление возможностей связи с сетью с очень малой задержкой.

Ган сидел на скамейке, настаивал на исследованиях и разработках почти 10 лет исследовательской группы

Silang и его предшественница работали над исследованием развертывания новых архитектур набора инструкций с 2009 года и разработали полностью независимые и инновационные микропроцессорные архитектуры. MaPU испытал девять лет лишений. Команда R & D является оригинальным национальным дизайном ASIC. Более 70 основных научных исследователей в Научно-исследовательском центре инженерных технологий.

Со второго квартала 2017 года команда начала свою корпоративную деятельность.

Ван Донглин - человек с техническим убеждением, как и товарищи по команде. Область интегральных схем всегда была неадекватной, и нехватка персонала. Поскольку чипы, такие как чипы, слишком сложны, а преимущества невысоки, многие выдающиеся студенты более склонны выбирать финансовые и интернет-индустрии после окончания учебы. Мастерство требуется для изготовления чипов, требующих первоклассного технического персонала, желающего сосредоточиться на исследованиях и разработках, и может долгое время выдерживать давление на успешные исследования и разработки. Команда R & D Silang Technology сделала это.

Процессоры на основе MaPU в нескольких расширенных областях имеют свои преимущества в своих областях, и их также можно использовать в сочетании для достижения множества практических сценариев: коммуникация 5G, смартфоны, умные дома, суперкомпьютеры, интеллектуальное вождение, разведка Города, роботы и беспилотные летательные аппараты и т. Д.

«Закон Мура не может применяться навсегда, а обновление производительности чипов столкнулось с глобальным узким местом. Это просто лучшая возможность для нас догнать». Ван Донглин сказал: «Чип - это отрасль, которая нуждается в терпении. Мы это делаем уже 9 лет. Хорошо, следующая важная вещь - приспособиться к фактическому приложению и оптимизировать.

2016 GoodChinaBrand | ICP: 12011751 | China Exports