Da Academia Chinesa de Ciências à Schlumberger: o nascimento dos chips de desempenho ultra-alto da China@goodchinabrand.com

processo 5G chegada está em aceleração.

Atualmente, 5G está em um estágio crítico da definição padrão, em junho deste ano, a Organização Internacional de Normas 3GPP 5G está em fase de conclusão da primeira versão das normas internacionais, enquanto as políticas também favoráveis ininterrupto, 24 de abril de Desenvolvimento e Reforma, Ministério das Finanças emitiu uma circular para reduzir 5G padrão público móvel frequência sistema de comunicação taxa de ocupação ......

A tecnologia 5G pode não apenas suportar a interoperabilidade suave de vários tipos de robôs (incluindo 20,11 + 3,93% de estoques de diagnóstico), incluindo automóveis, mas também realiza smart phones, smart homes, inteligência artificial, big data e computação em nuvem. A tecnologia básica atualizada da qualidade.

5G face desta onda que se aproxima, a indústria de chips da China está pronto? Embora a resistência estrada e longa, mas Huawei Hass como o representante da sabedoria chinesa fez ainda olhar para frente. No baseband atual, Huawei Hass é a única empresa chinesa em comparação com a Qualcomm, a Huawei 30 anos, como resultado da acumulação de vários elementos, nem durante a noite.

Em nível de empresa de risco, há também uma empresa é particularmente especial: nasceu da Academia Chinesa de Ciências Instituto de Automação, ex-Nacional de Engenharia Centro de Pesquisa para IC Design especial (formado em 1992) em tecnologia Silang, o ex-diretor do centro, o original Academia Chinesa de Ciências Instituto de Automação Dr. Wang Donglin levou diretor, desenvolveu um campo microprocessador mapa de alta performance, Mapu primeira vez nível algoritmo algébrico otimização global e altamente programáveis, o sucesso de silício foi em 2015.

Mapu não só pode conseguir gigantes internacionais de desempenho programável processador, e consumo de energia do que comparáveis mapa com base ASIC, tecnologia Silang mais desenvolvido processador de três áreas principais: a UCP 5G nas comunicações, áreas orientadas para o multimédia . UMP, e no campo da supercomputação para HPP mesmo tempo, também equipado com um processador em AI: profundidade neural NNE motor de rede.

Recentemente, a Academia Chinesa de Ciências Instituto de Automação, a comunidade de investimentos para entrevistar fundador Silang Tecnologia e cientista-chefe Wang Donglin. Wang Donglin apresentada pela primeira vez no algoritmo algébrico nível internacional 'otimização global de computação' arquitetura, baseado nesta arquitetura Mapu de design em potência e desempenho por watt de computação Comparado com o nível avançado internacional.

Fundador da Systech e cientista-chefe Wang Donglin

Microprocessador de Alto Desempenho MaPU

Wang Donglin introdução, maior característica mapa é a forte capacidade de computação, baixo consumo de energia.

processador Atualmente, o mercado comumente usado tem várias categorias, é uma processadores programáveis, como a Intel, os processadores da TI, pois programável, muito ampla adaptabilidade. Mas quando se realiza um algoritmo matemático, o seu operador utilização é geralmente de cerca de 15% mais elevado de energia para 20%. processador TI, operador o máximo de utilização é apenas para ser 40-50%. que esses processadores por si só é tão elevado na frequência, de modo que leva Vários recursos, mas sua eficiência de execução não é alta.

Há também um ASIC programável sem o programa, ele usa o controle de hardware e fluxo algoritmo algoritmos foram escritos. Este é realmente o algoritmo acelerador, assim que a eficiência será muito elevado, quase perto de 100%.

Obviamente, entre o processador e ASIC programável tem uma enorme diferença no consumo de energia. Questão ASIC é, eficiência elevada, mas o algoritmo não pode ser alterada, desde que a mudança do algoritmo que o chip não pode ser utilizado.

O mapa tanto pode ser feito perto de eficiência do ASIC (computação utilização de recursos pode chegar a 90%), mas também altamente programáveis, combina as vantagens de ambos.

Para supercomputação de chip, por exemplo, o desempenho Mapu per watt mundo

Em vista Wang Donglin, o atual problema do núcleo do processador programável convencional é que é uma arquitetura, instrução de nível tradicional e baixa tentando embaralhar através de múltiplos de transmissão para a tecnologia de tempo de execução para alcançar a execução paralela de local quanto possível. Isso resultou em recursos de computação de chips utilização não é alta, uma grande quantidade de dados IO, grande poder dinâmico, não é alto desempenho geral por watt, a sociedade duplo de hoje já não satisfazem o desejo de microprocessador enorme poder de computação e de baixo consumo de energia. Se a aplicação de todo o algoritmo considerar as diferentes dimensões de tempo e espaço, natureza paralela, características e usá-los em paralelo para otimizar o acabamento geral, seu uso da calculadora do kernel vai ser muito melhorada. modo Wang Donglin e sua equipe têm sido medição e testes de precisão, Uma solução para otimização global do nível de algoritmo algébrico é proposta.

'Uma instrução, você pode conseguir um algoritmo algébrico, chamado de instrução algébrica instruções set arquitetura instrução tradicional de nível são cálculo aritmético.' Wang Donglin disse, Mapu para atualizar as instruções de grau aritméticas álgebra, 'instrução algébrica macio Mapu dinâmica linha de atraso reconfiguração a zero (com o algoritmo de adaptação) arquiteturas para atingir substancialmente a mesma arquitetura algoritmo ASIC para alcançar a otimização global do processo de execução do algoritmo.

Em suma, Mapu tanto para apoiar a aplicação de nível mundial algoritmo de otimização, mas também através deste arquiteturas de computação altamente reconfiguráveis e armazenados na implementação nível de software do sistema, a flexibilidade para adaptar campo (comunicações 5G, multimédia ou Supercomputer artificial inteligente) dentro de vários algoritmos pode ser dito Mapu combina as vantagens da ASIC, FPGA, CPU, e é quase o desempenho por watt do que ASIC comparável 'ASIC macia.'

'Microprocessador MaPU- álgebra, uma inovação significativa na álgebra paralela original, arquitetura de memória paralelo e conjunto de instruções da arquitetura de hardware, o suporte de hardware microprocessador da escalar aritmética elevador / superscalar a nível álgebra, aumentar a magnitude arte microprocessador computação-EER intensiva. 'Wangdong Lin assim resumidas.

Então, dado o desempenho específico e a taxa de consumo de energia, Wang Donglin forneceu um conjunto de dados intuitivos de comparação:

Em Aurora chip de H1.0 computador, por exemplo, chip integrado 32 núcleos de processamento HPP, com precisão dupla flutuante capacidade de processamento ponto atingirá 4,659GFLOPS @ 64, avaliada consome apenas cerca de 40 W, o consumo de energia para 116GFLOPs desempenho @ 64 / W, primeiro no mundo.

Portanto, após aplicações de produção de volume Mapu, as vantagens da sua arquitectura única é esperado para permitir que o nosso país para alcançar um grande avanço na arquitetura de microprocessadores, liberando enorme poder de computação na mesma energia do que liderar a inovação eo desenvolvimento da indústria de eletrônicos da China independente.

A este respeito, Academia Chinesa de presidente Ciências media Bai Chunli havia dito em março deste ano: 'No desenvolvimento de produtos de alta tecnologia, a Academia Chinesa de Ciências está prestes a lançar um processador com um microprocessador --MaPU algébricas direitos de propriedade intelectual completamente independentes atingiu o nível avançado internacional. Eu acredito que os processadores da série futuro Mapu sair, o mundo vai brilhar no campo de computadores, comunicações e mercado de eletrônicos de consumo, a maioria dos produtos '.

'Três filhos de MaPU'

Com base Mapu em tecnologia Silang desenvolveu ainda mais as três áreas de processadores forte desempenho: 5G processador de comunicações UCP, UMP processador multimídia, bem como o campo da HPP processador de supercomputação.

UCP: A primeira implementação completa do mundo de rádio definido por software.

UCP é Mapu para comunicação móvel avançado chip de núcleo do processador Geral comunicações 5G processador macro estação base, o núcleo pode ser feito por UCP 5.8G complexo um ponto FFT, e codificação LDPC pode ser feito por 55GBPS decodificação 2.5Gbps acordo estimativas preliminares, um processador de banda base contém vinte UCP núcleo para atender a 64 macro estação base antena 5G todas as necessidades de processamento de banda base.

'Se as estruturas FPGS sistema 5G, é necessário perceber soluções de sistemas de interconexão multi-chip, e com clock de circuitos baseados em FPGA geral<400-600MHz, 片间互联总线带宽受限, 运算能力受限, 这将成为实现5G系统的瓶颈. ' 王东琳说.

UCP é um núcleo de processador kernel atual líder para conseguir a transmissão completa do sistema 5G definido por software de rádio de processamento de banda base a um custo aceitável Wangdong Lin é definida como a UCP 'comunicações móveis de realização completa do software de processamento de banda base rádio definido.

Além aparelho de estação base fabricantes, de UCP núcleo pode também ser fornecido aos fabricantes de terminais 5G. Devido ao padrão 5G, todos os terminais devem ser re-adaptado para adaptar o algoritmo 5G núcleo de banda de base (original do kernel de banda base ou núcleo DSP não pode lidar recepção da ligação descendente 5G uma grande quantidade de computação e a transmissão de ligação ascendente), que é o núcleo da UCP-opportunity. um dispositivo de comunicação sem fio, os campos terminais também são espaço MANET UCP banda larga pela capacidade total de exibição de software definido tecnologia de rádio.

UMP: Graças ao seu telefone inteligente, as TVs inteligentes podem ser atualizadas on-line com experiência audiovisual e podem fornecer supermotores para fotografia, vídeo e outros aplicativos de alta definição.

O UMP é o segundo 'garoto' da Mapu para smartphones, o núcleo de microprocessador multimídia da smart TV.

UMP em mapa invenção baseada na arquitectura de base de uma arquitectura mais eficiente de processamento paralelo, de tal modo que a razão entre a potência para o desempenho ASIC de vários tipos de operações de processamento de vídeo comparáveis a, ou ainda ganhar certos aspectos, mantendo ao mesmo tempo um elevado grau de capacidade de programação.

'Este recurso permite que os fabricantes de TV com os algoritmos de processamento de áudio de TV em casa, dependendo da evolução do vídeo online e experiência de áudio para melhorar o efeito, que é de chips ASIC TV não pode igualar.', Disse Wang Donglin ', mas também pode ser melhorada através de algoritmos de software e rápida introdução de novos produtos '

UMP núcleo ARM 4 + 1 núcleo composto por chip de motor de TV ultra-alta-definição (não mais de 8 watts de potência) para atender todo o processamento de áudio e vídeo 4K ultra-televisão de alta definição e todas as necessidades de gerenciamento baseado em Android da televisão, áudio e efeitos visuais comparável à Sony Com a TV mais sofisticada da Samsung, 14 núcleos UMP + 1 chip ARM Core Super Engine para atender a todas as necessidades de processamento e computação da TV Ultra HD de 8K.

Depois Silang adicionar pesquisa e desenvolvimento do campo da AI rede neural do kernel NNE motor de profundidade, se é TV inteligente ou telefone inteligente, você pode conseguir grande salto de desempenho em vídeo de alta definição, de visão de máquina, aspectos de interação humano-computador, de modo que os domésticos produtos eletrônicos de consumo em baixa O custo vai melhorar muito a experiência do usuário, o primeiro chip de super TV será finalizado em 2018 e pode ser aplicado para fabricantes de TVs inteligentes para promover o aplicativo.

Comparado com o mais recente processador da Intel, o superprocessador de núcleo da HPP é quase uma ordem de grandeza maior no consumo de energia.

Atualmente, o terceiro kernel HPP da 'criança' da MaPU já é um produto maduro.

'Core competências mapa obtido através da inovação arquitetônica ou computação de alta densidade.' Portanto, Wang Donglin sido esperando constituem microprocessadores Supercomputer para general-purpose computing reforçada núcleo HPP (processamento de alto desempenho) por Mapu, para atender às necessidades de servidores high-end .

A fim de desenvolver uma classe supercomputing Aurora H1.0-- mapa microprocessador (fluxo folha prevista para ser completada e a extremidade do beta), concebido por Avaliação de Desempenho Poder Aurora H1.0 muito mais do que o outro Supercomputador Internacional baseado em microprocessador , Ele pode ser usado como o processador central do super-sistema de computação e super servidor.

Wang Donglin deu um conjunto de dados:

Aurora processador H1.0 supercomputação e Intel Xeon Phi último kernel HPP baseada no desempenho bastante, mas a reconstrução flexível 16/32/64/128 bit, desempenho por watt por quase uma ordem de grandeza: para fornecer o mesmo 64-bit float quando Aurora H1.0 desempenho ponto (2x16 dois núcleos HPP) poder é 40W, processador Intel Xeon Phi é 300W.

NNE: Processamento de Rede Neural Profunda Superior

Outro produto Silang: o motor da rede neural para acelerar a NNE herdou e desenvolveu mapa de 'concêntrica modelo de arquitetura de armazenamento otimizado', e otimizado para a profundidade da rede neural, a vantagem é para a rede neural mainstream, toda a rede de alto rendimento, absorvida buscar baixa demanda e consumo de energia e desempenho líquido núcleo profundidade NVIDIA bastante nervoso, mas mais eficiente. Silang NNE na configuração do sistema de armazenamento e profundidade da rede neural Mapu ideias otimização global, significativo desempenho por watt do que as vantagens anteriores.

O NNE pode oferecer suporte a treinamento em aprendizado profundo, especialmente suporta raciocínio inteligente, foi otimizado especificamente no reconhecimento de imagens de vídeo e tem excelentes vantagens na detecção de alvos, reconhecimento e estruturação de imagens de vídeo. ”Wang Donglin.

Um cenário esperado é de condução inteligente, nesta cena, UMP processamento de alta velocidade de imagens de várias câmeras e extrair metas a serem identificados; NNE responsável pelo processo de julgamento compreensão da estrada, condição e fornecer informações críticas para a tomada de decisões e conduzir controle necessário; e A UCP é responsável por fornecer recursos de comunicação de rede de veículos extremamente curtos.

Gan sentou no banco, insistiu em pesquisa e desenvolvimento por quase 10 anos de equipe de pesquisa

Silang e sua equipe antecessor, a partir de 2009 começou a estudar a implantação de um novo conjunto de instruções, para desenvolver uma arquitetura de inovação Mapu microprocessador completamente independente passou por nove anos de difíceis anos. R & D equipe de design antigo circuito integrado específico do Estado Mais de 70 pesquisadores científicos no Centro de Pesquisa de Tecnologia de Engenharia.

A partir do segundo trimestre de 2017, a equipe iniciou sua operação corporativa.

Wang Donglin é um homem hábil de fé, campo companheiros de equipe também. IC tem sido sempre a falta de talento, a falta de pessoal. Porque chips e outro hardware para fazê-lo amargo, a renda não é alta, muitos estudantes pendentes após a graduação preferem indústria financeira e Internet. você precisa ter espírito chips de artesão, precisa superiores pessoal técnico dispostos a afundar o coração para fazer a pesquisa e desenvolvimento, e pode suportar o sucesso a longo prazo de pressões de pesquisa e desenvolvimento. ciência e tecnologia Silang equipe de P & D fez.

Os processadores baseados em MaPU em várias áreas aprimoradas têm suas próprias vantagens em seus respectivos campos e também podem ser usados em combinação para alcançar uma variedade de cenários práticos: comunicações 5G, smart phones, smart homes, supercomputadores, smart driving, inteligência Cidades, robôs e drones, etc.

"A Lei de Moore não pode ser aplicada para sempre, e as melhorias no desempenho dos chips enfrentam um gargalo mundial. Essa é apenas a melhor oportunidade para alcançá-las. O chip é uma indústria que precisa de paciência. Fazemos isso há 9 anos. OK, a próxima coisa importante é ajustar a aplicação real e otimizar.