O novo iPhone X integra um mecanismo neural para reconhecimento facial, mas este é apenas o começo. Os motores neurais incorporados e os processadores inteligentes dedicados implementam a inteligência artificial (IA) em dispositivos de ponta, quebrando a dependência da nuvem. Os benefícios do processamento de borda incluem latência reduzida, cobertura de rede completa, maior privacidade e segurança e uma comunicação reduzida com a nuvem, resultando em custos mais baixos. Por causa dessas vantagens, os dispositivos móveis podem usar a inteligência artificial para alcançar apenas recentemente Cenas que podem aparecer na ficção científica.
Máquinas passadas são agora centros de processamento de dados em tempo real
Acabei de participar de nosso seminário anual e tive a oportunidade de me familiarizar com a tecnologia AI no mundo incorporado. Máquinas que antes eram puramente mecânicas, como carros, drones e robôs, agora estão ficando inteligentes e têm visibilidade. , percepção, rastreamento, classificação, detecção, identificação, etc. Estes dispositivos agora usam visão computacional e fusão de sensores para coletar e processar dados e tomar decisões em tempo real. Em alguns casos, como carros sem motorista e drones, A tomada de decisões é crítica e os atrasos no processamento da nuvem podem levar a tempos de resposta inaceitáveis. Com a inteligência no chip, essas máquinas são mais exatamente definidas como centros de dados.
Um bom exemplo são os veículos sem motor, que exigem uma grande quantidade de sensores visuais e outros, bem como informações de posicionamento por satélite e soluções de conectividade. Ele também deve ter um "cérebro" para a fusão e análise de dados, enquanto o processamento em nuvem E a informação também desempenhará um papel na função do piloto automático, deve haver um processador on-board que possa tomar uma decisão instantânea, e mesmo em condições esporádicas, é fundamental que o veículo não esteja em risco, de modo que o processador possa manipular Cálculos intensivos de aprendizado profundo são necessários, e não um recurso opcional.
O processamento de bordas das redes neurais está se tornando mainstream
No campo dos telefones inteligentes, a Apple geralmente é a pedra de toque de um novo nicho de nicho ou acessório de nicho de mercado, com um mecanismo neural dedicado no telefone à medida que o novo iPhone X da Apple é lançado Uma grande coisa sobre o processamento de borda de inteligência artificial, assim como meu colega previu antes do lançamento do último telefone da Apple, significa que em breve, cada dispositivo equipado com câmera incluirá um DSP visual ou outro processador de rede neural especializado. O mecanismo Nerve na realização da tecnologia Face ID, permitindo que os usuários vejam o telefone para desbloquear seu iPhone. O tempo de resposta ultra-rápido, além do nível de privacidade e segurança, exige que todo o processo de reconhecimento seja completado no telefone. Com o equipamento atual disponível As capacidades de AI, certamente continuarão a introduzir recursos de AI mais emocionantes.
O Google também adicionou funcionalidade semelhante ao seu último telefone principal, o Pixel 2, através de um processador chamado Pixel Visual Core. No mundo do smartphone altamente competitivo, o Google deve se diferenciar. O primeiro é apresentar um smartphone Pixel com uma câmera equipada com um software superior. No entanto, a computação intensiva necessária para aprimoramento de imagem, o efeito bokeh de uma única lente e o aumento da gama dinâmica de fotografias, esses recursos são padrão na maioria dos smartphones líderes de hoje. O dispositivo não pode funcionar de forma eficiente. Então, o Google decidiu adicionar um segundo chip para essas funções. A adição da função AI pode ser outra diferenciação importante. A Huawei também anunciou recentemente a integração de um mecanismo neural no Unicorn 970. Muitas outras empresas também se juntaram à competição.
Como os motores visuais baseados em DSP conseguem inteligência no chip?
Embora os benefícios do processamento de borda sejam óbvios, ele também traz desafios. O desafio é como colocar as operações de dados que podem ser feitas em um servidor enorme em um dispositivo portátil pequeno, enquanto a energia também é consumida em muitas outras tarefas de processamento. É por isso que os DSP visuais são críticos para o processamento bem sucedido de AI de borda. Funcionalidades de vectorização eficientes e eficientes, mas poderosas, tornam o processador DSP a melhor opção para a realização de cargas de trabalho do motor neural.
Outro desafio é como migrar a rede neural existente para o ambiente DSP incorporado. Isso pode consumir muito tempo de desenvolvimento, o custo é muito caro. Mas a cadeia de ferramentas automatizada pode suportar "operações-chave", um serviço único será A análise e otimização da rede é transformada em um ambiente incorporado. É muito importante que tais ferramentas cubram um grande número de redes de última geração para garantir que qualquer rede possa ser facilmente otimizada e executada em dispositivos incorporados.
Após a conclusão do processo de migração e otimização, os dados de entrada geralmente são amostrados para completar o processamento mais rápido com perda mínima de informações. Por exemplo, no processo de RCNN mais rápido (PDF), temos duas etapas de processamento, a proposta regional (proposta Regiões) e classificar as regiões.
A família de processadores CEVA-XM é um DSP visual de ultra-baixa potência que é ideal para este tipo de trabalho. Ao adicionar o Acelerador de Hardware CEVA-CNN (HWA), você pode melhorar ainda mais o desempenho e acelerar o processamento da rede neural (por exemplo, RCNN mais rápido). Como pode ser visto na figura, nosso processador de visão CEVA-XM6 de quinta geração melhorou significativamente o desempenho em relação ao CEVA-XM4 de geração anterior. A adição do acelerador de hardware CEVA-CNN é um grande passo à frente.
A inteligência artificial baseada em aprendizagem profunda traz infinitas oportunidades para dispositivos portáteis: fotos de qualidade DSLR, aprimoramentos e aplicativos de realidade virtual, consciência de contexto, evasão e navegação, detecção, rastreamento, reconhecimento, classificação, segmentação, mapeamento através de aprimoramento de imagem, Posicionamento, aprimoramento de vídeo, etc. Temos tal poder na palma da sua mão. Parece que a função de chamada do smartphone é insignificante.