Com o rápido desenvolvimento de tecnologias como inteligência artificial (IA) e computação de borda (Edge Computing) nos últimos anos, vários eletrônicos de consumo e eletrodomésticos incluídos no conceito de casa inteligente passarão por uma mudança revolucionária. Uma rede de inteligência artificial composta de dispositivos domésticos pode se tornar um outro membro da família que você não pode ver.O conceito da nuvem local e seus equipamentos relacionados será um elemento indispensável na implementação de uma rede de inteligência artificial doméstica.
Alto-falante inteligente / monitoramento se tornará dois fusos principais de AI consumidor
A empresa de pesquisa Ovum responsável por acompanhar o desenvolvimento de tecnologia de consumo pesquisador Ronan de Renesse (Figura 1) que a aplicação da AI no campo da eletrônica de consumo, quase dois anos muitas vezes se tornam o foco de atenção da mídia, mas eletrônicos de consumo e AI combinado com a tendência, Só agora está começando a se desenvolver: nos próximos três a cinco anos, muitos produtos eletrônicos de consumo terão a funcionalidade da inteligência artificial e se conectarão entre si para formar uma rede de inteligência artificial em casa.
Figura 1 Ronan de Renesse, pesquisador de tecnologia de consumo da Ovum, acredita que vários dispositivos eletrônicos na futura família se tornarão um membro da família invisível.
Para cadeia de hardware, embora esta tendência vai trazer muitas novas oportunidades de negócios, mas se a partir de um ponto de nível superior de vista, este entrou calmamente a rede de inteligência artificial em casa, você será Eu não vejo outra "família Membros ".
Do lado do hardware, os alto-falantes inteligentes que são familiares para todos são basicamente produtos relativamente maduros.Embora haja um crescimento significativo nas vendas nos próximos cinco anos, o crescimento irá gradualmente desacelerar.Aprecia-se que até 2022, alto-falantes inteligentes globais O valor das vendas será de cerca de 9,5 bilhões de dólares, mas a Renesse acredita que a Amazon e o Google podem não lançar sua própria marca de alto-falantes inteligentes no futuro, porque esse tipo de produto em si tem pouco espaço para lucro. Para os gigantes da rede doméstica, contanto que os fornecedores de hardware usem seus serviços de plataforma, eles podem coletar os dados do usuário de que precisam.
No mesmo período, mudanças em produtos como sistemas de monitoramento inteligente em casa serão mais pronunciadas do que as de alto-falantes inteligentes Atualmente, os chamados produtos de monitoramento inteligente doméstico não possuem componentes de inteligência artificial, mas sim câmeras, alarmes, fechaduras, sensores e outros equipamentos. Os produtos são conectados uns aos outros para formar um sistema de segurança que suporta Event Trigger, mas à medida que as tecnologias de software e hardware se tornam mais maduras, a proporção de câmeras de vigilância domésticas que carregam inteligência artificial aumenta e, ao mesmo tempo, será capaz de obter mais. Aplicativos, como o uso de assistentes de voz, fornecem vários usuários com serviços mais precisos em um ambiente multiusuário.
Proteção da privacidade do consumidor para aplicativos de IA
No entanto, para a indústria de hardware, o que mais chama a atenção é que o conceito de nuvem local e produtos de aplicativos relacionados serão captados como dispositivos em casa geralmente suportam AI Renesse apontou que os produtos eletrônicos equipados com a função AI Produzir uma grande quantidade de dados do usuário, e muitos deles são dados relacionados à privacidade pessoal.Portanto, se esses produtos eletrônicos domésticos equipados com inteligência artificial dependem completamente da nuvem externa para operar, isso obviamente causará preocupações com a privacidade.
Por outro lado, muitos dispositivos de IoT do consumidor com funções relativamente simples são limitados por energia, poder de computação e custos de produção, podendo não ser capazes de suportar algoritmos de inteligência artificial de alto nível.Agora os dispositivos de nuvem local podem desempenhar o papel do cérebro. Ordene uniformemente esses dispositivos.
No entanto, Renesse também admitiu que ainda é difícil afirmar qual dispositivo reproduzirá um centro de nuvem local.Pode ser um alto-falante inteligente de ordem superior, pode ser TV inteligente ou outros produtos.
Ian Smythe, diretor sênior de marketing da Arm (Figura 2), também acredita que haverá mais e mais mecanismos de computação e inferência movendo-se para o terminal no futuro.A principal força motriz dessa transferência é proteger a privacidade do usuário. Ao processar e analisar os dados no terminal, você pode anonimizar facilmente os dados e garantir que os dados confidenciais não vazem pela rede.Com os aplicativos domésticos como exemplo, os consumidores não querem que ninguém seja capaz de saber pela Internet que não estão em casa. O tempo das pessoas e, em seguida, facilmente para roubar em casa.
Figura 2 Ian Smythe, diretor de marketing sênior da Arm, disse que, para aplicativos de AI de consumidores, se o mecanismo de proteção de privacidade é confiável, será a chave para a popularização do aplicativo.
Para aplicações visuais, a Smythe acredita que as câmeras que suportam o reconhecimento visual são inerentemente consideradas importantes questões de privacidade Obviamente, esses dispositivos devem ser projetados para que possam ser protegidos quando armazenados localmente ou transmitidos para a nuvem. Privacidade e informações confidenciais Como a transmissão é normalmente conectada sem fio, atenção especial deve ser dada à segurança da função de transmissão sem fio.Os engenheiros que projetam o dispositivo devem garantir que os dispositivos conectados à rede não sejam hackeados e espionados.
A duração da bateria continua sendo o principal desafio técnico
No entanto, para empurrar o AI para o nó de borda, o maior desafio técnico atualmente é o consumo de energia do sistema.Com as câmeras de vigilância do consumidor como exemplo, os consumidores podem esperar que esses produtos sejam completamente sem fio, e é melhor nem mesmo conectar cabos de energia. Isso significa que esses produtos devem ser alimentados por bateria e também oferecer suporte a redes sem fio, além de poder identificar todos os itens e precisar de espaço de armazenamento ilimitado.
Os requisitos acima representam um grande desafio para o projeto do sistema, exigindo a capacidade de executar meses de baterias ininterruptas para executar os recursos de aprendizado de máquina (ML) e a capacidade de fazer upload contínuo de arquivos para armazenamento em nuvem.Estes cenários extremos são para design de chips e componentes do sistema. Os requisitos são bastante exigentes e, mais importante, eles dominam quando habilitar a orquestração dessas funções para prolongar a vida útil da bateria.
No caso das câmeras de vigilância domésticas, a câmera não precisa transmitir o vídeo na sala por 24 horas.É apenas razoável carregar a parte da imagem quando há uma pessoa não confirmada.Do mesmo modo, se a cena como a vaga permanecer inalterada. Não faz sentido ativar o algoritmo ML Organize com cuidado onde e quando esses recursos estão habilitados para que o dispositivo consumidor possa operar no modo esperado com apenas 2 pilhas AA e possa ser usado por um longo período de tempo.
Como o consumo de energia é um dos maiores obstáculos para que os IAs entrem em dispositivos terminais, muitas startups no mercado estão vendo agora a oportunidade de lançar um acelerador de rede neural de baixa potência (IP) para auxiliar o chip. Ao reduzir o consumo de energia, os desenvolvedores podem atingir o desempenho exigido pela inferência do algoritmo, que lançou oficialmente sua série NPU, um processador dedicado de inteligência artificial projetado para dispositivos terminais. Esta série inclui três produtos, a versão KDP 300 de versão ultrabaixa, versão padrão KDP 500 e a versão KDP 700 de alto desempenho, que atendem às necessidades de telefones inteligentes, residências inteligentes, segurança inteligente e uma variedade de dispositivos IoT. A gama completa de produtos tem baixo consumo de energia, tamanho pequeno e recursos poderosos de computação Diferente do consumo de energia do processador para inteligência artificial no mercado, o IP Kneron NPU consome 100 milliwatts. A classe (mW), para o KDP 300 dedicado ao reconhecimento facial para smartphones, consome menos de 5 miliwatts.
Shi Yalun, Gerente de Marketing e Aplicação da Endurance Products (à esquerda na Figura 3), destacou que a necessidade de realizar operações de inteligência artificial no dispositivo terminal, atendendo aos requisitos de consumo e desempenho, é essencial para fornecer soluções otimizadas para aplicações individuais. Atualmente, a aplicação da inteligência artificial pode ser dividida em duas grandes categorias: voz e vídeo, e a estrutura da rede neural utilizada é diferente.O foco das aplicações da fala é a análise da linguagem natural.A arquitetura de rede principal é a rede neural recorrente (RNN). A principal estrutura de rede usada para análise de imagens é a rede neural convolucional (CNN), a fim de otimizar as diferentes estruturas de rede, a solução fornecida pela capacidade é diferente.
Shen Mingfeng, gerente de design de software para intensidade de energia (Figura 3, à direita), acrescentou que embora a análise de linguagem natural tenha uma menor demanda por desempenho de computação de chip, devido ao tom da linguagem, há grandes diferenças nos hábitos de fala, portanto os conjuntos de dados necessários para o treinamento de modelo Muito mais do que o reconhecimento de vídeo, por outro lado, como os consumidores já estão acostumados a usar assistentes de voz baseados em nuvem, como o Apple Siri e o Google Assistant, os aplicativos de análise semântica off-line são preferidos pelos consumidores. A pré-condição é que devemos fornecer uma experiência de consumo semelhante sob recursos limitados de computação.Este é um desafio para fornecedores de chips e desenvolvedores de sistemas.
Figura 3 Aaron Alan (Esquerda), Gerente de Marketing e Aplicação da Endurance Products, acredita que o reconhecimento de voz e imagem são muito diferentes e precisam ser atendidos por diferentes soluções. ”Esquerda é Shen Mingfeng, gerente de design de software para desenvolvimento de software.
Na verdade, a grande maioria dos alto-falantes inteligentes ainda não são produtos de computação de borda.Maren Aaron apontou que se é Eco da Amazon, Homepod da Apple ou Baidu, alto-falantes inteligentes plataforma Alibaba, ainda tem que Os dados são enviados de volta para a nuvem para processamento e análise semântica, a fim de responder aos usuários.As operações de voz que podem ser executadas diretamente no produto final são principalmente baseadas em regras, em vez de compreensão semântica natural baseada em máquina.
Desde a introdução do NPU IP, o primeiro processador de inteligência artificial da empresa dedicado a dispositivos terminais, em 2016, a Nasdalem tem melhorado continuamente seu design e especificações, e otimizado para diferentes aplicações industriais. Entre os IPs atualmente disponíveis para os clientes, o KDP 500 foram adotados pelos clientes da fábrica do sistema e entrarão na produção de fita de produção (Mask Tape-out) no segundo trimestre.O reconhecimento de voz em cooperação com a Sogou também alcançou a análise semântica offline.Mesmo que o equipamento terminal não esteja conectado à rede, ele pode Consegue entender as instruções de voz do usuário.
Kneron NPU IP é dedicado processador de inteligência artificial para o dispositivo terminal foi projetado para que o dispositivo de terminal em um ambiente offline, você pode executar ResNet, YOLO outra rede de aprendizagem profunda. Kneron NPU é uma solução completa de hardware de ponta AI, incluindo hardware O IP, o compilador e a compactação de modelo podem suportar vários modelos de redes neurais principais, como Resnet-18, Resnet-34, Vgg16, GoogleNet e Lenet, além de oferecer suporte ao aprendizado profundo tradicional. Frames, incluindo Caffe, Keras e TensorFlow.
consumo de energia Kneron NPU IP é 100 nível mW, versão ultra-baixo consumo de energia da PDK 300 ou mesmo menos do que 5 mW, a gama completa de produtos no desempenho por watt 1,5 TOPS / p ou mais, o uso de um número de tecnologia exclusiva, que pode Atender às necessidades de fornecedores de chips, fornecedores de sistemas para baixo consumo de energia, alto poder de computação.
Elementos básicos de bloqueio Os aceleradores de hardware não têm medo de iteração técnica
Cura (Hardwired) circuito para melhorar a eficiência de certas tarefas de computação, reduzindo o consumo de energia, design de chips para as idades, mas à custa de flexibilidade de aplicação inferior, mudança significativa no caso de demanda do mercado para funções de chips Ou o algoritmo de software muda drasticamente, os projetistas de chips precisam desenvolver novos chips.
No caso da demanda para a função de chips tem sido basicamente resolvido, e este projeto não é um problema, mas nas tecnologias emergentes de técnicas iterativos rápidos, tomar esta abordagem de design, haverá uma relativamente grande risco no negócio inteligência artificial é muito rápido iteração qualificados, quase todos os anos um novo algoritmo com o modelo disponível. firma de pesquisa Abrir AI também apontou que nos últimos seis anos, modelo de formação AI para calcular a demanda de energia vai aumentar a cada 3,43 por mês Vezes.
A este respeito, Shen Ming Feng apontou, não é necessariamente um acelerador de hardware não é elástica. Resistente aos produtos energéticos, por exemplo, no projeto arquitetônico, a empresa utiliza divisão do kernel de convolução (Filter decomposição) tecnologia, o grande núcleo de convolução de convolução calcular uma pluralidade de pequenos blocos divididos em blocos de um cálculo de convolução separado, aceleração, em seguida, combinado de hardware reconfigurável convolução (convolução reconfigurável acelerando) técnica, o resultado da operação de convolução da operação de uma pluralidade de pequenos blocos são fundidos para acelerar o global Eficiência operacional.
Parábolas mais fáceis de entender, como peças de Lego podem ser combinados em uma variedade de padrões para construir um objeto, mas o objeto em si é ainda uma pilha inteira de uma caixa básica poucos. Programa de energia resistência é indispensável para algoritmos de IA Os elementos básicos são acelerados para melhorar o desempenho da execução de todo o algoritmo, portanto, mesmo que o algoritmo do AI seja atualizado em uma velocidade muito alta, a solução baseada no desempenho ainda pode exercer um efeito de aceleração.
Em adição ao acelerador em si é concebido para os elementos de base, em vez de um algoritmo específico para acelerar a resistência externa global, também pode proporcionar técnicas de aceleração e aplicações de AI ou implantado, tal como o seu modelo de compressão modelo (modelo de compressão) a tecnologia de compressão colocar unoptimized o número de vezes; tecnologia de armazenamento de memória hierárquica (multi-level cache) pode reduzir a carga da CPU e reduzir a quantidade de transmissão de dados, para aumentar ainda mais a eficiência operacional global Além disso, Kneron NPU IP podem ser combinados software de reconhecimento de imagem Kneron, fornece uma análise de identificação em tempo real, e rápido. A resposta não é apenas mais estável, mas também atende aos requisitos de segurança e privacidade Como o hardware e o software podem ser totalmente integrados, a solução geral é menor e o consumo de energia é menor para ajudar no rápido desenvolvimento dos produtos.
Reconhecimento de imagem AI é mais urgente em direção à borda
No geral, a demanda do mercado atual para reconhecimento de imagem é a análise semântica mais urgente, off-line, embora existam orador inteligente este enormes potenciais aplicações do mercado, mas esta aposta, mas menos recursos do setor. A principal razão para esse fenômeno é que a imagem A transmissão ocupará uma grande quantidade de largura de banda, o que, por sua vez, aumenta o custo total de propriedade do sistema. A voz não tem esse problema.
Gerente Andes Tecnologia geral Lin Zhiming (Fig. 4) descrito no Inteligência Artificial e o processo de ligação coisas, irá conduzir a tecnologia bordas borda computação tecnologia de computação demanda introduzida irá ser aplicada a uma variedade de aplicações emergentes, em Entre essas tendências, a flexibilidade e a velocidade são as maiores vantagens para os fabricantes taiwaneses.Para a maioria das empresas taiwanesas e empresas de design de circuitos integrados, é mais fácil cortar do mercado o mercado de inteligência artificial.
Figura 4: Zhixin Lin, gerente geral da Jingxin Technology, estima que o IP Cam será uma das principais aplicações para realizar a inferência da IA em dispositivos de borda.
Ao mesmo tempo, devido à tecnologia de computação borda de importação, mas também irá trazer para melhorar a memória, transmissão e assim por diante os requisitos de hardware, será significativamente empurrado para cima os custos de fabricação. Devido à correlação imagem system-on-chip (SoC) originalmente em comparação com outras aplicações mais complexas, por A tolerância de custo também é grande, portanto, espera-se que a tecnologia de computação de borda seja a primeira a ser importada por aplicativos relacionados a imagem, como IP Cam.
aplicações de inteligência artificial pode ser dividido em duas seções discutem formação e reconhecimento. No processo de aprendizagem profunda da operação maciça, um curto período de tempo ainda serão tratadas por computação em nuvem. O operador borda é responsável pela tarefa, sugado informações coletadas fazer primeiro tratamento preliminar, após o qual filtrar informações irrelevantes, e depois fazer o upload dos dados para a nuvem para economizar em custos de transporte. por outro lado, um completo resultados da aprendizagem profundidade nuvem, é possível identificar a função do terminal mais inteligente. para IP Cam Por exemplo, o trabalho de aprendizado profundo da imagem pode ser concluído primeiro pela computação em nuvem.Depois que o aluno em espera reconhece o pedestre, a Câmera IP na borda só pode executar o trabalho de identificação.
Por outro lado, como o IP Cam é amplamente utilizado na manutenção de segurança e segurança da comunidade, o governo e as empresas estão relativamente dispostos a apoiar o investimento, o que também será motivo para o rápido desenvolvimento do IP Cam.
Lin Zhiming ação, muitos fabricantes estão tateando como importar chip de inteligência artificial em seu próprio sistema. A situação atual é semelhante a quando as coisas começaram a florescer, ainda estamos explorando como aplicar os cortes, estimada em cerca de 2.020 fabricantes Vai lançar mais produtos reais.
Aplicativos em tempo real devem usar arquitetura de computação de ponta
A inteligência artificial é um tema quente nos dias de hoje, que gradualmente transferida da arquitetura de computação em nuvem para a arquitetura de computação de ponta, não trará impacto pequeno sobre os fabricantes da cadeia de suprimentos. Apesar do curto período de tempo vai continuar a desenvolver artificial computação em nuvem baseada em inteligência, No entanto, muitas funções de inteligência artificial relacionadas a aplicativos de visão começarão a importar bordas.
Diretor Xilinx Desenvolvimento (Xilinx) inteligência visual mercado estratégia Dale K. Hitt (Figura 5) apontou que, no futuro previsível, componentes de formação desenvolvimento de IA pode ainda dominado pela computação em nuvem. No entanto, a inferência / Implantar componentes já começou Use operações de borda para suportar aplicativos que exigem baixa latência e eficiência de rede.
Figura 5 Dale K. Hitt, diretor de desenvolvimento de mercado da estratégia de inteligência visual da Xilinx, acredita que, para aplicativos que exigem latência muito baixa, as operações de borda serão a melhor solução.
Para borda elemento operando para aplicações de visão de máquina relacionados com a aprendizagem, será uma das tendências crítico e de longo alcance. E, na visão de máquina industrial, cidades inteligentes, análise visual e mercado auto-drive tem uma forte crescimento potencial. em termos de aplicações de visão e industriais de consumo, devido aos algoritmos de aprendizado de máquina borda aritméticas a ser executado, portanto, para o desempenho requisitos também são mais elevados do que as gerações anteriores muitos programas. além disso, máquina de borda aprender algoritmo / função também tem sido rápida evolução e, portanto, todas as esferas da vida Necessita de hardware auto-adaptável para otimizar as futuras arquiteturas de inferência de aprendizado de máquina.
Por trás de cada sensor no carro, há um suporte de algoritmo preciso que é responsável por produzir os resultados da interpretação sensorial a partir dos dados do sensor.A última tendência é usar algoritmos de aprendizagem profunda para gerar esses resultados de interpretação perceptiva. Algoritmos de aprendizado profundo devem ser treinados através de um grande número de situações potenciais para aprender a ler todos os dados possíveis do sensor.
Após o treinamento, os algoritmos de aprendizagem profunda exigem eficiência computacional extremamente alta e latência ultra baixa para controlar o veículo com segurança.Para veículos elétricos, o consumo de energia baixo deve ser aplicado para limitar a temperatura de operação e estender a energia da bateria. O objetivo é fornecer soluções adaptáveis de alta eficiência e baixo consumo de energia para atender às diversas necessidades da IA auto-direcionada.
No desenvolvimento da computação de borda, o maior desafio é que a demanda do mercado muda muito rapidamente, por isso, tecnologias que podem se adaptar rapidamente a várias mudanças são extremamente importantes para permitir que as empresas mantenham sua competitividade.
Hitt explicou ainda que os algoritmos de aprendizagem profunda estão avançando continuamente em ritmo acelerado, e muitas das principais soluções de 2017 enfrentam o destino da eliminação.Mesmo com a capacidade de superar muitas outras atualmente, conforme as necessidades de computação continuam aumentando, o hardware ainda precisa O hardware deve ser atualizado em um ritmo mais rápido para evitar ser eliminado Alguns hardwares podem precisar ser atualizados durante a produção Muitas tecnologias alternativas também precisam ser recuperadas para atualizar o chip.
Hitt acrescentou que as vantagens exclusivas dos FPGAs incluem otimização profunda de hardware, incluindo operações, arquitetura de memória e links.Em comparação com CPUs e GPUs, eles podem alcançar maior desempenho com menor consumo de energia após a otimização. A arquitetura de hardware não pode ser rapidamente otimizada para novos requisitos derivados.
Operação de borda é esmagadora
aplicações AI contar com as operações de dados em nuvem centro, embora haja muito alto suporte poder de computação, é geralmente maior do que a borda da correcção do dispositivo de identificação de acordo com o modelo simplificado de raciocínio, mas depois de tomar em conta as preocupações de privacidade, a resposta em tempo real on-line e os custos e outros fatores inferências diretas sobre a borda do dispositivo, ainda é opção muito atraente. por outro lado, a dados em nuvem tamanho do mercado central grande do que o dispositivo terminal, há um forte incentivo económico. este é também o último ano AIoT gritando slogans choque preço tocou, as principais razões para a indústria de semicondutores para ativamente layout.
Olhando para o futuro, os aplicativos de IA que são suportados pela nuvem ainda existem no mercado, mas a proporção é obrigado a reduzir ano a ano, ele será substituído por uma nova arquitetura e borda computação em nuvem híbrida. Aplicações dos desenvolvedores de IA, a nuvem não pode ser substituído valor reside no modelo do trem, ao invés de executar inferência. também por esta razão, os desenvolvedores de aplicações, provedores de soluções pode conseguir uma integração perfeita entre a "nuvem" e "fim" será desenvolvedores de aplicativos na avaliação do fornecedor, a consideração mais importante.