Se você quiser resumir o status quo dos empreendimentos de IA nos últimos dois anos, o financiamento e a construção do núcleo são tópicos inseparáveis, e é muito provável que o chip de palavras seja selecionado para a palavra-chave anual de 2018.
O calor que começou no ano passado, sob a catálise do incidente da ZTE, tem uma reação química mais rápida, entre as quais a mais intrigante é a rápida ascensão dos chips de voz da AI:
De maio a julho, em apenas dois meses, a partir dos dados divulgados publicamente, mais de cinco empresas anunciaram que fabricaram chips de voz AI:
Então, por que vocês todos concordam em liberar o chip de voz da IA neste momento, qual é a lógica por trás disso?
Fusível: uma pequena explosão no mercado de alto-falante inteligente
618 promoção deste ano, Tmall Elf jogou uma guerra de marketing de preços, só precisa de 99 yuans para comprar um alto-falante inteligente.Em breve, em 5 de julho, o Tmall Elf anunciou um ano, a sua As vendas totais do canal totalizaram mais de 5 milhões de unidades.
O comportamento desse gigante para reduzir o preço do preço rapidamente causou uma reação em cadeia, a discussão sobre a saída do alto-falante inteligente foi muito desenfreada, a rajada trazida pela Amazon finalmente chegou ao mercado doméstico.
De acordo com o último relatório de pesquisa divulgado pela Strategy Analytics, no primeiro trimestre de 2018, as vendas totais de alto-falantes inteligentes globais atingiram 9,2 milhões, um aumento de 278%.
"Quando a quantidade de equipamento acabou de se levantar, todos de repente perceberam que o chip é uma parte muito importante, colocar sua necessidade em uma posição mais alta." Como o primeiro começo a colocar o chip de voz AI, Yunzhisheng, sua fundação Ren Huang Wei falou sobre o recente calor nas fichas.
Esta rodada de explosão do mercado de alto-falante inteligente, que muitas pessoas vêem as oportunidades de mercado potenciais de chip de voz AI.
De acordo com o relatório de informações da imprensa estrangeira em março deste ano, a Amazon está projetando um chip AI personalizado para suportar o alto-falante inteligente Echo.Na época, foi relatado que a Amazon tinha 449 funcionários com conhecimentos e habilidades de chips.
Coincidentemente, a Zhongtianwei, que acaba de ser adquirida pela Ali, também anunciou que lançaria um chip de voz inteligente no início de julho.
A ação potencial do gigante é um dos mais importantes vane de mercado, e este fusível naturalmente queimou o chip de voz AI, explorando a lógica por trás dele, e também a vantagem do chip de voz AI comparado ao chip tradicional de uso geral.
De fato, os primeiros chips de uso geral desempenham um pequeno papel na voz, geralmente combinando o processamento do módulo de codificador digital multimídia + sinal digital.
No final de 2014, quando eco da Amazon chegou, alguns fabricantes de semicondutores dirigidos a este mercado, lançou um chip de voz, o mais típico do que MediaTek. Entende-se que, nesse momento especulou-se que a 2016 mercado orador inteligente, quase 80% do chip MTK são fornecidos, o que por sua vez benefício a partir da profundidade da cooperação e da Amazon eco de los.
Quando os requisitos de hardware para a interação de voz inteligente de mais e mais, muito para alcançar no final, tais como wake-up, processamento de sinal digital, enquanto considerações de segurança, tais como as condições da rede, chip de voz AI parece que é o resultado inevitável.
chip de comparação de voz, o chip de voz AI é altamente integrado, de baixa potência, baixo custo, para conseguir a combinação perfeita de algoritmo e um terminal.
Quando o co-fundador da Rokid, Wang Yude, respondeu por que fabricaria um chip de voz AI, ele mencionou "porque sabemos da dor de fabricar produtos, sabendo que o preço do chip vai impulsionar todo o produto". Depois de experimentar esses pontos problemáticos, queremos otimizar o design do chip e usar nosso algoritmo front-end.
Algoritmo-Chip-Hardware: A Necessidade da Comercialização
Cuidadosamente resolva as idéias de vários grandes empreendimentos de IA para fazer chips de voz de IA, a maioria deles escolhe cooperar com empresas de chips experientes.
Por exemplo, para sair e pedir Rokid anunciou seu chip é baseado em Hangzhou Guoxin Ciência Chip profundidade de personalização, que Rokid o país de fabrico KAMINO18 GX8010 núcleo baseado em processo de 40nm, GX8010 é a principal interação AI Guoxin liberado última ficha NPU ano, o chip projetado para design de aplicações Internet, baixo consumo de energia, fora de linha, a vantagem móvel. pensar Spitzer anunciou no momento de construir o chip, e também mencionou que eles vão chegar a um determinado chip de cooperação gigante no chip de AI, a empresa de joint venture.
empresas de chips para proporcionar baixo consumo de energia, baixa integração da arquitectura design, AI empresa de tecnologia de voz será na interação de processamento de sinal array de microfones, redução de ruído e voz SDK discurso, acordar, fazer reconhecer o esforço de compreensão, própria tecnologia interativa voz da AI Integrado a ele.
Por que a tecnologia de algoritmo de pouso, a partir do chip e do hardware subsequente, a razão é inseparável do ambiente de hardware e software da China.
Xu Zhijun, CEO rotativo da Huawei, mencionou na Soft Expo de 2018: "Os clientes domésticos, especialmente, não aceitam cobranças de software, o que torna as empresas de produtos de software domésticos incapazes de formar um modelo de negócio".
O modelo de vendas de software que todos aceitam é um modelo semelhante a hardware: domesticamente, o hardware é considerado valioso, o software não vale muito e seu custo é baixo.
Portanto, a fim de alcançar o rápido crescimento dos negócios e negócios na China, o surto de escala, apenas algoritmos, software é muito difícil.As mais recentes tecnologias, soluções, incluindo produtos através de portadores de hardware são mais propensos a alcançar o crescimento em larga escala e replicação. .
Portanto, o algoritmo de AI integrada no chip de voz do dispositivo, pode ser um esforço agradável e cooperação, e chip de voz AI, juntamente com uma variedade de hardware inteligente Trending é uma coisa natural.
Além disso, excluindo estes fatores técnicos, contar uma boa história do chip, mas também ajudar as empresas a obter financiamento AI, ter mais capital para mostrar sua força especialmente no momento atual do nó: não só a força da tecnologia do chip do desempenho, mas também os sentimentos nacionais de Corpo simbólico.
Em tal contexto de fatores favoráveis, AI chip de voz para o aumento do surto, espera-se.
Naturalmente, não é de excluir que ainda existam alguns seguidores que querem fazer um "líquido vermelho" no mercado impetuoso. O calor do chip de voz AI não é o sabão. A escala da indústria não é apenas a força técnica. , existem capacidades de pouso comercial e tolerância ao risco.
O fogo virtual ainda está quente?
Além do efeito borboleta do alto-falante inteligente e da causa do calor do chip, se você entender o chip de voz da AI da demanda e do setor, terá que começar a partir de um cenário de aplicação mais amplo e de um pouso comercial.
Microelectronics, Universidade de Tsinghua, Wei Shaojun em uma entrevista à imprensa, ele disse, AI assassino aplicação, portanto, foi orador inteligente ou outros produtos, não apenas tornar-se uma necessidade, portanto, apenas a voz verdadeiramente interação humano-computador O mainstream, a fim de promover o surto de chips de voz AI.
Assim, apesar do chip AI elevado calor, mas o atendente irá pedir a voz da razão para as necessidades reais dos de Onde a tecnologia de voz no mercado?
alto-falantes inteligentes, por exemplo, na ausência de casa antes da formação das coisas, um monte de gente acha que é mais como uma decoração de mau gosto de hardware. Na tecnologia atual ainda não alcançou a situação ideal, pode-se dizer o consumidor final do mercado para a interação de voz e reconhecimento de Só precisa ser descoberto ainda.
Para este fim, compilamos os produtos e soluções de várias das principais empresas de tecnologia de voz da AI:
Olhando para os gigantes da tecnologia estrangeira, eles estão seguindo um caminho semelhante em desenvolvimento, usando hardware ou plataformas abertas de aplicativos por meio de investimento ou aquisição.
Como pode ser visto a partir da tabela acima, neste momento, se é como Espírito, Yunzhisheng, sair para perguntar, empreendimentos de IA como Rokid, ou gigantes como Google, Amazon, Apple, eles têm no patamar da cena de aplicação. Muitas cruzes, em sua maioria voltadas para a Internet das Coisas, centradas em casas inteligentes, carros e robôs.A casa inteligente, fora do campo de batalha principal da Internet das Coisas, como atendimento médico inteligente, também é a nova fronteira que essas empresas de IA estão expandindo.
Ao mesmo tempo, de acordo com o relatório da Analysys, o mercado de voz inteligente está em um período de desenvolvimento de alta velocidade, e os campos verticais baseados em interação de voz, como carro inteligente, casa inteligente e wearable inteligente, amadurecerão.
Nesses cenários, a tecnologia de fala de inteligência artificial não é uma tecnologia muito essencial e indispensável, mas seguindo a trajetória de desenvolvimento de atualização de consumo e interação de tecnologia, o reconhecimento de voz e tecnologia interativa levada pelo chip de voz AI é definitivamente a tendência dos tempos.
Com base nesse planejamento de caminhos de desenvolvimento e na previsão de um enorme mercado consumidor, o chip de voz da AI também é um dado adquirido.
Como um corpo humano é composto de múltiplos órgãos composta de muitos cenários de aplicação inteligentes, mais chip de voz AI reflete o papel dominante da tecnologia de algoritmos, o chip como um 'hardware' para ir junto com suas próprias soluções de software, Finalmente, para completar o ciclo fechado ecológico.
A chave para os espinhos: tecnologia + dados
AI fazer chip de voz é um projecto de investimento enorme, co-fundador Rokid Wang Shunde disse, 'chip ponto mais importante é a quantidade de lucro é o chip tecla no cinco milhões ou mais.'
Então, se as empresas querem ter a capacidade de auto-sangue, o maior gargalo em face do que é isso? '
Wang Haode apresentou dois pontos: dados e interação, entre os quais a interação refere-se a 'agora a tecnologia de voz que os ideais industriais do usuário branco geral não atingiram', o que também significa que a tecnologia de voz ainda está em estágio inicial.
Tomando os dados como exemplo, um dos desempenhos competitivos da IA é o de dados.Como alcançar um refluxo profundo na indústria é um problema que as empresas de tecnologia de voz da AI precisam resolver.Porque somente após o refluxo de dados profundo ser implementado, o algoritmo será implementado na indústria. Produtos mais precisos e mais competitivos.
Mas, além dos algoritmos centrais e da capacidade de computação, toda a inteligência artificial também é muito importante: a tecnologia, o programa, o produto deve poder ser promovido nos principais cenários de aplicativos e, finalmente, trazer à empresa uma receita realista.
De fato, além de soluções integradas, e da profundidade da cena é a futura integração do teste real. O Ano do co-fundador espaço representação Yang Yuxin, 'AI empresa de chips somente se, não há nenhuma cena algoritmo e, em seguida, irá imediatamente encontrar Problemas do ecossistema Agora, com algoritmos e chips, a questão-chave é como detalhar a cena para criar uma excelente experiência de interação por voz.
Além da tecnologia, Gao Shixing, da Si Bi Chi, também enfatizou a importância do pouso da indústria. "A tecnologia e a indústria devem formar um ciclo, e precisamos entender o período da janela. Se a oportunidade terminar, não haverá mais."
Na janela da indústria tradicional da IA, uma vez que uma empresa de AI forte o bastante entra em uma indústria, ela pode confiar em dados e acumular experiência na indústria para construir suas próprias barreiras.
Esta é também a competitividade das empresas de IA na era do big data da Internet: Tecnologia + Dados.
Fora da zona de conforto, de frente para o mercado real
'Começando muitas equipes querem fazer o que fazem melhor, o melhor que podem fazer é melhor, a equipe é mais confortável, você vai do algoritmo para o chip ou hardware, você tem que romper e sair da sua zona de conforto, isso pode ser Precisa de um desafio para o ego.
Por exemplo, o chip AI apenas fortalece a capacidade de aprendizagem profunda, o acesso ao sensor, o processamento de sinais, a detecção e a identificação, e a tomada de decisões e feedback no nível do software Os algoritmos e características computacionais necessários para cada link também são diferentes.
De algoritmos a chips, hardware, para muitas start-ups, pode ser um grande salto, e é por isso que algumas empresas de AI optarão por cooperar com a empresa de chips, pois para escapar da zona de conforto, você precisa colocar mais energia nela. , lambeu mais poços.
Em seguida, o status quo do mercado, é inegável Lynx espírito vendendo bem, mas Ali está por trás dos enormes fundos de fazer apoio, mas sem dúvida este estado não vai durar muito tempo, depois de remover a maior parte deste ecossistema, teve que enfrentar uma série de custos de hardware Para o custo real, volte a um estágio normal.
Assim, o desembarque em chip de voz AI, mais pessoas também olhar destinado a toda a Internet das Coisas, som conhecido nuvem Michael menciona na entrevista, 'parecem mais inteligente do que o orador se hoje, na verdade, é o gigante desesperadamente subsídios, mas que não é o comportamento real do mercado. '
Ele mencionou que outro som voz conhecida nuvem inteligente para fazer a cena, embora não tão orador inteligente, mas o contraste vertical, ainda tem um crescimento substancial.
De fato, se os milhões de colunas inteligentes, milhões de voz inteligente da ordem de mercado, apenas uma gota no oceano. Ao pensar ponto Shixing alta de Spitzer de vista, a quantidade de orador inteligente não pode ser considerado 'materiais explosivos',' China e nós população do mundo, cada pessoa cada família tem vários hardware inteligente, além de alguns cenários indústrias, o terminal final das coisas hardware inteligente será muito mais do que smartphones.