Fundada seis anos de som conhecido em nuvem, a partir do campo de força de chips AI.
Primeiro lançou sua primeira geração de 'Swift' AI série chip de UniOne, em seguida, liberado 600 milhões de yuan C + rodada de financiamento, recentemente, conhecida nuvem co-fundador som e chip diretor técnico Li Xiao Han anunciou oficialmente a pilha completa de programa de interação de voz de código aberto.
Como uma empresa de inteligência artificial especializada no campo da voz, Yunzhisheng teve a ideia de construir chips já em 2015, e começou a formar uma equipe.Em 2016, Yunzhisheng anunciou oficialmente o desenvolvimento de chips, que foi lançado em maio deste ano.
Li Xiaohan também disse que uma grande proporção da nova rodada de financiamento de Yunzhisheng será colocada no chip.O programa de interação de voz de código aberto de chip é expandir o escopo de parceiros mais rapidamente.
Que tipo de efeito o código aberto traz para Yunzhisheng? ”A Pinway Business Review entrevistou Li Xiaohan, trazendo seus pensamentos sobre o campo dos chips de IA.
UniOne Series AI Chip
Li Xiaohan acredita que, devido às ferramentas EDA avançadas, ferramentas de simulação FPGA, ecossistema de negócios de IP maduro e muitas excelentes empresas de serviços de design, o processo de design de chip digital está se tornando cada vez mais maduro e muitos frameworks e algoritmos de design open source O limiar do chip é bastante reduzido, mas o limite para um bom desempenho ainda é muito alto.
Ao mesmo tempo, a compreensão do cenário de aplicação excederá a capacidade do design de circuito digital, que se tornará o fator decisivo para o sucesso do chip.O entendimento do cenário de aplicação, incluindo o entendimento da aplicação e a compreensão do negócio, também é óbvio entre os chips. Parte da diferença.
Na opinião de Li Hanhan, Yunzhisheng tem três elementos-chave em algoritmos, cenas e design de chips, por isso é o melhor chip AI no cenário IoT.
Swift o design acústico nuvem conhecido e desenvolvimento de independente, em geral contém a CPU, AI acelerador (Deepnet) e uma arquitetura de processador de sinal digital (UDSP), o uso de instrução independente AI, cenário de voz orientada AI, suporta / acesso ao microfone digital de seis analógico. Li Yuhan mencionou especificamente que o desempenho da rede neural profunda é 50 vezes maior que o do esquema geral.
Swift pertence ao chip de primeira geração da UniOne.Na conferência anterior de lançamento de chips, Yunzhisheng mencionou que a UniOne também lançará o chip de segunda geração 'Snow Leopard' e a terceira geração 'Sailfish' para carros inteligentes e cenas de cidades inteligentes. Upgrade
Do ponto de vista atual, Swift é dividido em duas opções na direção da casa inteligente, correspondendo a alto-falantes inteligentes e casa inteligente.
Fornecer aos clientes soluções de integração de nuvem e software + hardware é a maneira mais comum de cooperação com a Yunzhisheng. Anteriormente, os módulos de hardware inteligentes enviados em grandes quantidades no campo da eletricidade branca atendem a muitas grandes empresas dessa maneira. Tais como os Estados Unidos, Gree e assim por diante.
Após o lançamento do Swift, a solução fornecida pela Yunzhisheng é mais tridimensional, do chip à solução para formar uma solução completa para os clientes, e não limitada a condicionadores de ar, alto-falantes inteligentes e outros equipamentos.Todos os produtos de hardware domésticos inteligentes podem tentar acessar Tecnologia de inteligência artificial de Yunzhisheng.
Além disso, Yun Zhisheng ainda quer jogar de forma diferente.
Solução de interação de voz de pilha completa de código aberto
Na indústria de casas inteligentes, tanto os fabricantes quanto os fornecedores de marcas encontrarão várias dificuldades.
Por exemplo, se um fabricante deseja criar um produto de alto-falante inteligente, a primeira dificuldade encontrada é a escolha do fornecedor.
Porque envolve todos os aspectos da fala, redução de ruído, reconhecimento, síntese, etc, para não mencionar o design do alto-falante, ajuste de som ... Um alto-falante deve ser testado depois de um longo tempo para encontrar um número de fornecedores '攒' Produtos, se um fornecedor não alcançar os melhores resultados, a experiência do palestrante será bastante reduzida.
Como um alto-falante inteligente, isso significa que ele deve estar intimamente relacionado à IA Atualmente, a maioria das pessoas não tem muita experiência com produtos de IA, e há muitos eventos incertos no processo de desenvolvimento, que consomem muito tempo e trabalho.
“Espero que haja um fornecedor para fazer todas essas coisas.” Esta é a conclusão que Yunzhisheng tirou depois de investigar muitos parceiros.
Correspondentemente, devido ao complicado tipo de cliente e forma de produto, o provedor da solução não pode suportar muitos clientes ao mesmo tempo.Junzhisheng também pensa em uma nova solução: Código aberto.
"Muitos parceiros de fora dizem que somos especiais 'independentes'", disse Li Xiaohan. Yunzhisheng oferece uma solução única para muitos planejadores que esperam cooperar com eles. Eles sentem que Yunzhi não está disposta a brincar com todos. Mas Li Hanhan pensa " Independente 'é responsável pelos parceiros.
Como o pouso artificial para residências inteligentes envolve muitos elos, como a necessidade de acumular experiência estrutural que pode ser produzida em massa, por exemplo, por meio de mecanismos, seleção de plataformas de hardware e otimização do sistema, para atender aos requisitos gerais de energia dos fabricantes de eletrodomésticos; Uma seleção de chip universal que se adapta ao mecanismo de nuvem e atinge a configuração ideal em termos de preço e desempenho.
Eles precisam passar pela estreita cooperação diária entre as equipes, e às vezes até precisam fazer alterações no nível de código do mecanismo para determinados recursos de hardware, a fim de alcançar os melhores resultados.
Se você fornecer apenas um mecanismo para seu parceiro e, em seguida, fornecer alguma adaptação e suporte no nível do SDK, você será irresponsável com seus próprios parceiros, inclusive com sua própria equipe, pois todos têm recursos limitados. Valioso, a fábrica de motores não tem hardware suficiente, sistema e experiência do produto, não pode efetivamente apoiar os parceiros e, finalmente, todo mundo tem feito muita cooperação, pode ser apenas um animado, e não pode embarques de produção em massa.
Yunzhisheng irá implementar a experiência e os parâmetros acumulados na cena de aterrissagem real da IVM no projeto de seu próprio chip AI UniOne.Espera-se que através do chip, as partes principais da cena local serão curadas o máximo possível, e então o chip será A interação de voz full-stack no código aberto, reduzindo o limiar técnico, encurtando o tempo de mercado, garantindo assim a cooperação entre os parceiros e Yunzhisheng.
Li Xiao Han com soluções móveis MediaTek utilizados como comparação: à base de MediaTek programa completo MTK chips de telefone móvel, se não for modificada fora do conjunto de um caso de telefone celular pode ser enviado diretamente para modificar, em seguida, também só precisa de uma simples mudança 'tem a melhor experiência. altamente customizável e pode ser rapidamente enviados nossos três grandes vantagens ', disse ele.
Era de chip AI garante eficiência
A fonte aberta de 'solução Turnkey definitivamente promoverá o desenvolvimento de todos os produtos de hardware inteligente'. Quando se fala sobre isso, Li Xiaan está cheio de confiança, principalmente devido aos três aspectos seguintes:
Primeiro, o gerente de produto de hardware inteligente é muito escasso, especialmente o gerente de produto que entende o design da interação de voz.A interação de voz (VUI) é muito diferente da interface gráfica de interação (GUI) da tela anterior.O primeiro é uma estrutura plana, uma frase direta Qualquer interface gráfica do sistema pode realizar qualquer operação, esta última é uma estrutura de árvore e precisa ser clicada passo a passo.
Essas duas interações têm suas próprias vantagens, e atualmente a VUI tem poucos talentos no mercado e, por causa de sua estrutura plana, ela precisa ser considerada no nível geral do sistema ao projetar, em vez de simplesmente um único nível de aplicativo. , aumentou consideravelmente a dificuldade de design VUI.
"Se o design de interação do produto não é bom, o efeito de desenvolvimento do produto final pode ser imaginado." E como a equipe fundadora da Yunzhisheng, Li Xiaohan tem mais de 10 anos de experiência em pesquisa relacionada a interação humano-computador, a partir da interação de voz em telefones móveis da Motorola. Para carro Yunzhisheng para Gree ar condicionado, alto-falantes Fibonacci, equipe Yunzhisheng acumulou rica experiência em VUI design e desenvolvimento, o programa geral de interação de voz com UniOne como a solução Turnkey como um todo open source, tudo isso irá reduzir significativamente o limiar da indústria.
Segundo, o código aberto do esquema de interação de voz encurtará enormemente o ciclo de desenvolvimento Como uma função de nível de sistema, o esquema de interação de voz lidará com drivers de áudio, manipulará interações com outros aplicativos do sistema, tratará casos individuais e eventos de despertar e deverá ser robusto e estável. Com a nuvem sabe que a solução de código aberto está resolvida.
Os parceiros podem fazer apenas personalizações de baixo nível, como a alteração de palavras de despertar, também podem fazer um desenvolvimento de nível profundo, podem ser completamente reescritas no caso de entender a solução geral.
Terceiro, a equipe de implementação testada e comprovada de Yunzhisheng Na “era central”, essa equipe fornecerá suporte técnico para toda a solução de código aberto para parceiros dispostos a adotar o Yunzhisheng UniOne, incluindo treinamento de código, desenvolvimento de ferramentas etc. para fazer todo o possível. Reduza a inclinação da curva de aprendizado com a qual os parceiros estão familiarizados na abordagem geral de código aberto.
De acordo com Yunzhisheng, o programa Turnkey deverá ser oficialmente open source em 15 de setembro.
Ao falar sobre concorrência, Li Xiaohan também disse à análise do negócio de produtos que existem muitas plataformas abertas de voz, mas a maioria delas é voltada para as funções de serviço de nuvem.capacidades de nuvem não são muito úteis para os desenvolvedores.O caminho chave está no lado da borda. O relacionamento pertence ao upstream e downstream e não produzirá concorrência.
Este conjunto de soluções não é apenas para os parceiros que foram perdidos antes, mas também quer absorver empresas que não tiveram idéias semelhantes antes, que eles saibam quão baixo o limite para produtos para se tornar hardware inteligente.
O lançamento do chip AI também mudou o posicionamento de Yunzhisheng: Ele costumava ser um provedor de tecnologia, e agora se tornou um fornecedor de serviços de nuvem da AI, fornecedor de soluções de software e fabricante de chips.
Quanto ao futuro posicionamento de Yunzhisheng, ninguém pode prever. Li Xiaohan disse a revisão de negócios do produto, uma coisa é certa, Yunzhisheng não deve apenas focar o campo de voz, o campo de imagem vai certamente envolver. 'Equipamentos de inteligência artificial é deixar A máquina é mais como um ser humano, então você tem que fornecer uma variedade de percepções, e as imagens são uma parte essencial.
Li Xiaohan disse que no estágio de rápido desenvolvimento da Internet das Coisas, há muitas possibilidades para o desenvolvimento futuro.Embora aumentando o investimento em chips, a equipe de Yunzhisheng também procurará novas oportunidades de inovação, independentemente de voz ou imagem. Do ponto de vista da Internet das Coisas.
No momento, Yunzhisheng começou a planejar o futuro há alguns anos, e pode pagar por resultados ou riscos futuros. 'Enquanto você está determinado a seguir em frente, esta é a garantia de eficiência.' Na forma, a oportunidade é ferozmente evoluída. No processo, a eficiência é especialmente importante para Yunzhisheng.