Trilogia de história evolutiva de voz inteligente artificial

Sobre o nascimento da inteligência artificial não há argumento uniforme, alguns estudiosos em 1950, "o pai da inteligência artificial" Mavin Minsky construiu o primeiro computador de rede neural do mundo como ponto de partida e início do ano atual, a interação de voz, a experiência geral Três estágios de evolução e avanço Vamos rever todo o processo em conjunto e dar uma olhada em vários avanços tecnológicos no discurso de inteligência artificial.

Artificial Intelligence Voice 1.0: uma pergunta e uma resposta

Hoje em dia, a tecnologia de fala de inteligência artificial é amplamente utilizada no campo da fabricação digital, eletrônica e industrial e tornou-se um tópico popular para todos, mas ainda tem muitos lugares imaturos quando foi desenvolvido. Existem muitas discussões sobre a era AI, No mesmo nível, a aplicação de voz artificial que realmente entrou na fase de teste do usuário é provavelmente cerca de 2010. A tecnologia de voz de inteligência artificial dessa fase formou o estado de percepção principalmente com base na interação de voz, e a chamaremos de primeira fase.

Neste momento, o aplicativo de voz de inteligência artificial realiza o reconhecimento natural de fala e a compreensão semântica no nível técnico através da evolução do algoritmo e a entrada de uma grande quantidade de dados, e executa correspondência de dados no conteúdo conversacional e, em seguida, recupera tópicos relevantes para obter uma pergunta unidirecional de conteúdo simples Resposta: A primeira fase da auto-aprendizagem, a lógica, há uma grande falta de impulso, não pode ser o mesmo diálogo sobre o conteúdo da interação aprofundada, o desenvolvimento horizontal eo desenvolvimento vertical não podem atender às necessidades dos usuários. Por exemplo, como você pergunta o clima atual? Então, você pergunta o que é o clima como amanhã? Ele pede a previsão do tempo de amanhã. O tempo de hoje e o tempo de amanhã são apenas respostas independentes, não podem ser conectados para formar uma lógica.

Quanto à pesquisa de tecnologia de fala de inteligência artificial, as empresas estrangeiras estão investindo mais cedo e se desenvolvendo de forma mais abrangente. Como a Nuance, eles se apresentaram bem no reconhecimento de fala e são, de longe, a maior empresa de tecnologia de fala do mundo com o número de patentes e quotas de mercado longe Leading.After that, incluindo Amazon, Apple e Google, estão cavando voz inteligente, lançou seu próprio assistente de voz. De acordo com estatísticas incompletas, a empresa global de inteligência de inteligência artificial atual tem milhares, como uma estrela cada vez mais crescente, envolvendo Como a Cortical.io, com sede em Viena, na Áustria, que oferece principalmente novas soluções de compreensão de linguagem natural (NLU). A empresa KITT.AI é financiada pelo Instituto Allen para Inteligência Artificial e a Fundação Amazon Alexa para desenvolver Detetor de hotword personalizado e mecanismo de bate-papo ChatFlow. O MindMeld de San Francisco oferece plataformas de AI interativas e muito mais.

Inteligência Artificial Voz 2.0: Perguntas e Respostas

Já em 2000, Bill Gates propôs uma vez que "os próximos 10 anos são a era da voz". Estamos falando de voz inteligente hoje em dia, e a comunidade acadêmica o chama de "processamento de linguagem natural" (da Baidu). A indústria acredita que a tecnologia de voz inteligente Se tornará um dos principais modos de interação homem-computador, e o desenvolvimento de tecnologia informática e inteligência artificial trará esperança para o desenvolvimento da interação de voz inteligente.

Os estágios mais profundos da interação de voz da inteligência artificial - diálogos, são perguntas e respostas que contêm lógica contextual. Por exemplo, pode ser melhor entender que, se um curso não foi aberto no ano anterior, quantos estudantes não participaram deste curso no ano passado? Através de tal pergunta, a máquina deve responder "Não passou" ou "Não abriu este curso no ano passado?" Ao mesmo tempo, a máquina também precisa armazenar antecipadamente a mensagem "não abriu este curso no ano passado", acho que não entendemos quando éramos jovens Agora, conheça o conhecimento e a informação, que é uma quantidade inimaginável de dados. Por exemplo, "Eu quero ouvir a música de Jay", a máquina só mostrará as músicas de Jay Chou e não pode ser tocada diretamente. As coisas precisam dar à máquina uma ordem clara, caso contrário, isso irá tornar as pessoas muito chateadas, porque você tem que continuar dizendo.

Claro, no nível "diálogo", ele ainda permanece no estágio do "diálogo homem-máquina". A máquina ainda permanece na fase de aceitar grandes quantidades de entrada de dados por humanos. Comparado com o nível de perguntas e respostas, o fluxo de informações e dados é maior e a máquina ainda não pode Uma compreensão mais profunda do significado humano, incapaz de alcançar auto-aprendizagem, auto-crescimento, comunicação de voz com a máquina não pode ser tão natural quanto as pessoas.

Inteligência Artificial Voz 3.0: Interação Natural

Inteligência artificial na terceira etapa, o maior progresso é o progresso da interação. Não só tem perguntas e respostas, não só contém a lógica do contexto, hardware de inteligência artificial para uma maior integração de várias informações ambientais, para tomar diferentes decisões ou recomendações. Disse que no processo interativo, a máquina tem mais iniciativa, para fornecer mais e melhor ajuda para tornar a vida das pessoas mais conveniente, mais segura e mais interessante.

Existem dois cenários típicos, um é um carro inteligente, um é uma casa inteligente.

Em 2010, o projeto de veículo não tripulado da pesquisa secreta do Google foi a exposição do repórter "New York Times", não causou nenhum choque pequeno. Carro de carro ou carro sem motor, também conhecido como carros inteligentes, principalmente através do sistema de detecção do veículo para detectar a estrada Ambiente, e confiar no sistema de inteligência artificial do carro planejando automaticamente as direções de direção para alcançar o destino pretendido.

Ao dirigir na estrada aberta, o carro sem motor da Google reconhecerá e analisará a informação sobre o meio ambiente de veículos, pedestres e pavimentos, e servirá de base para o julgamento de decisão do sistema. Após a aprendizagem a longo prazo, a inteligência artificial tem o nervo O yuan se tornará mais proficiente e eficiente, e formará uma "sensação" semelhante às pessoas, capaz de lidar com situações inesperadas na condução.

Em janeiro de 2016, a US National Highway Traffic Safety Administration (NHTSA) publicou uma carta aberta em seu site afirmando que o sistema de inteligência artificial usado pelos carros sem motorista da Google poderia ser considerado "motorista" de acordo com a lei federal atual. Isso é visto como um marco no desenvolvimento da inteligência artificial, e também marca que a "inteligência" pode sentir, julgar, argumentar e tomar decisões como "humanas", permitindo controle ativo e melhor interação e sinergia entre humanos e computadores.

No campo da casa inteligente, a direção do desenvolvimento da inteligência artificial também é interação homem-computador, operação simples, grandes dados podem fazer tomadas de decisão independentes. Hong Hong recentemente introduziu a nova inteligência artificial TV Q5K, a principal compreensão semântica e a pesquisa difusa. Com instruções claras, as televisões de AI podem reconhecer e entender a semântica do usuário, como quando o usuário diz "muito escuro", a TV entende o que isso significa e sabe o que fazer, em vez de esperar para que o usuário diga ' Outro exemplo é o recente sucesso de uma série de TV "naquele ano, lua em flor", muitos nomes muito longos para lembrar, mas enquanto você diz 'Eu quero ver a lua em flor', Changhong AI TV também Pode achar este filme. Se mesmo essas palavras não conseguem lembrar, dizendo: "Quero ver a série de TV de Chen", também recomendará o filme com base nos dados de vídeo bem sucedidos. Mesmo quando se trata de "eu acho Olhe para a série de TV do marido de Chen Yan Xi ', esta TV pode entender, você disse que o sucesso de 80% é isso, estrelado por Chen Xiao, atingiu recentemente "naquele ano lua em flor" e jogou para você.

Isso equivale a ter a máquina realmente tendo "cérebros" para que ele possa sentir, interagir, entender e tomar decisões e, assim, melhor servir a humanidade.

A informação mais legal da tecnologia de novos meios de comunicação
Sweep ganhou o prêmio
Comente
* As declarações do usuário não são a posição do site, o site não é recomendado nenhum comentário na loja online, revendedor, tenha cuidado em ser enganado!
2016 GoodChinaBrand | ICP: 12011751 | China Exports