De acordo com o co-fundador do mapa: padrão AI, a cena e o futuro

Eu sou Leo, co-fundador da ETO Technologies, Ph.D. em estatísticas da UCLA, eu sou pesquisador em inteligência artificial há 15 anos. Foi pesquisadora do Laboratório Prof. Yann LeCun, fundação de aprendizado profundo, vencedora do concurso PASCAL Image Target Detection em 2010, Instituto Nacional de Padrões e Tecnologia NIST e IARPA World Champion of Face Recognition, Agência Nacional de Inteligência de Projetos de Pesquisa Avançada.

Recentemente, um grande número de relatórios de pesquisa sobre inteligência artificial, investidores, empresários, estudiosos e tendências quentes na AI e o impacto em vários setores da sociedade, não faltam mal entendimentos da tecnologia AI e do desenvolvimento industrial, é fácil induzir em erro. Geralmente dividido em três áreas: AI é como grande coisa? Quem é o jogador de AI real? AI cena onde?

Do ponto de vista dual de pesquisadores e empresários, falarei sobre o meu ponto principal: os limites da AI, apenas a figura líder pode compreender e expandir com precisão: as principais empresas, por causa da visão de criar energia potencial, o futuro da AI, incomparável, sem história pode aprender, Não há autoridade para prever.

Curva "S" para ver o padrão AI

A minha história e a previsão do desenvolvimento de AI são modeladas usando a curva "S" mostrada acima (a função Sigmoid também é usada para caracterizar a função de ativação de neurônios em uma rede neural). O eixo horizontal representa o tempo e o eixo vertical representa a inteligência da máquina. Os pontos na curva representam o mais alto nível de inteligência do mundo em um determinado momento, começando com a nova era da AI (Deep Learning) a partir de 2013, com um nível de desenvolvimento de inteligência de máquina insignificante em relação ao desenvolvimento dos últimos cinco anos até 2013. A linha vermelha representa Pessimismo (incêndio de AI, bolha de IA, etc.), um período de rápido desenvolvimento ocorrerá após 2017, a linha azul representa otimismo e haverá um desenvolvimento rápido após 2017. Vale ressaltar que as curvas azul e vermelha têm a mesma compreensão da história da AI , Mas muitos no mercado ou relatório de pesquisa para ver outra curva, uma alta probabilidade de a pesquisa ver o nível AI está longe do nível mais alto de uma grande lacuna. Analizar as diferentes posições do padrão AI, você pode interpretar a curva S dos três aspectos :

1, o desenvolvimento do passado da IA e a previsão da extensão e da taxa de desenvolvimento futuro da AI

2, a relação entre o nível de desenvolvimento da AI e os cenários de negócios

3, a localização de cada jogador e a lacuna

Em termos específicos, comecemos com o desenvolvimento da AI nos últimos cinco anos. Tomando o reconhecimento facial como exemplo, a probabilidade de encontrar um rosto de indivíduos N é de 95%. O eixo vertical é uma escala reconhecível (o tamanho de N) .

A tecnologia não é convergência, mas ampliará o espaço para desbloquear a cena

O maior reconhecimento do reconhecimento do rosto em 2017 é de 2 bilhões de pessoas, o que é cerca de duzentos vezes mais do que o de 2016 e dezenas de milhares de vezes maior do que em 2015. No teste de reconhecimento facial mais autoritário do mundo (NIST 2017) ), Estamos 2% à frente da segunda equipe Vocord (Vocord é 10% acima de Tencent Merit em outro conjunto de testes), que é comumente conhecido como convergência de nível técnico, um ou dois altos O ponto percentual não faz sentido (é difícil perceber o valor da concorrência em dinheiro). Esse mal-entendido precisa ser interpretado a partir de dois aspectos:

Por um lado, o algoritmo pode aumentar rapidamente até 5% e 20% do líder em bilhões e bilhões de aulas, que é a lei geral da curva de desempenho do algoritmo. Além de identificar grandes diferenças de escala, difícil). Da experiência algorítmica, negros, fêmeas, crianças, grande idade, oclusão e assim por diante são mais difíceis de identificar grupos e categorias nessas subcategorias, a diferença de desempenho entre diferentes algoritmos Será maior.

A avaliação em grande escala é, por si só, uma proposta acadêmica simples e requer muito suporte de dados. Poucas pessoas podem realmente observar o desempenho em menos de 2 bilhões de dados. Por exemplo, é muito difícil para os Estados Unidos configurar 2 bilhões de conjuntos de testes. Não é a primeira fonte de mal-entendidos entrevistar alguns profissionais de reconhecimento facial.

Por outro lado, quando o algoritmo é aumentado e o tamanho reconhecível é aumentado, mais cenários de aplicativos comerciais serão desbloqueados e milhões e dezenas de milhões de domínios de identidade correspondem a cenários de autenticação, autenticação remota e desbloqueio de telefones celulares. O argumento pode ser configurado neste cenário, mas a detecção e detecção de bilhões de bilhões de delitos e contra a comparação rígida da demanda, nesses cenários, para não identificar mais do que alguns criminosos, mas para descobrir mais de dez vezes a diferença de probabilidade É quase uma questão de saber se um "aplicativo não crítico" é altamente enganador.

No último caso de segurança, a Wan Road e até mesmo 100 mil pesquisas de rastreamento de vídeo da câmera de estrada, os algoritmos de arquivamento têm requisitos muito elevados, assumindo que todo fluxo de pessoas, para o vídeo da Wan Road, desempenho de pesquisa equivalente ao algoritmo exigiu 10 bilhões , 100 bilhões na escala da taxa de reconhecimento. Esse desempenho que outros cenários requer uma mil vezes maior. Na base de diferentes algoritmos baseados no lado do produto, as diferenças de experiência foram amplificadas. Outra identidade étnica mundial é antiterrorista O reconhecimento de negócios de imigração dos requisitos de cobertura é muito alto.

Em resumo, algoritmo de taxa de reconhecimento de 99% e algoritmo de 99,99%, a diferença reside nos cenários de aplicativos desbloqueáveis. Esses novos cenários são desbloqueados, é a equipe de algoritmos pioneiros e pioneiro de campo vertical (como a equipe de inovação do sistema de segurança pública) Trabalhando juntos, nem é possível que os profissionais de segurança entrevistando estejam na vanguarda da mudança, outra fonte de mal-entendidos.

Três níveis de tecnologia VIE: Visão (visão), Insight (insight), Execução (execução)

O mais comum é testar o campeonato, o caso real, oferecer resultados PK, papéis, etc. Estes podem ser capazes de distinguir os 10 melhores, não é a equipe da AI, mas é difícil distinguir a melhor equipe. Minha desconstrução de tecnologia de três níveis: Visão, prospectiva ou paisagem estratégica, julgamentos sobre tendências tecnológicas, Insight, visão, a natureza do algoritmo e as leis da distribuição do mundo objetivo; Execução, implementação, algoritmos, aquisição de dados, plataforma de computação de engenharia. Para:

O algoritmo de Execução mais básico é o nível do algoritmo que pode ser alcançado rapidamente, especialmente depois que a estrutura geral é conhecida, incluindo o algoritmo básico, dados de cena, plataforma de experiência de computação, aplicação de produto, etc. Por exemplo, quanto tempo após o lançamento do AlphaGo, O reconhecimento de fala pode acompanhar os melhores resultados do mundo o mais rápido possível. A execução superior não é uma plataforma de algoritmo de fonte aberta que pode ser preenchida. A experiência em áreas específicas ajuda as equipes a aumentar rapidamente o nível de Execução em seu campo. A equipe chinesa deve ser de classe mundial Se o Google for o número 1 do mundo, a China não deve ser inferior ao Facebook, Microsoft, Apple, Amazon ou mesmo alguns aspectos, independentemente de ser xadrez, reconhecimento facial, reconhecimento de fala, etc. A maioria das pessoas Compare a tecnologia, basicamente neste nível, mas, mais importante, o mais poderoso é os dois níveis acima.

Passar mais uma vez a Insight é uma visão profunda da tecnologia, incluindo explicações matemáticas de modelos algorítmicos e insights sobre a distribuição do mundo objetivo Insight guias de como usar dados e calcular o poder (isto é, como usar algoritmos e até mesmo algoritmos inovadores). Este nível de decisão pode ser melhor do que o Google, ou pode manter o mesmo ritmo de desenvolvimento. Se você possui um quadro de algoritmo de aprendizado profundo, dados de massa no mesmo nível, mas temos uma enorme diferença entre o ajuste do desempenho do algoritmo. Reconhecer o reconhecimento, por exemplo, Utilizamos 200 milhões de imagens de rosto humano (um subconjunto de bilhões de imagens) treinados para alcançar 1 bilhão de parâmetros efetivos do modelo, usando hipóteses razoáveis a priori sobre os atributos do rosto humano, incluindo luz, idade, raça , Motion Blur, resolução de imagem, personalização do modelo, como os dados são montados e como a computação acelera. Existem diferenças significativas no ajuste do desempenho e na eficiência de aprendizagem do modelo (isto é, a Execução acima mencionada), e é por isso que existem algoritmos, cálculos, Os gigantes da Internet das condições dos dados não são necessariamente capazes de fazer os três melhores do mundo em uma única tarefa de AI.

Visão: Preveja a tendência de desenvolvimento, defina a direção do futuro, imagine o impacto na vida e na produção, o que requer uma compreensão profunda da tecnologia, mas também a inovação técnica, o valor técnico e comercial da imaginação, criatividade, Responda onde e a rapidez com que a AI está chegando.

Forte Execução, Insight é definitivamente bom, mas pode não ter visão, a visão mais forte, Insight certamente primeira classe, mas a Execução pode ser pobre. VIE equipe forte O mundo é extremamente escasso. Com a profundidade do campo de dois mestres Hinton Fale com o LeCun sobre os meus sentimentos em 2010. Até 2010, muitas pessoas na academia já estavam falando sobre a importância dos grandes dados para o aprendizado de máquina. A equipe da Hinton gastou milhões de dados de treinamento com base no algoritmo que LeCun inventou em 2012, Fez avanços de classe mundial na ImageNet, no mesmo período, a equipe LeCun usou menos de 100.000 dados, mas nos primeiros dois meses do anúncio da Hinton dos resultados ImageNet, a equipe LeCun não conseguiu reproduzir o experimento de Hinton com seu próprio algoritmo Como resultado, os resultados da equipe LeCun superaram facilmente a equipe de Hinton depois que Hinton anunciou implementação e dicas algorítmicas.

Ambos esses mestres têm visão soberba e permanecem na profundidade do aprendizado durante trinta anos, mas suas diferenças na visão e as diferenças nas crenças resultantes tornam a diferença de Perspicácia (quer perseguir idéias mais profundas) pode ter sido imensa na época, Existem também diferenças significativas na compreensão das condições de aprendizagem inovadoras, tais como o tamanho dos dados de treinamento, a regularização do modelo, a seleção da função de ativação, a computação GPU, etc. Esses provavelmente não eram inteiramente claros na época, e provavelmente estavam inteiramente baseados em Hinton's (incluindo Esse excelente estudante de doutorado.) Esta diferença na Insight não fez com que a equipe do LeCun conhecesse o quadro algorítmico utilizado e o desempenho do alvo, mas não conhecesse a implementação da chave, mas a equipe do LeCun teve melhor Execução (ajuste de sistema em larga escala), em um curto período de tempo, o desempenho do algoritmo sobre esta sutil diferença entre a fé dos mais especialistas em gado, no final vem do que vale a pena ponderar.

Por que a visão é importante? Assim como o radar, que é um ponto cego para os outros, a visão faz você ver, ver, acreditar e acalmar. Não só você obtém vantagens estratégicas, mas também estabelece seu poder para eliminar tentações e distrações.

Visão, como identificá-lo? Muito difícil, ou quase impossível, apenas pelas mesmas pessoas que apreciam a Visão. Assim como o gosto difícil de marcar o mesmo, só pode ser apreciado pelo mesmo gosto. A visão mostra que 99% Os especialistas não vêem, não acreditam, tão grandes e os mal-entendidos freqüentemente acompanhados por LeCun na profundidade do aprendizado são verificados pelos dados reais do teste, é difícil ser reconhecido pelos círculos acadêmicos dos Estados Unidos, e mesmo a reunião de alto nível publicada não é uma questão simples Hoje em dia, quase todas as teses são rotuladas com aprendizado profundo.

Mas julgando a equipe que filtra sem Vision, há uma pista clara a seguir. Geralmente falando, tanto acadêmico quanto empreendedor, grandes avanços, exigem investimentos consistentes e anos de arraias profundas e anos atrás. Algum ano para o campo ou o modo que estão fazendo (vertical, Plataforma, etc.), classificados como sem Vision não devem ser um problema.

Com o desmantelamento do VIE, penso que a nova era da AI é apenas uma das barreiras, as principais pessoas. Os números de líderes sobre a futura distribuição da tecnologia AI e os limites das empresas não podem ser substituídos, determinar os elementos básicos do desenvolvimento de IA (algoritmos, cálculos, dados E cenários.) Equipes com Execução e Insight de alto nível estão mais conscientes de onde e como os dados válidos para o algoritmo estão disponíveis Equipe com o melhor Insight e Vision é o primeiro a saber que os avanços tecnológicos trazem a maior parte dos negócios Onde e quando as cenas de valor vêm.

Futuro de AI: nenhuma história pode aprender, nem autoritária para prever

Falou sobre o desenvolvimento da AI, como desconstruir a tecnologia e falar sobre o futuro da AI. A nova era da AI baseada no aprendizado profundo é muito diferente da história de 30 anos da AI, que é amplamente utilizada por várias aplicações, em cena real e dados em larga escala para verificar o desempenho Tecnologia, não apenas teoria ou conceito. Embora o desenvolvimento dos últimos cinco anos atinja as expectativas das pessoas, hoje ainda há muitas pessoas que se preocupam com o fato de que o novo AI irá mais do que o passado, mas acho que a nova era da IA é apenas o começo. Descreva brevemente as três características do novo AI:

1, AI é uma dimensão nova, que é a coisa mais importante que determina a quantidade de AI no final.

A inovação e o desenvolvimento da tecnologia AI, como mudar o negócio, não há histórico que possa aprender, nem autoritário para julgar com precisão. Não é apenas uma tecnologia, o avanço da AI pode romper todas as tecnologias, incluindo interação homem-computador, pesquisa, robótica, computação de chips, medicamentos, Ciência farmacêutica e quase todas as disciplinas.

2, o rápido desenvolvimento da IA, salto forte

A partir da curva S, podemos ver que nos últimos 5 anos, o desenvolvimento da AI e seu algoritmo rápido, de classe única (reconhecimento facial) têm dez vezes o crescimento, mas ainda estou mais otimista em relação ao futuro, isto é, a curva após 2018 na curva S Quão íngreme é a forma como a tecnologia multidimensional trazida pelo desenvolvimento da IA combinada com a profundidade de cada cena trará mais experiência de impacto. Na dimensão multi-tecnologia, da visão à audição, compreensão semântica e controle de movimento Alguns anos serão um rápido avanço e a combinação de chips, interação inteligente de ponta a ponta com os últimos 30 cm do usuário, da Internet das coisas à internet da inteligência, de modo que a inteligência em todos os lugares.

3, AI um passo à frente, trará grande potencial

Na curva S, as equipes em diferentes posições têm a vantagem de não apenas a diferença no tempo do eixo horizontal, mas os efeitos cumulativos (integração da curva) da tecnologia líder e a sobreposição da tecnologia AI com mais (curva múltipla de AI) Isso torna a AI uma decisão destrutiva de toda a indústria, não só para determinar a diferença entre uma indústria, segundo lugar e segundo lugar, mas também permite que os líderes das indústrias líderes da IA alavancem as indústrias de visão de trás da IA.

AI futuro, incomparável, por causa da visão, então acredite.