Согласно карточному соучредителю: образец AI, сцена и будущее

Я Лео, соучредитель ETO Technologies, доктор философии по статистике UCLA, я являюсь исследователем в области искусственного интеллекта в течение 15 лет. Она была исследователем в лаборатории профессора Янна ЛеКуна, основа глубокого обучения, победителя конкурса PASCAL Image Target Detection в 2010 году, Национальный институт стандартов и технологий NIST и IARPA Чемпион мира по распознаванию лиц, Агентство исследований новых исследований Национальной разведки.

В последнее время большое количество исследовательских отчетов об искусственном интеллекте, инвесторах, предпринимателях, ученых и горячих тенденциях в искусственном интеллекте и влиянии на различные слои общества, нет недостатка в непонимании технологий ИИ и промышленного развития, его легко ввести в заблуждение. Как правило, делится на три области: ИИ - это то, насколько велика вещь: кто настоящий ИИ-игрок?

Из двойственных перспектив исследователей и предпринимателей я расскажу о своем главном моменте: о границах ИИ, только лидирующая фигура может точно понять и расширить, высшие предприятия, из-за видения создать потенциальную энергию, будущее ИИ, несравненное, ни одна история не может учиться, Невозможно предсказать.

Кривая «S», чтобы увидеть рисунок AI

Моя история и предсказание развития ИИ моделируются с использованием кривой «S», показанной выше (функция Сигмоида также используется для характеристики функции активации нейронов в нейронной сети.) Горизонтальная ось представляет время, а вертикальная ось представляет собой интеллектуальность машины. Точки на кривой представляют собой высший уровень интеллекта в мире в определенный момент времени, начиная с новой эпохи ИИ (Deep Learning), начиная с 2013 года, с уровнем развития машинного интеллекта, который ничтожно мал по сравнению с развитием последних пяти лет до 2013 года. Красная линия представляет Пессимизм (AI ebb, пузырь AI и т. Д.), Период быстрого развития будет проходить после 2017 года, синяя линия представляет оптимизм, и будет быстрое развитие после 2017 года. Следует подчеркнуть, что синие и красные кривые имеют одинаковое понимание истории AI , Но многие на рынке или исследовательский отчет, чтобы увидеть другую кривую, высокая вероятность опроса, чтобы увидеть уровень ИИ, имеет большой разрыв с самого высокого уровня. Анализируя различные позиции шаблона ИИ, вы можете интерпретировать S-кривую трех аспектов :

1, прошлое развитие ИИ и прогнозирование масштабов и скорости развития ИИ в будущем

2, взаимосвязь между уровнем развития ИИ и бизнес-сценариями

3, расположение каждого игрока и промежуток

В частности, давайте начнем с разработки ИИ за последние пять лет. В качестве примера можно привлечь распознавание лиц, вероятность нахождения лица у N человек составляет 95%. Вертикальная ось - это узнаваемый масштаб (размер N) ,

Технология - это не сближение, а усиление разрыва, чтобы разблокировать сцену

Самый высокий уровень распознавания лиц в 2017 году составляет 2 миллиарда человек, что примерно в 200 раз больше, чем в 2016 году, и в десятки тысяч раз больше, чем в 2015 году. В самом авторитетном в мире испытании на распознавание лиц (NIST 2017) ), Мы на 2% опережаем вторую команду Vocord (Vocord на 10% выше Tencent Merit в другом тестовом наборе), который обычно известен как конвергенция технического уровня, один или два высоких Процентный пункт не имеет никакого смысла (сложно понять ценность конкуренции в денежной форме.) Это недоразумение необходимо интерпретировать по двум аспектам:

Первый аспект, алгоритм в сотни миллионов людей, один миллиард приведет к быстрому коэффициента усиления от 5% до 20%. Это закон общей кривой производительности алгоритма. В дополнение к значительным различиям узнаваемым масштаба, но и в трудные ( Курсовые разницы распознавания на жестких) данных. алгоритм из опыта, афроамериканцы, женщины, дети, пожилые пядь, окклюзия труднее определить, какие группы и категории. на этих подклассов, разница в производительности между различными алгоритмами Это будет еще больше.

Крупномасштабное под самой оценки является простым академическим предложением, но и требует много данных для поддержки реальной производительности можно наблюдать на двух миллиардов данных очень мало людей, таких как Соединенные Штаты, трудно учредить 2 млрд из тестового набора. Это не интервью ряда научных практиков распознавания лиц могут получить, это первый источник непонимания.

Второй аспект алгоритма не улучшить и расширить масштабы могут быть идентифицированы, он будет разблокировать дополнительные бизнес-сценарии. Миллионеры признают масштаб соответствует аутентификации сцены, удаленной аутентификации, разблокировки телефона попадают в эту категорию. «Нет разницы в технологии.» аргумент штрихи могут быть установлены в этой сцене, но исследователи безопасности решить дело в сто миллионов и один миллиард пар в десять раз более жесткими, чем спрос в этих сценах, не более, чем несколько проблем, выявленных преступников, но выяснить вероятность разницы почти не проблема с линией, тезис «некритичных приложений,» весьма вводящим в заблуждение.

В последних случаях безопасности, Wan дороге или даже сотни дорожно-камеры видео поиск лица, архив очень высокие требования к алгоритму, при условии, что каждый поток канал 30000, среди всех видео, требования к производительности алгоритм поиска эквивалентных десяти миллиардов может быть идентифицировано на скорости 100 млрд. это представление другого, чем требование сцены для дальнейшего увеличения в тысяче раз. почувствовать разницу до конечного продукта на основе различных алгоритмов усиливаются в той же пропорции. Кроме того, глобальная этническая идентификация, борьба с терроризмом, то требования охвата службы иммиграции для распознавания очень высоки.

Таким образом, 99% -ный алгоритм распознавания и алгоритм 99,99%, разница заключается в разблокируемых сценариях приложения. Эти новые сценарии разблокированы, это команда первопроходцев алгоритмов и вертикальный полевой пионер (например, команда разработчиков системы общественной безопасности) Совместная работа, а также невозможность того, чтобы практикующие по вопросам безопасности проводили собеседование в авангарде изменений, еще один источник недоразумений.

Три уровня технологии VIE: Видение (видение), Проницательность (проницательность), Исполнение (исполнение)

Наиболее распространенным является тестирование чемпионата, фактический случай, результаты торгов ПК, документы и т. Д. Они могут отличить первую десятку не от команды ИИ, но трудно отличить лучшую команду. Моя трехуровневая деконструкция технологии: видение, предвидение или стратегический ландшафт, суждения о технологических тенденциях, проницательность, понимание, характер алгоритма и законы распределения объективного мира: выполнение, реализация, алгоритмы, сбор данных, инженерная вычислительная платформа. для:

Самый простой алгоритм выполнения - какой уровень алгоритма может быть достигнут быстро, особенно после того, как известна общая структура, включая базовый алгоритм, данные сцены, вычислительную платформу эксперимента, приложение продукта и т. Д. Например, как скоро после выхода AlphaGo, Распознавание речи может как можно скорее достичь лучших результатов в мире. Top Execution - это не платформа с открытым исходным кодом, которая может быть заполнена. Экспертиза в определенных областях помогает командам быстро увеличить уровень выполнения в своей области. Китайская команда должна быть мировым классом Если Google является номером 1 в мире, Китай не должен уступать Facebook, Microsoft, Apple, Amazon или даже некоторым аспектам, независимо от того, является ли это шахматами, распознаванием лиц, распознаванием речи и т. Д. Большинство людей Сравнивайте технологии, в основном на этом уровне, но что более важно, чем мощнее эти два уровня.

Еще один шаг к Insight - глубокое понимание технологий, в том числе математическое объяснение алгоритмических моделей и понимание распределения объективного мира. Insight помогает использовать данные и вычислять мощность (то есть, как использовать алгоритмы и даже инновационные алгоритмы). Этот уровень решения может быть лучше, чем Google, или может поддерживать тот же темп развития. Если у вас есть основа алгоритма глубокого обучения, массовые данные на одном уровне, но у нас есть огромный разрыв между настройкой производительности алгоритма. Распознавание мира, например, Мы использовали 200 миллионов изображений человеческих лиц (подмножество миллиардов изображений), обученных достигать 1 миллиарда эффективных параметров модели, используя априорные предположения об атрибутах человеческого лица, включая свет, возраст, расы , Размытие движения, разрешение изображения, настройка модели, как собираются данные и как ускоряются вычисления. Существуют значительные различия в настройке производительности и эффективности обучения модели (которые все упомянуты выше в отношении выполнения), поэтому существуют алгоритмы, вычисления, Интернет-гиганты условий данных не обязательно могут сделать тройку в мире в одной задаче AI.

Видение: предскажите тенденцию развития, определите будущее направление и представьте себе влияние на жизнь и производство. Помимо глубокого понимания технологий нам нужно воображение и креативность технологических инноваций, Ответьте, где и как быстро идет ИИ.

Сильное исполнение, Insight, безусловно, хорошо, но может и не иметь Vision, самое сильное видение, Insight, безусловно, первого класса, но Execution может быть плохим. Сильная команда VIE Мир крайне скуд. С глубиной поля двух мастеров Хинтона Поговорите с LeCun о моих чувствах. К 2010 году многие люди в академических кругах уже говорили о важности больших данных для машинного обучения. Команда Хинтона потратила миллионы учебных данных на основе алгоритма LeCun, изобретенного в 2012 году, Сделанные прорывы мирового уровня на ImageNet, за тот же период команда LeCun использовала менее 100 000 данных, но в течение первых двух месяцев объявления Хинтоном результатов ImageNet команда LeCun не смогла воспроизвести эксперимент Хинтона со своим собственным алгоритмом В результате результаты команды LeCun легко превзошли команду Хинтона после того, как Хинтон объявил алгоритмическую реализацию и советы.

Оба этих мастера обладают превосходным видением и остаются в глубине обучения в течение тридцати лет, но их различия в Видениях и вытекающие из этого различия в убеждениях делают разницу Insight (будь то более глубокое понимание), возможно, были огромными в то время, Существуют также значительные различия в понимании прорывных условий обучения, таких как размер данных обучения, модельная регуляризация, выбор функции активации, вычисления на GPU и т. Д. Это в то время, когда обоснование остается неясным, возможно, полностью с Хинтоном (в том числе Этот превосходный студент PhD.) Это различие в Insight не помогло команде LeCun понять используемую алгоритмическую структуру и целевую производительность, но не знала ключевую реализацию, но позже команда LeCun получила лучшее Выполнение (крупномасштабная настройка системы) за короткий период времени выполнение алгоритма над этой тонкой разницей между верой большинства экспертов по крупному рогатому скоту, в конце концов, связано с тем, что стоит задуматься.

Почему Vision важна? Подобно радару, который является слепым местом для других, Vision заставляет вас видеть, видеть, верить и успокаиваться. Вы не только получаете стратегическое преимущество, но и имеете право исключать соблазны и отвлекающие факторы.

Видение показывает, что это очень сложно, или почти невозможно, только теми же людьми, которые наслаждаются видением. Так же, как вкус, который трудно забить, можно наслаждаться только одним и тем же вкусом. Видение показывает вам, что 99% Эксперты не видят, не верят, поэтому великие и недопонимания, часто сопровождаемые LeCun в глубине обучения, проверены фактическими данными испытаний, их трудно распознать в основных академических кругах в Соединенных Штатах, и даже опубликованные встречи на высшем уровне - это не просто вопрос В настоящее время почти все тезисы имеют глубокое обучение.

Но, судя по команде, которая фильтрует без Vision, есть четкие следы. Вообще говоря, как академические, так и предпринимательские, великие прорывы требуют последовательных инвестиций и глубокой пахоты лет и лет назад. Любой год для поля или в каком режиме (вертикальный, Платформа и т. Д.), Классифицированные как «Нет видения», не должны быть проблемой.

С демонтажем VIE я считаю, что новая эра ИИ является лишь одним из барьеров, топ-людей. Личные данные о будущем распределении технологий ИИ и бизнес-границ не могут быть заменены, определяют основные элементы разработки ИИ (алгоритмы, расчеты, данные И сценарии.) Команды с топ-уровнем Execution и Insight больше всего знают, где и насколько эффективны данные для алгоритма. Команды с лучшими Insight и Vision первыми узнают, что технологические прорывы приносят наибольший бизнес Где и когда появляются сцены ценности.

AI future: ни одна история не может учиться, и не может быть предсказана

Разговоры о развитии ИИ, о том, как деконструировать технологию и рассказать о будущем ИИ. Новый возраст ИИ, основанный на глубоком обучении, сильно отличается от 30-летней истории ИИ, широко используемой различными приложениями, в реальной сцене и крупномасштабных данных для проверки эффективности Технология, а не только теория или концепция. Несмотря на то, что развитие последних пяти лет оправдывало ожидания людей, сегодня есть еще много людей, которые опасаются, что новый ИИ будет очень приличным, как в прошлом, но я думаю, что новый возраст ИИ - это только начало. Я кратко изложил три особенности нового ИИ:

1, AI - это совершенно новое измерение, которое является самым важным, определяющим, сколько AI в конце.

Инновации и развитие технологии ИИ, как изменить бизнес, нет истории, которую можно научиться, и не авторитетной, чтобы точно судить. Я не просто технология, прорыв ИИ может прорваться через все технологии, включая взаимодействие человека и компьютера, поиск, робототехнику, чип-вычисления, медицину, Фармацевтическая наука и почти все дисциплины.

2, быстрое развитие ИИ, сильный прыжок

Из S-кривой видно, что за последние 5 лет развитие ИИ и его быстрый алгоритм однозначного распознавания (распознавания лиц) имеет десятикратный рост, но я еще более оптимистичен в отношении будущего, т. Е. Кривой после 2018 года на кривой S Как круто, как многомерная технология, созданная развитием ИИ в сочетании с глубиной каждой сцены, принесет больше впечатлений от воздействия. В мультитехнологическом измерении, от видения до слуха, семантического понимания и управления движением Через несколько лет произойдет быстрый прорыв, а также комбинация чипа, интеллектуального сквозного взаимодействия с последними 30 см пользователей от Internet Of Things to Internet Of Intelligence по всему миру, чтобы интеллект повсюду.

3, AI на один шаг вперед, принесет большой потенциал

В S-образной кривой, команда находится в другом месте, а не только преимущества временного промежутка между горизонтальной осью, но кумулятивный эффект суперпозиции передовой технологии, чтобы принести (точек кривой) и более юаней (множественным AI технология кривая) технологии AI, Это делает ИИ кросс-отраслевым деструктивным решением не только определить разрыв между одной отраслью, второе место и второе место, но также позволяет лидерам ведущих отраслей AI привлекать отсталые отрасли ИИ.

AI будущее, беспрецедентное, из-за видения, так верьте.