Новости

Распознавание голоса / семантическое понимание как основное направление эволюции |

В последние годы крупные бренды на английском рынке опубликовали свой собственный помощник по голосовой связи и умный динамик, в дополнение к технологии искусственного интеллекта означает, что поле стало использоваться в домашних условиях, но также объявило о появлении эры интерфейса человеко-машинного интерфейса. Развитие технологии распознавания речи в китайском языке По сравнению с английским языком это сложнее, привычки людей к жизни и потребности разумных семей также различны. Поэтому, рассматривая развитие технологий и расширение китайского рынка, местные производители также отличаются от местных в Европе и Соединенных Штатах.

Новое видение комбинации умного домашнего помощника и помощника голоса, так как Amazon выпустила смарт-спикер Echo в 2014 году. Большие производители, такие как Google и Apple, также присоединились к битве за выпуск смарт-динамиков различной рыночной ориентации (Таблица 1).

Согласно исследованиям исследовательской компании Global Market Insights, в отчете говорится, что мировой рынок смартфонов в 2016 году составил 400 миллионов долларов США, ожидается, что к 2024 году он вырастет до 130 миллиардов долларов США. Интеллектуальные перспективы рынка рога также будут очень быстрыми. Кроме того, COMPUTEX TAIPEI совместно спонсировала Тайбэйскую компьютерную ассоциацию, также выпустила несколько дней назад новость о том, что с сентября 2017 года, открывая 2018 год, открывают онлайн-вход в систему, видят множество конечных устройств ИИ, речевые помощники и другие инновации Заявка на участие в выставке Производители продуктов Taipei Computer Association далее проанализировали, что эта тенденция обусловлена ​​зрелостью AI (Voice Assistant), которая может быть связана с функциями помощника голоса, поиска, запроса и ежедневных покупок. Обеспечьте более полное обслуживание службы искусственного интеллекта.

Для китайского рынка крупные онлайн-гиганты Китая также выпустили свои собственные интеллектуальные роговые продукты с 2015 года. И поскольку рынки Европы и Америки обычно имеют свои рыночные преимущества, например, Alibaba и Amazon освоили довольно большое количество электронных Рыночная доля на рынке бизнеса позволяет потребителям получать более полные торговые услуги через разные каналы через свои умные динамики. Xiaomi, которая похожа на Apple, накопила много проверенных аппаратных устройств до ее запуска, Позволяет более полную серию между оборудованием, позволяя потребителям достичь более разумной домашней жизни.

Чтобы способствовать реализации умного дома, он должен идеально сочетаться с реальным режимом жизни, чтобы создать потребительский спрос. Согласно данным, предоставленным NPR And Edison Research, 87% пользователей, которые приобрели смарт-динамики, ожидают возможности озвучить Войдите в интерфейс для поиска информации. Таким образом, технология распознавания речи в Китае - это первый технический порог для запуска китайского рынка, который должен прорваться (рисунок 1).

Рисунок 1 Интеллектуальные пользователи динамиков, чтобы купить цель статистики

Межкультурная идентификация в соответствии с реальной ситуацией в Тайване

Чжан Чжэнькуй (Zhang Zhenkui), заместитель руководителя отдела IT-продвижения ITRI, сказал, что ИТРИ интегрирует технологию распознавания голоса, разработанную в течение многих лет с четвертого квартала 2016 года для развития ITRI-помощника голоса. Из наиболее подходящих жизненных привычек помощников по голосу на Тайване по сравнению с международными брендами, выпущенными помощниками по голосовой связи, интеллектуальными продуктами динамиков, голосовые ассистенты ITRI смогли сделать более точное распознавание речи в Китае, в настоящее время активно развивают возможности распознавания нескольких языков, будущее Голосовые помощники ITRI также могут точно идентифицировать инструкции пользователя (см. Рис. 2), если они содержат английские или тайваньские слова на китайском языке.

Рисунок 2 Заместитель главного редактора ИТИР Чжан Чжэнькуй отметил, что голосовые помощники ИТРИ смогли сделать больше, чем международные производители китайского распознавания речи.

В будущем, помимо непрерывного развития большего количества функций распознавания речи, таких как английский и тайваньский, и продолжения разработки приложений на рынке, помощник голоса ИТРИ будет продолжать фокусироваться на оптимизации семантического понимания на китайском языке. Во-первых, из-за различных национальных или региональных диалектов Различные способы использования грамматики и семантики, в будущем, ИТРИ быстро расширит семантическую базу данных на разных языках, объединив ее с технологией машинного обучения, и, кроме того, часто все члены семьи используют часть оборудования вместе в контексте использования интеллектуальных динамиков. Поэтому важно также развивать функцию распознавания громкоговорителей с помощью технологии распознавания голоса, чтобы интеллектуальный динамик мог собирать полные и корректные данные о поведении пользователя. Наконец, эмоции голоса пользователя также являются одним из основных направлений развития в будущем. Тон во время ввода информации, срочность пользователя, чтобы сделать инструкцию, и эмоциональные изменения неизвестны другим человеко-машинным интерфейсам, поэтому в будущем тон интонации также будет ценными данными, которые могут быть собраны путем распознавания речи один.

Анализ Чжан Чжэнькуй, хотя размер рынка относительно невелик на Тайване, но все же его рынок должен быть развитым вендором. Большинство связанных с Тайванем производителей по продажам OEM в качестве основного источника прибыли, многих роутеров и других производителей продукции, также начали литье Интеллектуальные динамики и экспорт. Помимо технологий производства оборудования, Тайвань также имеет очень зрелую платформу для электронной коммерции, а телекоммуникационные операторы предоставляют контент-услуги, такие как музыка, фильмы, книги и другие вполне завершенные в Европе и США довольно успешные интеллектуальные модели бизнес-моделей динамиков Другими словами, Тайвань может предоставить довольно полные услуги в том же районе.

Модель динамики динамиков динамиков

Несмотря на то, что доминирующая модель операционной прибыли для Amazon Echo остается ориентиром для покупок платформы электронной коммерции, статистика NPR и Edison Research показывает, что 90% пользователей смартфонов говорят, что слушать музыку - одна из причин, по которой они покупают смарт-динамики , Google также представила Google Home Max, которая демонстрирует такой же высококачественный звук, как Apple HomePod, в Google Made в 2017 году. В 2017 году Amazon представила более интеллектуальные динамики с различными функциями, такими как объектив Echo Show и Echo Look в сочетании с монитором. По мере того, как данные, собранные крупными производителями, постепенно завершаются, позиционирование на рынке нового поколения интеллектуальных динамиков становится более точным. Далее на европейском и американском рынках, умные динамики, как озвучить помощь в ядре, расширить технические функции и Рыночное позиционирование, стоит обратить внимание.

Рисунок 3 Google запустил Google Home Max с высококачественным звуком в 2017 году и Google Home Mini по более низкой цене.

Кроме того, смартфоны, выпущенные Baidu, Alibaba, Tencent и Xiaomi в 2017 году, стали свидетелями значительного роста на китайском рынке. Чжан Сяопин, старший менеджер по маркетингу, микропроцессоры и микроконтроллеры Greater China, NXP По оценкам, в 2018 году рынок в Китае будет развиваться быстрее, чем в 2017 году, и около 20 миллионов смартфонов на рынке (рис. 4).

Рисунок 4 Чжан Сяопин, старший менеджер по маркетингу, микропроцессоры и микроконтроллеры Великий Китай, NXP. Большой Китай оценивает, что китайский рынок будет расти еще быстрее в 2018 году, чем в 2017 году.

Однако в настоящее время, как в Китае, так и на мировом рынке, необходимо улучшить популяризацию умных динамиков. Чжан Сяопин считает, что нынешняя низкая точность китайского смыслового понимания является основной причиной того, что интеллектуальные динамики не могут быть популяризованы. Например, современные интеллектуальные помощники часто требуют Тем не менее, это не самый интуитивный способ использования. Чжан Сяопин предсказывает, что в будущем слова пробуждения будут распознаваться голосом, интеллектуальная технология оптимизации распознавания, в голосе помощника, чтобы иметь возможность Признание пользовательской речевой записи и анализ контекста голосовых команд для определения пути достижения самого близкого к естественному человеческому поведению голосовой и человеко-машинного интерфейса. Однако, поскольку китайский бренд умных динамиков указан по очень низкой цене для образования и продвижения на рынке Все они имеют значительную помощь. Хотя эта технология требует очень высокого уровня искусственного интеллекта, Чжан прогнозирует, что эта технология сделает крупные прорывы к 2020 году и достигнет конечного типа распознавания речи.

Чжан далее отметил, что разные поколения пользователей имеют разные характеристики, для цифровых аборигенов, родившихся после 1990 года, все сетевые ситуации будут считаться само собой разумеющимися, поскольку они становятся основой общества, эпохи умного дома Придет.

На нынешнем рынке интеллектуальных динамиков в Китае конкуренция убила Красное море. Однако, по сравнению с прибылью от продажи оборудования, для производителей важнее получить больше данных для корректировки возможностей обработки голоса. Чжан Сяопин считает, что, Благодаря поддержке китайских гигантов Китая через 1 - 2 года накопления данных значительно улучшится технология интеллектуальных динамиков и голосовых ассистентов. Пользователи также более знакомы с интерфейсом человеко-машинного интерфейса, и в это время будут видны более релевантные продукты. С другой стороны, Чжан Сяопин отметил, что план проса в умном доме является наиболее полным, и была создана полная экосистема. Как только в 2018 году можно наблюдать значительный рост доли рынка.

Ожидается, что Baidu выиграет китайский рынок голосовых ассистентов

Расширение 墣 Аналитик исследовательского института Лин Чжэнь 妤, что среди многих облачных сервисов в Китае среди наиболее примечательных макетов Baidu. Интеллектуальный помощник голоса Baidu DuerOS, интеллектуальное облако Baidu, мозг Baidu при поддержке двух облачных сервисов , Платформа, которая является открытой платформой для разработчиков для предоставления инструментов, данных и среды разработки, которые пытаются установить в Китае, таких как Amazon, полная система искусственного интеллекта Google (рисунок 5).

Рисунок 5 Аналитик исследовательского института Takuchi Линь Юнг-妤, что многие из облачных сервисных компаний Китая, наиболее примечательные из макета Baidu.

Отношение Baidu является самым позитивным среди трех поставщиков облачных услуг в Китае (Baidu, Alibaba и Tencent). Baidu закричал на конференции разработчиков игр 2017 года, что лозунг «Все в AI» объявил о том, что он будет полностью развивать свою рабочую силу Smart продолжает ассоциироваться с соответствующими изменениями на рынке, а продвижение DuerOS является одним из ключевых проектов в AI Baidu.

Лин Юнг Хван сказал, что в настоящее время многие компании хотят поставить смартфон на умный рынок диктовки, но модель прибыли еще не передумала: бизнес-модель открытой платформы Baidu с сильной конкурентоспособностью, многообещающая. Baidu для обеспечения открытой платформы быстро получит большие объемы данных , И, таким образом, оптимизировать функцию DuerOS. Самое примечательное, что в настоящее время только через обновление программного обеспечения можно оснастить интеллектуальные устройства Amazon Alexa через минуту в китайском интерфейсе DuerOS. Поэтому DuerOS не только на внутреннем рынке Китая Поощрение, зарубежные китайцы также могут использовать эту службу поддержки голосовой связи DuerOS.

В голосе интерфейса man-machine в процессе разработки использование интеллектуальных динамиков в домашней области - это только первый шаг, мы должны сначала популяризировать интеллектуальные динамики, потребители привыкнут к использованию языка для общения с машиной, а затем только для разработки более Возможно применение голосового интерфейса.

2016 GoodChinaBrand | ICP: 12011751 | China Exports