Запуск новостей в области микро-сети (текст / Jiufang Fang), Amazon Echo, Ali Tianmao и других интеллектуальных динамиков AI заставил восходящий голосовой чип внедрить новую модель. С мая по июль в Китае существует более 5 компаний-разработчиков голосовой технологии. Компания выпустила звуковые чипы AI.
16 мая Yunzhisheng выпустил первый чип серии AI UniOne для Internet of Things и чип первого поколения «Yuyan», а 24 мая вышел и попросил выпустить свой первый модуль голосовых чипов AI Mobvoi A1. 2 июля Rokid выпустил свой собственный аналоговый чип SoC KAMINO18, и в то же время генеральный директор компании Гао Шиксинг подтвердил, что компания строит чип ASIC для голоса ASIC, который, как ожидается, будет транслироваться во второй половине этого года. «Появилось будущее голоса AI: развитие голосовой чипы прошло через три этапа: чипы общего назначения, выделенные чипы и чипы AI. На ранней стадии интеллектуального голосового оборудования (2014-2015) из-за длительного цикла разработки чипов (18-24 месяца) ), Инвестиции в НИОКР высоки, в случае продажи терминалов сложно поддерживать вспышку чип-чеков, на рынке используются универсальные чипы.
Микросхема общего назначения, которая относится к комбинации чипа микросхем AP / планшета и другого чипа Codec / DSP. Чип Codec выполняет преобразование цифрового аналогового сигнала, а DSP обрабатывает цифровые сигналы, включая эхоподавление, подавление шума и уменьшение / усиление шумового шума. И т. Д., Наконец, присоединился к поддержке облачных вычислений. Репрезентативным чипом является MediaTek MT8563 и Quanzhi R16 (планшетный чип).
СИС, является вторым этапом развития голосового чипа, который использует подходящий процессор обработки голоса, микрофонная решетку многоканальной соединенные интерфейсов, голос на алгоритме эхокомпенсации поддержки, подавление шума, локализация источника звука, методы улучшение речи, Результирующие чипы - это MediaTek MT8516, Conexant CX20924, Jingchen Semiconductor A113, Rockchip RK3036 и Beijing Junzheng X1000. Эти чипы не имеют встроенного ускорителя нейронной сети. Облачная реализация.
Некоторые аналитики отметили, что характеристики выделенных микросхем заключаются в том, что распознавание речи, семантическое понимание, синтез речи, выполнение задачи и т. Д. Выполняются в облаке, но есть проблема задержки «голосового взаимодействия» в облаке. Спрос на сеть ограничивает оборудование. Используйте пространство и принесите данные и кризисы в области конфиденциальности.
Голосовой чип AI, который является голосовой технологией третьего поколения, решает следующие проблемы: (1) интеграция выделенного процессорного модуля AI (NPU) для ускорения локальных алгоритмов машинного обучения; (2) чипы голосового AI не только интегрированы CPU, NPU, также интегрирует обработку сигналов DSP, Wi-Fi / Bluetooth и другие модули; (3) Он может реализовать интеллект «end side», преобразовать общие функции из облака в локальную и работать в автономном режиме и решать проблемы конфиденциальности данных пользователей. Intellect запустил CI1006 в 2016 году, GX8010, выпущенный Hangzhou Guoxin в конце октября 2017 года, который является типичным представителем голосовых чипов AI.
Вышеупомянутый «трехступенчатый» шаг развития голосовой чипсы: от нынешнего рынка терминалов к коэффициенту принятия решений из вышеперечисленных трех типов чипов лидером является выделенный голосовой чип, данные которого показывают, что 70% продаж 30 миллионов смарт-динамиков в 2017 году были MTK. Аналитики полагают, что есть две причины для использования выделенных чипов. Во-первых, устаревшие чипы общего назначения устарели. Большинство из них заимствовано из чипа AP с плоской панелью / OTT. Они просто объединяют мультимедийный цифровой кодер с DSP. Эффект невелик, во-вторых, что новый чип AI только начинается, и экология все еще устанавливается.
Вице-президент Rokid и руководитель базовой платформы Чжоу Цзюнь сказал: «В настоящее время чип общего назначения был сложным для удовлетворения потребностей смарт-сцен с динамиками. Наши ранние продукты также использовали универсальный чип. Самая большая проблема - это функция пробуждения в реальном времени, которая требует двух ядер. Работа в то же время в течение длительного времени, высокая потребляемая мощность, а не переносная, иногда требующая четырехъядерную или даже восьмиядерную вычислительную скорость.
В настоящее время MediaTek, Conexant, Jingchen, Ruixinwei, Junzheng, Torch и другие производители являются основной силой выделенных голосовых чипов, а затем с Guoxin, Rodik, выходят, чтобы спросить, Yunzhisheng и многое другое С появлением AI Voice, будут ли звуковые чипы AI заменены выделенные голосовые чипы, ведущие рынок терминальных приложений?
Линг Юн, генеральный менеджер подразделения искусственного интеллекта Ханчжоу Гусин, сообщил журналистам о микро-сети, что сложно определить, будет ли чип голоса AI полностью заменить выделенный чип голоса. Конечной целью чипа AI является применение продукта. Различные маршруты и методы, найдите правильный сценарий приложения.
Лидер голосовой платформы Zhong Haowei Лао Юйюань также сказал журналистам: «В начале чипа AI многие компании строят свои собственные технические маршруты, основываясь на предыдущем накоплении решений ИИ, трудно судить, кто в конечном итоге победит. Ключевым моментом является то, что пора не убивать, промышленность должна работать вместе, чтобы построить этот рынок.
Респонденты, которые не хотели, чтобы их называли, сказали, что со вспышкой интеллектуальных голосовых терминалов, Yunzhisheng, выходят, чтобы задавать вопросы, Rokid, Spirit и другие компании, занимающиеся технологией обработки голоса, через «настраиваемые» с такими чип-компаниями, как Guoxin Путь, добавленный к массиву разработки голосового чипа / модуля AI, хотя время отстает от MTK, AMLogic, Junzheng, ядра факела и т. Д., Но с преимуществом самого чипа AI ему суждено получить больше поддержки на рынке.
По словам репортера микросетей, чип AI, разработанный Guoxin, обеспечивает цифровой процессор сигналов DSP, нейронные сетевые процессоры NPU и стандартные интерфейсы USB / IIS / IIC / UART. Выход, Rokid и другие производители не нуждаются в IP-дизайне. Требуется только интеграция архитектуры. Большинство из этих интеграций - обработка сигналов микрофонных массивов, шумоподавление, технология пробуждения, распознавание голосовой почты и некоторые голосовые навыки. Хотя Yunzhisheng - это самонастраивающаяся архитектура uDSP и DeepNet, она функционально превосходит две вышеупомянутые. Чип в основном тот же. Короче говоря, у трех типов голосовых чипов все еще есть свои рынки, и конечная производительность еще предстоит увидеть.
Сценовая накладная микросхема Десять миллионов приложений могут восстанавливать затраты
В настоящее время специальные сцены имеют разные требования к AI-чипам: «В приложениях на сцене AI только глубокая настройка микросхем может лучше реализовать функции AI» стала консенсусом отрасли. Однако стоимость пользовательских чипов высока. Препятствие перед многими производителями.
Некоторые люди в отрасли отметили, что чипы AI должны обладать достаточной вычислительной мощностью для выполнения различных алгоритмов речи, с одной стороны, и большого количества интерфейсов для адаптации к различным сценариям, с другой стороны, при одновременном обеспечении затрат и энергопотребления для массового производства. Бизнес-требования. Это большая проблема сама по себе.
«Если компания разрабатывает свой собственный чип AI и принимает 40-нм процесс, тогда стоимость может увеличиться, а не уменьшаться. Чип должен делиться затратами на исследования и разработки по масштабам. 40-нм процесс стоит всего 10 миллионов юаней и выделяется 1 миллиону PCS. Количество единиц продукции), средняя стоимость одной штуки достигает 10 юаней, что не включает в себя более высокие затраты на исследования и разработки ».
В интервью Ji Wei.com Torch Technology также высказала ту же точку зрения. Валовая прибыль самого чипа очень низкая. Например, в качестве примера используется чип 55 нм, он требует около нескольких миллионов долларов, а затраты на исследования и разработки исключены. Сказал, что только те мощные компании, которые могут получить финансирование, могут иметь возможность выполнять настройку микросхем.
В этой связи Чжу Бин, руководитель R & D-платформы R & D, не согласен: «Использование универсальных чипов для смарт-устройств - это нож для убийства цыплят. Особые потребности требуют специальных чипов для устранения болевых точек. Индивидуальные чипы AI точно снижают затраты, а аппаратное обеспечение искусственного интеллекта рассчитывает мощность. Существует спрос, для чипа общего назначения общего назначения недостаточно, а высокопроизводительный чип общего назначения имеет много избыточных конструкций, что приводит к большому потреблению энергии.
Как считает Чжу Бин, Кан Хэн, вице-президент IoT Business Unit, считает, что пользовательские чипы предназначены для экономии затрат, а не увеличения затрат. «Прибыль от телевидения, кондиционирования и других бытовых приборов достаточно для покрытия высокой стоимости голосовых модулей. Тем не менее, стоимость небольших приборов, таких как вентиляторы и электрические фонари, относительно ограничена, а преимущества модулей ослаблены. Клиенты хотят делать больше умных продуктов и погружаться в недорогие продукты, но на рынке нет подходящего чипа. В рамках продукта юаня универсальный чип не является экономически эффективным. После создания своего собственного чипа AI Yunzhisheng может открыть чип-решение технологии голосовой ИИ для клиентов и повысить инициативу в области затрат и поставок.
По словам репортера, хотя пользовательские чипы AI дороги, для того, чтобы реализовать смарт-терминалы ближе к функциям AI, многие производители все еще начинают создавать пользовательские чипы. ,
В 2016 году Rokid и Hangzhou Guoxin разработали KAMINO18 - представитель персонализированных чипов. Индивидуальные чипы Spirent будут выпущены во второй половине года. Кстати, согласно докладу зарубежных СМИ, информация в марте этого года, Amazon также разрабатывает таможню для поддержки интеллекта. В то время в чипе AI Speaker Echo говорилось, что Amazon уже имеет 449 сотрудников с опытом и навыками чипа.
В пользовательских чипах есть принцип, т. Е. Должно быть достаточное количество для поддержки возмещения затрат. Что касается Rokid, Spirit, сколько стоит Amazon в процессе настройки чипа, эта стоимость зависит от того, сколько терминалов продано для восстановления, в настоящее время репортер Тем не менее, Ханчжоу Гусин Линьюнь сказал, что чип должен достичь точки безубыточности. По крайней мере, терминал, использующий этот чип, должен достичь десятков миллионов метров. Если он настроен, он составляет как минимум один миллион.
Соучредитель Rokid Ван Юд также сказал, что самым важным моментом пользовательского чипа является количество, ключевая точка прибыли чипа, объем должен достигнуть более пяти миллионов.
«Это также разница между чипом AI от Guoxin и Google, чипом NVIDIA AI», - сказал Линьюн, Google, NVIDIA больше в облачном чипе, облачный чип не чувствителен к стоимости и энергопотреблению, а размер одного чипа Могу многое сделать, но конечная сторона отличается, конечная сторона должна начинаться со сценария приложения, в соответствии с реальной сценой, чтобы сделать настройку, как только продажа этой сцены будет трудно поддерживать стоимость настройки чипа, она потеряет деньги.
Итак, какие эффективные решения существуют в краткосрочной перспективе? Линьюн подчеркнул: «Настройка чипа с нуля нецелесообразна, а цикл затрат слишком велик. Рекомендуется, чтобы чип-компания определила развитие чипа как можно больше, чтобы охватить больше. Сценарии приложений также рекомендуется, чтобы поставщики по нисходящей линии связи часто общались с ведущими чип-компаниями, позволяя поставщикам чипов максимально учитывать потребности клиентов в интерфейсном дизайне, поэтому нет необходимости оплачивать дополнительные расходы.
В настоящее время понятно, что продукты, основанные на Rokid, Yunzhisheng AI chip и AI-модуле, начали выходить на рынок, а некоторые предприятия уже получили миллионы заказов, что является хорошим знаком. Rokid Zhou Jun сказал Jiji Чистый репортер: «В настоящее время чипы и решения Rokid созрели и были приняты интернет-компаниями, такими как детский образовательный рынок. Мы уверены, что можем настроить лучшие чипы для поддержки лучшего развития клиентов».
В качестве отечественного производителя «ядерного» глава интеллектуальной голосовой платформы Zhongtianwei, Лао Юйюань, твердо сказал: «Сотня-бокс делает голосовое взаимодействие АИ горячим пятном, но умные динамики - всего лишь верхушка айсберга, а Интернет Все - это конечная цель. Цель: чип не может охватить все рынки, например, чипы AI-динамиков не могут быть помещены в автомобиль. Мы будем придерживаться нашего собственного маршрута, делать специальные звуковые чипы AI и индивидуальные решения ».
В целом стоимость настройки AI-чипов - большая проблема, но многие респонденты все еще согласны с тем, что ценность пользовательских AI-чипов будет еще больше. Это тенденция времени. Что касается решения проблемы затрат, это зависит от Rokid, Yunzhisheng, мышления. Компания по настройке чипов AI, представленная Bichi, может достичь платежного баланса в течение предопределенного времени, тем самым создавая уверенность в отрасли.