Die Einführung von Nachrichten aus dem Mikro-Netzwerk (Text / Jiufang Fang), Amazon Echo, Ali Tianmao und anderen intelligenten AI-Sprechern zwang den Upstream-Sprachchip zu einem neuen Muster: Von Mai bis Juli gibt es in China mehr als 5 Sprachtechnologie-Unternehmer. Das Unternehmen veröffentlichte AI-Sprachchips.
16. Mai die erste Wolke bekannte Soundchip UniOne AI Serie für das Internet der Dinge und der ersten Generation Chip Swift angekündigt, 24. Mai gehen sie fragen ihre erste AI Sprach-Chip-Modul Kern freigegeben gefragt Mobvoi A1 ; 2. Juli Rokid seine AI Stimme anwendungsspezifische SoC KAMINO18 freigegeben, während zur gleichen Zeit, denken Sie an Spitzer CEO bestätigt, dass das Unternehmen eine hohe Shixing AI Stimme ASIC-Chip noch in diesem Jahr erwartet, baut, Sprach-Chip ‚Trilogie abgeklebt. ‚AI Stimme wurde kommt zu? Stimme Chip-Entwicklung hat sich durch drei Phasen gegangen, Universal Chip, ASIC-Chip und AI in den frühen Phasen der intelligenten Sprachausrüstung (2014-2015), aufgrund der Chip-Entwicklungszyklus lang (18-24 Monate ), hohe F & E-Investitionen, sind im Fall von Terminal Umsatz schwierig Chip-Scale-Ausbruch, den Markt mit einem gemeinsamen Chip zu unterstützen.
Allzweck-Chip, bedeutet der Chip Weise AP / Codec-Chip + flache Chips / DSP-Chips kombiniert wird, von digital gewandelte Signal-Codec-Chip-zu-Analog, die DSP digitaler Signalverarbeitung, Echokompensation, Geräuschunterdrückung, Rauschunterdrückung SPEECH / Verstärkung Etc., trat schließlich der Cloud-Computing-Unterstützung.Der repräsentative Chip ist MediaTek MT8563 und Quanzhi R16 (Tablet-Chip).
ASIC, ist die zweite Phase der Entwicklung des Sprachchips, der geeigneten Sprachverarbeitungs CPU verwendet, ein Mehrkanal-Mikrofon-Array gekoppelt Schnittstellen, die Stimme auf dem Trägerechounterdrückungsalgorithmus, Rauschunterdrückung, Schallquellenlokalisierung, Sprachverbesserungstechniken, und beide Rechenleistung und geringer Strom Überlegungen repräsentativer Chip MediaTek MT8516, Conexant CX20924, Amlogic A113, Rockchip RK3036 und Peking Juni X1000. solcher neuronales Netz Beschleunigerchip ist nicht gebaut, AI und mehr Hilfe Cloud-Implementierung
Einige Analysten haben darauf hingewiesen, dass die speziellen Eigenschaften des Chips wird die Spracherkennung, semantisches Verständnis, Sprachsynthese, die Task-Ausführung wird in der Wolke durchgeführt, aber die Wolke gibt es ein Problem ‚delay‘ Sprachinteraktion, um die Nachfrage nach Netzwerkausrüstung zu begrenzen Nutzen Sie Platz und bringen Sie Daten- und Datenschutzkrisen mit sich.
Der AI Voice-Chip, die Voice-Technologie der dritten Generation, löst diese Probleme: (1) Integration eines dedizierten AI-Prozessormoduls (NPU) zur Beschleunigung lokaler Lernalgorithmen, (2) Voice-AI-Chips sind nicht nur integriert CPU, NPU, integriert auch DSP-Signalverarbeitung, Wi-Fi / Bluetooth und andere Module; (3) es kann "End Side" Intelligenz zu realisieren, gemeinsame Funktionen von der Cloud auf die lokale konvertieren und Offline-Betrieb und lösen Datenschutzprobleme. Intellect brachte 2016 den CI1006 auf den Markt, den GX8010, der Ende Oktober 2017 von Hangzhou Guoxin auf den Markt gebracht wurde.
Dies ist der "Drei-Schritt" der Entwicklung von Voice-Chips. Vom derzeitigen Terminal-Markt zum Adoptionsverhältnis der oben genannten drei Arten von Chips ist der dedizierte Voice-Chip der Führer, mit Daten, dass 70% der Verkäufe von 30 Millionen Smart-Lautsprecher im Jahr 2017 waren MTK schließt ein: Analysten glauben, dass es zwei Gründe für den Einsatz von dedizierten Chips gibt: Erstens sind die Allzweckchips veraltet, die meisten sind vom Flat-Panel- / OTT-AP-Chip entlehnt und kombinieren einfach den digitalen Multimedia-Encoder mit dem DSP. Der Effekt ist nicht großartig, der zweite ist, dass der AI-Chip, der neu ist, gerade erst begonnen hat und die Ökologie immer noch etabliert ist.
Rokid Vice President und Leiter der Stiftung Plattform Zhou Jun sagten: ‚Derzeit ist der Allzweck-Chip schwierig ist, die Bedürfnisse der intelligenten Szene Lautsprecher gerecht zu werden, unser frühes Produkt nutzt auch einen Universalchip, ist die größte Herausforderung Echtzeit-Wake-up-Funktion, zwei Kerne während lange Arbeitszeiten, hohen Energieverbrauch und nicht tragbar, manchmal sogar acht-Core Quad-Core-Rechengeschwindigkeit. '
Derzeit MediaTek, Conexant, Jing Chen, Rockchip, der König ist, Taschenlampenbatterien und andere Hersteller sind spezielle Sprach-Chip Sendungen im Haupt, dann, mit den Kernländern, Rodik, gehen sie fragen, Wolke bekannte Sound und vieles mehr AI Unternehmen mit Sprach-, Sprach-Chip AI wird die spezielle Sprach-Chip schließlich ersetzen, die führenden Endverbrauchermärkte es?
Ling Yun, General Manager der Guoxin Artificial Intelligence Division von Hangzhou, sagte Reportern auf dem Mikro-Netzwerk, dass es schwierig sei zu bestimmen, ob der KI-Sprachchip den dedizierten Sprachchip vollständig ersetzen wird. Das ultimative Ziel des AI-Chips ist die Anwendung des Produkts. Verschiedene Routen und Praktiken finden das richtige Anwendungsszenario.
Zhong Haowei, Sprecher der intelligenten Sprachplattform Lao Yuyuan, sagte auch zu Reportern: "Zu Beginn des AI-Chips bauen viele Unternehmen ihre eigenen technischen Routen auf, basierend auf der vorherigen Ansammlung von AI-Lösungen. Es ist schwer zu beurteilen, wer letztendlich gewinnen wird. Der entscheidende Punkt ist, dass es nicht die Zeit ist zu töten, es ist notwendig, dass die Industrie zusammenarbeitet, um diesen Markt aufzubauen.
Befragte, die nicht genannt werden wollten, sagte, dass mit dem Ausbruch der intelligenten Sprachendgeräte, Yunzhisheng, Fragen zu stellen, Rokid, Spirit und andere Voice-Technologie-verarbeitenden Unternehmen, durch die "maßgeschneiderten" mit Chip-Unternehmen wie Guoxin Der Weg, der zu dem Array von AI-Sprachchip / Modul-Entwicklung hinzugefügt wird, obwohl die Zeit hinter MTK, AMLogic, Junzheng, Fackelkern usw. zurückbleibt, aber mit dem Vorteil des AI-Chips selbst, ist es bestimmt, mehr Marktunterstützung zu erhalten.
Laut dem Micro-Grid-Reporter, der AI-Chip von Guoxin entwickelt bietet digitale Signalprozessor DSP, neuronale Netzwerkprozessor NPU und USB / IIS / IIC / UART-Standard-Schnittstellen.Ausgehend benötigen Rokid und andere Hersteller IP-Design. Nur Architekturintegration ist erforderlich.Die meisten dieser Integrationen sind Mikrofonarray-Signalverarbeitung, Rauschunterdrückung, Wake-Up-Technologie, Stimmabdruckerkennung und einige Stimmfähigkeiten.Obwohl Yunzhisheng eine selbst entworfene uDSP- und DeepNet-Architektur ist, ist sie den beiden obigen Funktionen überlegen. Der Chip ist im Grunde der gleiche: Kurz gesagt, die drei Arten von Voice-Chips haben immer noch ihre eigenen Märkte, und die endgültige Leistung bleibt abzuwarten.
Scene Custom Chip Zehn Millionen Anwendungen können Kosten decken
Gegenwärtig haben die Spezialszenen unterschiedliche Anforderungen an AI-Chips. "In AI-Szenenanwendungen kann nur eine tiefgreifende Chipanpassung die Funktionen von AI besser realisieren", ist der Konsens der Industrie geworden. Allerdings sind die Kosten für kundenspezifische Chips hoch. Eine Hürde vor vielen Herstellern.
Die Industrie hat darauf hingewiesen, AI Chipcount auf der einen Seite genügend Energie hat eine Vielzahl von Sprachalgorithmen zu laufen, auf der anderen Seite müssen wir viel in Adapter für verschiedene Szenarien tun, während halt Kosten und den Stromverbrauch der Großproduktion gerecht zu werden Geschäftsanforderungen: Dies ist eine große Herausforderung für sich.
"Wenn das Unternehmen seinen eigenen AI-Chip entwickelt und den 40-nm-Prozess anwendet, können sich die Kosten eher erhöhen als verringern. Der Chip muss die Forschungs- und Entwicklungskosten nach Maßstab teilen. Der 40-nm-Prozess kostet nur 10 Millionen Yuan und ist 1 Million PCS zugeordnet. Die Anzahl der Produkteinheiten), die durchschnittlichen Kosten pro Stück ist so hoch wie 10 Yuan, die nicht mehr hohe F & E-Aufwendungen enthält. "Industrie sagte.
Im Interview mit Ji Wei.com äußerte Torch Technology ebenfalls die gleiche Ansicht: Der Bruttogewinn des Chips selbst sei sehr niedrig: Bei einem 55-nm-Chip seien etwa mehrere Millionen Dollar zu zahlen, und die Forschungs- und Entwicklungskosten seien ausgeschlossen. Sagte, dass nur die mächtigen Firmen, die Finanzierung erhalten können, die Fähigkeit haben können, Chipanpassung vorzunehmen.
In diesem Zusammenhang ist Zhu Bin, Leiter der F & E-Plattform R & D, nicht einer Meinung: "Die Verwendung von Mehrzweckchips für intelligente Geräte stellt ein Messer zum Töten von Hühnern dar. Spezielle Bedürfnisse erfordern spezielle Chips, um die Schmerzpunkte zu lösen. Benutzerdefinierte AI-Chips reduzieren genau die Kosten, und künstliche Intelligenz berechnet Energie. Es gibt Bedarf, der Low-End-Allzweckchip ist nicht genug und der High-End-Allzweckchip hat viele redundante Designs, was zu einem hohen Stromverbrauch führt.
Aus Sicht von Zhu Bin ist Kang Heng, Vice President der IoT Business Unit, der Ansicht, dass kundenspezifische Chips dazu dienen, Kosten zu sparen statt Kosten zu erhöhen. "Der Gewinn von TV, Klimaanlagen und anderen Haushaltsgeräten reicht aus, um die hohen Kosten von Sprachmodulen zu decken. Allerdings sind die Kosten für kleine Geräte wie Ventilatoren und elektrische Lampen relativ begrenzt, und die Vorteile der Module sind geschwächt: Kunden möchten mehr intelligente Produkte herstellen und auf Low-End-Produkte zurückgreifen, aber es gibt keinen geeigneten Chip auf dem Markt. Innerhalb des Produkts des Yuan ist der Allzweck-Chip nicht kosteneffektiv.Nach dem Aufbau eines eigenen AI-Chips kann Yunzhisheng den Kunden die Chiplösung der Sprach-AI-Technologie öffnen und eine größere Initiative in Bezug auf den Kosten- und Lieferzyklus haben.
Diese beide sehr unterschiedlichen Perspektiven, von Chip-Unternehmen mit einem völlig anderen Algorithmus fest Ausgangspunkt. Laut dem Reporter, obwohl benutzerdefinierte AI Chip astronomische Investitionen, sondern um intelligenten Terminal zu erreichen näher an die KI, gibt es noch viele Hersteller begannen Custom-Chips zu machen .
2016 Rokid Hangzhou Kernländern gemeinsam entwickelten KAMINO18 ist repräsentativ für kundenspezifische Chips, Chi die zweite Hälfte abgeklebt out ist zu Custom-Chips denken. Zufälligerweise auch im März dieses Jahres, nach ausländischen Medien Berichte von Informationen, Amazon verwendet wird, intelligentes Design Gewohnheit zu unterstützen Speaker Echos AI-Chip sagte damals, dass Amazon bereits 449 Mitarbeiter mit Chip-Know-how und -Fähigkeiten hat.
Es gibt ein Prinzip in benutzerdefinierten Chips, das heißt, es muss genügend Menge vorhanden sein, um die Kostendeckung zu unterstützen.Was Rokid, Spirit, wie viel kostet Amazon in den Chip-Anpassungsprozess, hängt davon ab, wie viele Terminals verkauft werden, um sich zu erholen Keine detaillierte Informationen erhalten, aber Hangzhou Guoxin Lingyun sagte, dass ein Chip einen Break-Even-Punkt erreichen sollte.Zumindest das Terminal mit diesem Chip sollte Dutzende Millionen Meter erreichen.Wenn es angepasst wird, ist es mindestens eine Million.
Rokid Mitbegründer Wang Yude sagte auch, dass der wichtigste Punkt der benutzerdefinierten Chip ist die Menge, der Hauptgewinnpunkt des Chips, sollte das Volumen mehr als fünf Millionen erreichen.
"Das ist auch der Unterschied zwischen Guoxins AI-Chip und Google, NVIDIA-AI-Chip", sagte Lingyun, Google, NVIDIA ist mehr im Cloud-Chip, Cloud-Chip ist nicht anfällig für Kosten und Stromverbrauch und die Größe eines einzelnen Chips Kann viel tun, aber die Stirnseite ist anders, die Endseite muss vom Anwendungsszenario beginnen, entsprechend der tatsächlichen Szene, um Anpassung zu tun, sobald der Verkauf dieser Szene ist schwierig, die Kosten der Chipanpassung zu unterstützen, wird es Geld verlieren.
Welche effektiven Lösungen gibt es kurzfristig? "Lingyun betonte:" Die Anpassung eines Chips von Grund auf ist nicht sinnvoll, und der Kostenzyklus ist zu lang. Es wird empfohlen, dass die Chip-Firma die Chip-Entwicklung so weit wie möglich definiert. Bei Anwendungsszenarien wird außerdem empfohlen, dass nachgelagerte Anbieter häufig mit vorgelagerten Chip-Unternehmen kommunizieren, damit die Chip-Anbieter die Kundenanforderungen im Front-End-Design so gut wie möglich berücksichtigen können, so dass keine zusätzlichen Kosten entstehen.
Derzeit ist es selbstverständlich, basierend auf Rokid, Wolke bekannten Sound AI-Chip und stellen die AI-Modul Produkte auf den Markt zu verbreiten begonnen, gibt es Unternehmen, hat eine Million Aufträge erhalten, was ein gutes Zeichen ist. Rokid Zhou Jun Mikro-Set erzählt Netzwerk-Reporter: ‚Derzeit Programm Rokid Chip ist gereift, wie das Internet-Unternehmen Kinder-Bildungsmarkt mit gewesen ist, sind wir besser Custom-Chip zuversichtlich Kunden eine bessere Entwicklung zu unterstützen.‘
Als do ‚Kern‘ Hersteller, Transit Mikro intelligente Sprachplattform Lao Mao Yuan, Chef der Firma, sagte: ‚hundert Kisten die KI Stimme Interaktion Kampf ein heißer Fokus worden, aber intelligente Lautsprecher Spitze des Eisbergs, alle Dinge ist Internet das ultimative Ziel: Ein Chip kann nicht alle Märkte abdecken, wie zum Beispiel KI-Speaker-Chips können nicht ins Auto gebracht werden. Wir bleiben auf unserer eigenen Route, machen spezielle KI-Sprachchips und kundenspezifische Lösungen.
Alles in allem ist AI Custom-Chip Kosten ein großes Problem, aber viele der Befragten stimmen nach wie vor, dass Szene benutzerdefinierten Wert AI Chip größer sein wird, der allgemeine Trend. Was, wie die Kosten Problem zu lösen, müssen wir Rokid, Wolke bekannt Sound sehen, denken Spitzer, von AI individueller Chip-Unternehmen vertreten, die Fähigkeit, sogar innerhalb einer vorgegebenen Zeit zu brechen und so das Vertrauen in die Branche zu etablieren.