À l'heure actuelle, Qualcomm est activement dans les téléphones intelligents, Internet des objets, voiture intelligente et ainsi à faire avancer son terminal stratégie AI, tout en accélérant le développement de l'innovation technologique AI, construire l'écologie AI. Le sommet d'intelligence artificielle Qualcomm a récemment organisé, la personne en charge des départements concernés partagent La stratégie de développement, les progrès et les cas d'utilisation de la technologie Qualcomm à l'appui d'AI ont présenté le panorama de Qualcomm dans le domaine de l'IA.
Smartphone AI se concentre sur le visuel, la parole, AR trois aspects
Comme le domaine du géant des communications mobiles Qualcomm dans la promotion de la technologie de communication mobile, le développement terminal intelligent a fait d'énormes contributions. Après plus de dix années de développement, bien que le taux de croissance du marché du téléphone intelligent ralentit, mais avec des choses, 5G et autres groupes d'âge L'arrivée de la position de base du téléphone intelligent met une fois de plus en évidence.
Est attendu en 2018-2022 ans, les livraisons cumulatives de téléphones intelligents seront plus de 8,6 milliards de dollars. Cela signifie que la technologie AI est largement utilisée dans le domaine des téléphones intelligents ont un large espace. Le téléphone intelligent est la plus grande intelligence artificielle plate-forme d'innovation dans le domaine. Aujourd'hui, La popularité meurtrière des fabricants de téléphones mobiles dans le domaine de l'IA peut déjà illustrer ce point.
Selon Gary Brotman directeur Qualcomm de la gestion des produits mis en place dans le domaine des téléphones intelligents AI, Qualcomm met l'accent sur trois aspects:
Tout d'abord, le champ visuel de la grippe aviaire. Des fabricants de téléphones mobiles actuels utilisent AI de vue, les aspects les plus visuels de l'IA, comme la reconnaissance faciale pour déverrouiller, paiement, appareil photo et la sagesse, la beauté, et ainsi, sur la technologie visuelle d'une main AI est relativement mature, d'autre part Les utilisateurs de téléphones mobiles connaissent une forte demande dans ce domaine.
La seconde est la voix AI, utilisant la voix et les terminaux intelligents pour communiquer le dialogue et une meilleure interaction.
En troisième lieu, la réalité augmentée (AR), plus le domaine de la puissance de calcul de terminal à forte intensité requise par AR, en utilisant l'environnement et obtenir un soutien commun pour tous les capteurs sur les téléphones intelligents, par le biais de la réalité virtuelle et de l'intégration, de divertissement en temps réel, l'éducation Et rappelez les services.
Près de trois ans, plate-forme AI pour la fin téléphones intelligents, Qualcomm a conduit l'évolution de la technologie trois générations AI. Dans ce processus, l'évolution continue de l'architecture des algorithmes AI, la fonctionnalité et les capacités de la plate-forme sont de plus riches et les puissants en même temps Qualcomm construit également progressivement l'ouverture de l'écologie de l'IA.
La première génération de plate-forme AI est Xiaolong 820. Les chercheurs et les développeurs commerciaux peuvent fonctionner réseau de neurones sur le processeur, est typique Caffe course. Caffe a été le plus courant dominant de l'architecture, la recherche et le développement liés est la base de nombreuses zones commerciales, peuvent être directement Mettez la formation de réseau de neurones sur le CPU terminal.
La deuxième génération Snapdragon 835, introduit SDK du moteur de traitement neural., Tant par une coopération approfondie avec Google et Facebook à condition que le cadre de soutien optimisé tensorflow et Caffe2 sur le côté terminal. Cela donne aux développeurs grands Commodité, en fonction de leurs besoins, choisissez le bon noyau matériel pour supporter les opérations d'IA.
En décembre de l'année dernière, la technologie AI de troisième génération a été intégrée au Xiaolong 845 de Qualcomm, ce qui a permis d'augmenter la puissance de calcul de chaque cœur et d'étendre son support à d'autres frameworks de réseau neuronal. en travaillant directement avec les fournisseurs cadres du réseau de neurones, d'autre part, a également soutenu ONNX format d'échange, peut facilement fournir plus de flexibilité pour les développeurs, sans se soucier de ce que le support matériel de réseau sous-jacent.
Qualcomm moteur AI AI Engine se compose d'une série de composants matériels et logiciels conçus pour rendre le côté terminal AI apportent une grande efficacité et flexibilité pour les développeurs. Sur le matériel, en optimisant la CPU, GPU et DSP, pour répondre aux différentes applications de l'intelligence artificielle Exigences de scène pour la consommation d'énergie, les réseaux de neurones, les charges de travail et l'efficacité énergétique.
Du côté logiciel, via le SDK, vous pouvez soutenir l'environnement NN Android, il prend également en charge Hexagone NN, si le développeur choisit d'utiliser Hexagone DSP pour faire le développement, la bibliothèque Hexagone NN peut être optimisé spécifiquement pour un noyau particulier pour atteindre une efficacité énergétique optimale. Tout cela apporte une grande flexibilité aux développeurs et aux clients et les aide à optimiser les performances.
Du point de vue industrie, seulement Hass licorne 750 ensemble distinct unité AI NPU et Qualcomm, MediaTek encore par le biais de l'informatique distribuée. Gary Brotman estime que l'expérience AI smartphone ne compter que sur un noyau spécifique, plus important encore, Il nécessite de multiples architectures et de multiples outils.A l'heure actuelle, l'architecture distribuée peut pleinement répondre aux besoins des téléphones intelligents pour les fonctions AI.
AI Voice Personal Assistant: Interface utilisateur transformative
De nombreux importants cas d'utilisation de l'intelligence artificielle de nécessité de soutenir tous les aspects de la capacité, après l'IA visuelle mature, AI est considéré comme l'étape suivante dans la voix AI, les assistants numériques personnels sont devenus un important cas d'utilisation, comme la fin de l'assistant vocal de téléphone, haut-parleur intelligent et ainsi de suite .
Dans le directeur principal du chef de projet de recherche en intelligence artificielle Qualcomm et l'ingénierie vue Houji Lei, en temps réel est une caractéristique très importante d'un assistant personnel, à tout moment de fournir aux utilisateurs des services du point de vue de l'efficacité énergétique, assistant personnel toujours sur les caractéristiques haut rendement du modèle il y a des exigences très élevées en matière de personnalisation, comment fournir un service très personnalisé au niveau de l'audition, les intentions et le comportement, ainsi qu'un assistant personnel à une demande importante pour la personnalisation dans l'apprentissage, nous espérons que les assistants personnels informés des comportements individuels et ajuster en permanence le modèle, et de former et d'apprendre sur le côté terminal. du point de l'architecture du système de vue, connaissance de la situation est une caractéristique importante d'assistant de l'intelligence artificielle, le capteur et promouvoir l'intégration multimodale et multi-modale de l'apprentissage, est sa capacité à refléter l'avenir importante Angle
L'interaction vocale est une partie très importante de l'assistant personnel.La voix est l'interface d'interaction utilisateur révolutionnaire que nous attendions avec impatience, en particulier dans les scénarios d'application mains libres (sans utiliser les mains pour toucher le terminal). L'interface d'interaction vocale peut prendre en charge quatre fonctions très importantes: d'abord, elle est toujours allumée, elle doit toujours être en ligne, et elle est toujours prête à fournir des services, ensuite, le type conversationnel, l'assistant personnel ne mémorise pas les commandes. Troisièmement, la personnalisation, la façon dont les assistants personnels reconnaissent les mots et les phrases, et une compréhension claire des intentions, ce qui est également un aspect très important de l'interface d'interaction vocale Quatrièmement, la confidentialité, ne mettez pas les données Allez dans le nuage, mais faites beaucoup de traitement dans le terminal, ce qui est également une direction importante pour le développement futur de l'interface interactive vocale.
En fait, en tant que direction de recherche, l'interaction de la parole existe depuis plus de 50 ans.Hou Jilei a fait remarquer qu'il y a une vingtaine d'années, l'apprentissage automatique était un apprentissage automatique traditionnel, pas celui d'aujourd'hui. L'apprentissage profond, à l'époque à travers le modèle gaussien, a permis d'atteindre certains indicateurs de performance: avec l'émergence et l'exploration de l'apprentissage profond, les réseaux neuronaux convolutifs et les réseaux neuronaux récursifs sont constamment appliqués à la scène interactive interactive. La tendance importante est la suivante: les indicateurs de performance de la reconnaissance vocale vont bientôt approcher ou même dépasser la précision humaine.
"Lorsque cet important seuil a été franchi, un grand nombre de scénarios d'applications vocales interactives et de modèles commerciaux, tels que les biens de consommation, les entreprises et l'industrie, seraient bientôt fouillés."
Une autre tendance importante est la fonction d'interaction vocale migre rapidement du nuage vers le côté terminal. Aujourd'hui, d'un point de vue commercial plutôt que de R & D, mais aussi une plus grande interaction vocale est une architecture cloud centrée. Même dans ce cas , pour certaines fonctions de faible puissance, les considérations en temps réel, comme l'interaction vocale nécessaire réduction du bruit et de l'activation vocale de la parole ont été traitées sur le côté terminal. Départ pour migrer du côté terminal est un processus graduel, y compris rapide la reconnaissance vocale, la compréhension du langage naturel, et le texte de synthèse vocale (TTS), y compris plus de fonctionnalités évolueront progressivement au centre côté terminal par l'interaction de bout en voix axée sur l'apprentissage de la machine est le moteur de la tendance à migrer vers le côté terminal. Hou Ji Lei dit la voix du nuage vers l'interaction terminal est l'évolution de la vie privée, une réponse rapide et d'autres avantages. la direction du développement futur à long terme de l'interaction vocale doit être étroitement intégrée à la borne de nuages. modèle pour la formation, les mises à jour du modèle, base de connaissances, ainsi que une application plus large Les services, le traitement dans le cloud peuvent être mieux complétés avec le terminal.
L'IA apporte des opportunités et des défis à l'Internet des objets et aux voitures intelligentes
Aujourd'hui, beaucoup soutiennent le côté terminal de l'intelligence artificielle du terminal de choses a été mis sur le marché, y compris haut-parleur intelligent, assistants intelligents, des caméras intelligentes, des centres d'accueil, aspirateur intelligent, etc. Par exemple, dans le centre de la maison, le haut-parleur intelligent et intelligent application intelligente d'assistant vocal l'application dans un appareil en réseau dans la classification de l'image, la classification des objets et la reconnaissance faciale en robotique, comme aspirateur intelligent appliqué pour éviter les obstacles. dans l'ensemble, la partie terminale de l'intelligence artificielle se développe rapidement, que les choses donnent une forte impulsion.
Selon Shardul Brahmbhatt, chef de produit senior de Qualcomm, les cas d'utilisation de l'intelligence artificielle côté terminal de Qualcomm pour l'Internet des objets sont généralement divisés en trois catégories: la vision, l'audio et le traitement des capteurs.
Brahmbhatt présenté deux cas, l'un dans le domaine de la sécurité d'entreprise, en utilisant la détection de la personne, la reconnaissance faciale et détection de visage pour identifier, évaluer le bâtiment dans les employés de l'entreprise et les non-salariés, afin d'assurer que le système de sécurité du signal d'alerte précoce dans le côté terminal peut être envoyé à la place revenir au nuage pour le traitement. un autre cas d'utilisation est la sagesse de la ville. dans ce cas d'utilisation, le côté terminal de l'intelligence artificielle peut aider à la reconnaissance de plaque d'immatriculation, d'avertissement de collision et la surveillance du trafic.
Aujourd'hui, que ce soit un dépôt traditionnel, ou de nombreuses nouvelles entreprises Internet, ainsi que de nombreuses entreprises licorne émergentes veulent être en mesure de saisir l'avenir du marché automobile. A propos de l'avenir de la voiture, Qualcomm a identifié trois directions. D'abord, la voiture avec toutes Internet choses. si 4G, 5G ou future aujourd'hui, d'ici 2021 plus de 70% de la voiture soutiendra la mise en réseau automobile. de nombreux grands constructeurs automobiles nationaux et étrangers atteindront cent pour cent de couverture dans la voiture en réseau cette année ou l'année prochaine. en second lieu, changer le conducteur et le passager l'expérience utilisateur. au fil des ans, la plate-forme d'info-divertissement de voiture de l'écran sans le développement rapide de grand écran et multi-écrans, des systèmes entièrement d'exploitation numériques et multiples, tout en offrant une multitude de services de cloud computing et du contenu interactif. en troisième lieu, pour l'avenir automatique Conduire paver le chemin.
Selon le directeur principal du marché des produits Qualcomm Ye Zhiping, à l'heure actuelle, les principaux constructeurs automobiles utilisent la technologie de Qualcomm et des solutions en matière de technologie de connexion, Qualcomm est la plus grande télématique et les fournisseurs Bluetooth automobile du monde, avec plus de dix ans d'expérience .
« Le principal programme d'info-divertissement de la prochaine génération de Qualcomm a été la variété supérieure sera 2019-- 2020 la production de masse de la voiture en utilisant, qui est, du grand écran à multi-écrans et multi-OS 2017 années fiscale, Qualcomm a gagné 25 nouvelle voiture. l'information et de dessins infotainment. 25 top constructeurs automobiles à travers le monde ont été 14 marques de voiture choisissent d'utiliser la plate-forme Snapdragon dans sa conception d'info-divertissement automobile, la production de masse sur leur prochaine génération de voitures. 2019 et 2020 La première génération de processeur de voiture Xiaolong 820 entrera dans la production de masse. "Ye Zhiping a déclaré.
Pendant ce temps, Ye Zhiping a souligné qu'une série de voiture intelligence artificielle pour faire face aux défis et aux exigences. La première est la sécurité, la voiture aura beaucoup de données sur la vie privée des utilisateurs, comme des visages ou des empreintes digitales. En second lieu, la voiture doit être en mesure de répondre instantanément à l'intelligence artificielle, tels que dans le pilote automatique, le délai doit être considérablement réduit. en troisième lieu, l'aspect pratique et la fiabilité de la grippe aviaire doivent fonctionner dans un état de la matière, en particulier dans certaines zones sans couverture réseau. Enfin, il y a aussi les défis en matière d'efficacité thermique et l'efficacité énergétique.
Ye Zhiping dit qui implique généralement l'intelligence artificielle va alimenter jusqu'à 100 watts, les voitures et plus de 60 watts, le serveur (couper encadré) les exigences de conception dépassent 60 watts doivent être équipés d'un système de refroidissement. Pour le spectacle en termes de conception actuelle est possible, et avoir un coût raisonnable et sans perdre de l'espace intérieur des véhicules autonomes pour atteindre la production réelle, la technologie actuelle ne peut pas atteindre. que de plus en plus de voitures électriques ont commencé sur le marché, la consommation d'énergie et le kilométrage de la batterie est une grande considération .