Du retard mental à l'intelligence | La reconnaissance optique et vocale a pris 100 ans

Il n'y a pas longtemps, la version chinoise Bixby Open beta, bien que ce ne soit pas Bixby De la première version, mais cela signifie que le nouveau géant de la voix a commencé à entrer sur le marché chinois trouvé dans nos tests, Bixby Avoir un bon taux de reconnaissance, vous pouvez réaliser le déverrouillage vocal, la conversion de texte vocal, et les utilisateurs peuvent appels vocaux aux messages texte du téléphone, le contrôle logiciel, l'accès au contenu tiers et d'autres opérations.En un sens, le téléphone Avoir atteint la compréhension de la voix humaine.

Il a fallu 100 ans d'un retard mental à une reconnaissance intelligente de la lumière à la parole

Quand nous voyons dans les films de science-fiction intelligence artificielle peut dialoguer avec l'humanité, mais aussi était très haute technologie, en fait, assistant vocal a déjà tranquillement dans nos vies, de sorte que lorsque vous voyez est maintenant pas de bons produits voix se sentira étrange. dans l'esprit de la plupart d'entre nous, l'assistant vocal est encore relativement « handicapés mentaux » existe, en fait, cela aussi ne peut pas être refusée parce que la machine n'est pas la sagesse, il est pas comme les gens pensent, ou que ce n'est pas un assez pour faire penser à l'énorme système. mais tout aussi indéniable que l'intelligence artificielle de reconnaissance vocale a déjà une assez grande échelle.

La reconnaissance vocale a apporté un grand confort

Pour un exemple très commun, la plupart des téléviseurs réseau prend désormais en charge la fonction de recherche vocale, ce qui est d'utiliser la télévision a apporté un grand confort parce que la batterie est encore un dispositif d'entrée de commande à distance, il ne peut pas rivaliser avec l'efficacité d'entrée du clavier, mais les supports voix, tant que la voix d'entrée des commandes du téléviseur, vous pouvez compléter interactive, très pratique. en outre, la reconnaissance vocale interactive est également une aubaine pour l'équipement des aveugles. son rôle ne doit pas être négligé.

Assistant vocal du téléphone (image du réseau)

Je crois que beaucoup de lecteurs qui ne se soucient pas de la reconnaissance de la parole ont de telles questions: Frère, vous plaisantez? Siri Tirez quelques mots, ainsi que la maison de haut-parleur intelligente sur assistant vocal ordinaire Eh bien, vous êtes vraiment comment hasardeux? Haut-parleur intelligent et le prix est pas cher Eh bien, salut-technologie, comment donc pas cher? Aussi pour ne pas mentionner, le développement d'assistant vocal est vraiment pas un petit projet. et en général, il est difficile de compter sur leur propre assistant vocal de l'argent, au moins lorsque vous utilisez la dictée vocale, les fabricants d'entrée ne vous facturer, donc il n'y a pas de soutien financier solide est difficile à respecter Revenu du jour.

La reconnaissance vocale est également insipide (images du réseau)

Maintenant, nous allons voir le fabricant de la publicité de l'assistant vocal, nous disons que notre précision a atteint quelques pour cent. Pour l'instant, le taux de précision atteint 90%Ce qui précède est assez bon.Bien que nous ayons un tel taux de précision, mais nous sentons encore certains des assistants vocaux insipides, qui est la complexité de la langue, l'interface tierce a une excellente relation entre l'intégrité de l'école de la fièvre actuelle, nous Pour parler de la réalisation de la théorie de la reconnaissance vocale, ainsi que du statu quo et du développement futur de la reconnaissance vocale, imaginez quand l'intelligence artificielle gouvernera le monde.

Cet article appartient à l'article original, s'il est réimprimé, s'il vous plaît indiquer la source: de l'intellectuel retardé à la reconnaissance intelligente de la lumière et de la voix a pris 100 ans http://mobile.zol.com.cn/665/6656792.html

Reconnaissance vocale pour atteindre le principe: base de données

En résumé, le principe de la reconnaissance vocale n'est pas difficile à comprendre: le principe de la reconnaissance des empreintes digitales est le même sur la grande surface: le dispositif recueille la parole cible puis effectue une série de traitements sur le discours recueilli pour obtenir l'information caractéristique du discours cible. La similitude entre l'information et les données stockées dans la base de données est comparée et le score le plus élevé est le résultat de la reconnaissance, puis la fonction de reconnaissance vocale du dispositif est complétée par l'accès d'autres systèmes.

Identifiez brièvement le processus

Si vous êtes intéressé par la reconnaissance de la parole est pas élevé, connaît alors ce principe général est suffisante. Le processus de reconnaissance vocale est assez complexe En fait,. La raison la plus directe est que la complexité de la voix d'identification des empreintes digitales tant que les informations d'empreintes digitales d'entrée informations de base de données correspond à l'identification stockée peut être terminée, la base de données contient des données de seulement quelques informations d'empreintes digitales seulement. mais la voix est tout à fait différente.

« Dictionnaire Kangxi » (citation d'antiquités chinoises Réseau)

« Kangxi » caractères chinois détiennent 47035Ce qui a été compilé par plus de trente savants célèbres à l'époque pendant six ans, alors que le chinois n'est pas seulement un caractère chinois isolé, mais a aussi une montée et une chute dans la langue, un sentiment de sentiment et une compréhension différente des sémantiques différentes. Ne parle pas mandarin, il y a beaucoup de dialectes, vous voulez construire une base de données de langue parfaite peut imaginer comment difficile. La complexité chinoise est Bixby Version chinoise plus tard que la version anglaise de la raison.

La reconnaissance vocale de haute précision ne peut être séparée sans une énorme base de données en nuage (images du réseau)

La base de données en langage large est difficile à placer sur le terminal mobile, raison pour laquelle presque tous les assistants vocaux mobiles doivent réseauter lorsque le développement de la reconnaissance vocale n'est pas sans la version hors ligne, mais nous pouvons facilement trouver la version hors ligne Plus bas que la version en ligne. En outre, nous venons de mentionner que de nombreux fabricants de voix ont affirmé que le taux de précision atteint 90%Ci-dessus, cela peut être considéré comme très remarquable, il n'est pas exagéré de dire que cette fois chaque mise à jour 1Un pourcentage du taux de précision est un saut qualitatif.Ce n'est pas seulement à une base de données assez complète, pour répondre à un tel taux de précision doit être un algorithme de reconnaissance plus efficace et un système d'auto-apprentissage.

Bien sûr, ces données nous voulons point de vue dialectique, dit le proverbe, une centaine de mots différents qui peuvent être décrits comme langue chinoise et profonde, donner les fabricants et tester la précision des données est difficile d'avoir étendu, de sorte que certains utilisateurs d'utiliser la reconnaissance vocale il a également qu'il est « retardé mental », il est fonction normale.

Cet article fait partie de l'article original, devrait réimprimer, s'il vous plaît indiquer la source: de déficience intellectuelle à la reconnaissance vocale de passé optique intelligent 100 ans http://mobile.zol.com.cn/665/6656792.html

http://mobile.zol.com.cn/665/6657840.html mobile.zol.com.cn true Zhongguancun en ligne http://mobile.zol.com.cn/665/6656792.html rapport 1512 Le principe de la reconnaissance vocale: résumé de la base de données, principe de reconnaissance vocale n'est pas difficile à comprendre, la même grande reconnaissance faciale et empreintes digitales principe: le dispositif cible pour recueillir une voix, puis recueilli une série de traitement de la voix pour obtenir la voix cible fonction des informations, puis laissez-les informations caractéristiques et des données qui existe déjà dans la similitude de base de données de recherche de comparaison, le score le plus élevé est le résultat de la reconnaissance. alors ...

Le principe de la reconnaissance vocale: algorithmes et auto-apprentissage

Nous avons mentionné plus haut l'algorithme de reconnaissance et le système d'auto-apprentissage, dont nous pouvons brièvement comprendre le processus de travail: d'une part, le système de reconnaissance vocale prétraite le discours cible, très compliqué, incluant l'échantillonnage du signal vocal; Filtrage anti-repliement, suppression des différences de prononciation et de l'équipement, effets de bruit ambiant, etc. Le discours traité est ensuite extrait.

Forme d'onde de la voix numérique (images du réseau)

Nous savons que l'essence du son est la vibration, qui peut être exprimée par la forme d'onde, l'identification doit encadrer l'onde, un certain nombre de cadres forment un état, trois états constituent un phonème. Un 39Phonèmes phonèmes constitué chinois en général directement avec toutes les initiales et finales comme phonèmes, en plus de reconnaissance vocale divisé en ton atonale. Après avoir passé à travers les mots de synthèse du système de phonèmes ou des caractères. Bien sûr, l'appariement et le traitement post contenu après nécessite également un correspondant Algorithme à compléter.

Forme du texte de sortie du processus d'identification

Le système est auto-apprentissage est dirigé plusieurs bases de données. Conversion de la parole dans le système de reconnaissance vocale de texte ont deux bases de données, une base de données de modèle acoustique peut être identifié avec les informations extraites, la deuxième est une mise en correspondance texte base de données de la langue les deux bases de données nécessitent de grandes quantités de données à l'avance de l'analyse du modèle de formation, également connu sous le système d'auto-apprentissage pour extraire le modèle de données utiles bases de données consiste, en outre, dans le processus de reconnaissance, le système d'auto-apprentissage sera utilisateurs résumé habitudes et trouver des moyens et des données sommaires à une base de données, ce qui permet un système de reconnaissance plus intelligent pour l'utilisateur.

Toujours résumer en outre l'ensemble du processus d'identification: une voix cible collecte de la partie d'acquisition de la parole traitée contient des informations critiques - l'extraction d'informations clé - la plus petite unité de mots de reconnaissance, le dispositif d'analyse syntaxique prédéterminée - phrase analyse sémantique, la clé de contenu Arrangement de la phrase, ajuster la composition du texte - en fonction de l'information globale pour modifier la légère déviation du contenu.

http://mobile.zol.com.cn/665/6657841.html mobile.zol.com.cn true Zhongguancun en ligne http://mobile.zol.com.cn/665/6656792.html rapport 1278 Reconnaissance vocale Le principe: algorithme d'auto-apprentissage et la reconnaissance que nous venons de mentionner des algorithmes d'extraction et système d'auto-apprentissage, où nous pourrions simplement regarder leur processus de travail: Tout d'abord, le système de reconnaissance vocale pour cible pré-traitement recueilli de voix, ce processus a été très complexe, comprenant des échantillons de signal de parole, filtre passe-bande anti-aliasing, et supprimer les différences individuelles des équipements prononcent, induite par l'environnement ...

Statut de reconnaissance vocale et futur

Radio Rex Chien jouet

AI ne peut pas du jour au lendemain ont éclaté dans la deux dernières années, la reconnaissance vocale ne fait pas exception. De la reconnaissance vocale prototype initial, jusqu'à présent, 90%Le taux de précision ci-dessus, il y a déjà environ 100Des années d'histoire. Radio Rex La production de chiens-jouets au siècle dernier 20L'ère, ce chien de jouet peut être appelé quand il surgit, est considéré comme l'initiateur de la reconnaissance vocale.Dans le vrai sens de la reconnaissance vocale a commencé au siècle dernier 50Âge, AT & T Bell Construit en laboratoire Audry Système pour atteindre la reconnaissance vocale numérique dix anglais.

Et récemment chaud NPU Réseau de neurones, dès 60L'âge a été utilisé pour la reconnaissance de la parole.Le grand vocabulaire, la parole continue, trois caractéristiques non spécifiques basées sur un Sphinx Le système est né en 80Fin de l'année 90Depuis l'année est le moment idéal pour le développement de la reconnaissance vocale, la technologie de reconnaissance vocale aux organismes gouvernementaux en accordant une attention, de nombreuses entreprises bien connues commencent à investir massivement dans ce domaine, un grand nombre d'institutions de recherche de haut niveau ont rejoint le domaine de la recherche de reconnaissance vocale, un temps Réalisation importante

Dictée vocale IETF

Aujourd'hui, la reconnaissance vocale a fait une percée. 2017Année 8Mois 20Jour ,Taux d'erreur du système de reconnaissance vocale Microsoft de 5.9%Réduire à 5.1%, Peut atteindre le niveau des sténographes professionnels, leader domestique dans le domaine de la reconnaissance vocale, la précision de la dictée vocale ItexamTech est atteint 95%, Performances difficiles domestiques comme Ali, Baidu, Tencent et d'autres grandes entreprises ont également fait leur reconnaissance vocale, la perspective d'un prometteur.

IETF Voice Assistant Voix du système de poisson volant (photo du réseau)

Et le système de reconnaissance vocale non seulement juste pour les téléphones mobiles Interagir mentionné plus haut, commande de haut-parleur intelligent, jouets, meubles, maison, voiture, judiciaires, médicaux, éducatifs, industriels et bien d'autres domaines, le système de reconnaissance vocale jouer ne peut pas être ignoré Après tout, à une époque où l'intelligence artificielle ne fait que commencer, la voix interactive est le moyen le plus efficace d'interaction homme-ordinateur avant que les appareils puissent facilement détecter les pensées humaines.

Ecrire à la fin

Voir ici, je crois que nous avons une compréhension générale de la reconnaissance vocale.Nous voyons dans les téléphones mobiles, la reconnaissance vocale de haut-parleurs intelligents, la reconnaissance vocale est seulement le domaine de l'iceberg, et nous verrons dans le futur aura Plus de formes de reconnaissance de la parole sont utilisées dans tous les aspects de la vie quotidienne, comme les systèmes de reconnaissance de la parole avec des voitures sans conducteur.Quand vous dites à une voiture où aller, la voiture peut automatiquement vous atteindre à votre destination.

Intelligence artificielle, quand régnera le monde, ce problème n'est pas bon de dire que l'intelligence artificielle a maîtrisé les compétences linguistiques naturelles, même si par rapport à la capacité du langage humain est encore très jeune, mais peut être basé sur le contenu correspondant Les conditions de la sagesse sont, en un sens, le résultat de l'intégration d'une fonction fondamentale des êtres humains, mais apparemment ce n'est pas quelque chose qui nous inquiète, et il est bon d'attendre et de profiter des bienfaits de l'intelligence artificielle.

http://mobile.zol.com.cn/665/6657842.html mobile.zol.com.cn true Zhongguancun en ligne http://mobile.zol.com.cn/665/6656792.html rapport 1851 le statut de reconnaissance vocale quo et l'avenir du chien de jouet Radio Rex (Photo cité du réseau) l'intelligence artificielle ne peut pas arriver épidémie du jour au lendemain au cours des deux dernières années, la reconnaissance vocale ne fait pas exception. A partir du premier prototype de la reconnaissance vocale, et maintenant plus de 90% le taux de précision il y a déjà environ 100 ans. chien de jouet Radio Rex sur la production des années 1920, quand ce chien de jouet peut appeler ...