Le contenu suivant a été rassemblé depuis que la porte CTO, le fondateur de la fondation du capital-risque Shen Qiang a enregistré.
Nous parlons aujourd'hui de l'intelligence artificielle au sommet des semi-conducteurs, et je pense que c'est une occasion particulièrement bonne, car la plupart des employés de l'intelligence artificielle proviennent de l'industrie du logiciel et, lors du sommet des semi-conducteurs, une réunion particulièrement difficile La discussion de l'intelligence artificielle, le dialogue dur et doux et la coopération entre la plate-forme parfaite, et l'intelligence artificielle entre les deux côtés de la coopération innovante créera un merveilleux infini!
Nous disons que les trois éléments techniques essentiels du développement actuel de l'intelligence artificielle sont l'algorithme, le pouvoir informatique et les données, et du point de vue de l'innovation, la direction principale de l'innovation en intelligence artificielle est l'algorithme, le pouvoir informatique et la scène.
Maintenant, nous pouvons voir que l'intelligence artificielle n'est pas seulement un concept, mais a progressivement progressé dans tous les domaines de la vie, y compris l'électronique grand public, la santé, les finances, le commerce de détail et de nombreux autres domaines. L'intelligence artificielle pénètre dans l'industrie, devient un remodelage à chaque Le pouvoir d'une industrie La force de l'industrie se caractérise par une structure multi-couches, y compris de nouvelles infrastructures informatiques, y compris les puces d'AI, les algorithmes d'apprentissage en profondeur et les technologies de support utilisées dans l'image et dans d'autres domaines. Les couches techniques de l'intelligence artificielle sont-elles?
Et l'intelligence d'affaires générée par la valeur de l'expérience est présentée dans la couche d'expérience. La couche d'expérience AI peut être une expérience 2B, il peut s'agir de l'expérience 2C, c'est-à-dire son application spécifique, tandis que la technologie de l'intelligence artificielle connaît la valeur de la couche, Combinaison logicielle et matérielle ouverte. Si la sécurité, les véhicules aériens sans pilote et l'avenir peuvent avoir plusieurs trillions de marché de la conduite automatique, nous les trouverons pour les réaliser, la collecte en temps réel de grandes quantités de données doit supporter la couche de perception du matériel, le noyau du traitement des données Besoin de s'adapter aux caractéristiques de l'intelligence artificielle en calculant le support de puce, et les résultats de l'informatique intelligente doivent être réalisés grâce au matériel pour réaliser la fonction. Si les exigences de la puce, les exigences du capteur, les exigences d'expérience fonctionnelle sont l'intelligence artificielle et les semi-conducteurs Industrie combinée pour offrir une bonne opportunité.
1 innovation de scène
En ce qui concerne les scènes d'innovation en intelligence artificielle, il existe des domaines d'application familiers, comme la sécurité intelligente, la conduite automatique, les véhicules aériens sans pilote, les haut-parleurs intelligents, les robots, etc. Mais en plus de ces scènes plus grandes, en fait, si nous creusons avec soin La valeur commerciale de l'intelligence artificielle, des scènes innovantes est omniprésente.
Je voudrais parler d'un cas particulièrement particulier. Il y a quelque temps, je voyage souvent à l'extérieur, personne à la maison, il y a des problèmes, c'est-à-dire ma famille, personne ne s'occupe du chat, puis j'ai eu une machine automatique d'alimentation pour animaux de compagnie, Cet appareil peut m'aider tous les jours en fonction du temps et de la nourriture pour nourrir le chat, sans aucun doute, c'est un très petit segment de marché. Ensuite, j'ai rencontré cette société automate automatique de la compagnie d'alimentation CEO, le chat quand il m'a dit L'intelligence artificielle et l'alimentation des animaux de compagnie ont une excellente relation. Je me demande comment vous tous les jours, les aliments à point fixe et l'intelligence artificielle ont quelque chose à faire. Il a déclaré que de nombreux utilisateurs abritent plus de chats, différents chats à différents stades d'âge, différents De l'état physique, les besoins quotidiens de manger ne sont pas les mêmes. Par exemple, l'utilisateur à gérer la santé du chat, pour contrôler le poids du chat, afin que chaque chat ait un programme d'alimentation personnalisé. Cette machine d'alimentation automatique est déjà équipée d'une caméra, l'original Est-ce qu'il faut faire la surveillance à distance avec l'hôte, et maintenant utiliser la caméra pour collecter l'image pour faire une alimentation intelligente. D'autres font la reconnaissance du visage, je veux faire une reconnaissance de visage de chat - Je veux savoir quand Quel type de chat est la nourriture avant de manger, et je vais lui donner un service d'alimentation personnalisé basé sur la situation actuelle.
Donc, même dans une si petite scène, lorsque nous combinons l'intelligence artificielle, nous pouvons également créer une petite scène dans la valeur commerciale d'une telle scène est omniprésente. Nous mettons l'accent sur la scène, car la scène Est la clé de la transformation de la technologie en entreprise, puis les algorithmes avancés, puis le pouvoir informatique avancé, si vous ne parvenez pas à trouver l'atterissage de la scène, nous pouvons difficilement le transformer en valeur commerciale.
Innovation 2 algorithmes
Derrière l'innovation de la scène, dépend du soutien de l'innovation matérielle du logiciel, nous examinons l'innovation du logiciel. Au cours des dernières années, le développement rapide de la technologie de l'intelligence artificielle est principalement motivé par la profondeur de l'apprentissage, cette partie est l'algorithme et le niveau de logiciel pour amener la force motrice , Bien que le noyau de l'apprentissage approfondi repose sur la profondeur des méthodes d'apprentissage du réseau neuronal.
L'histoire du réseau neuronal est très longue, la première à partir de 1943 sur le réseau neuronal proposé, au cours des dernières décennies, l'évolution du réseau neuronal après la montée et l'automne .1989 Yan Lecun a inventé la convolution du réseau neuronal, est aujourd'hui en pleine expansion Le réseau de neurones et le professeur Hinton en 2006 ont formellement présenté le concept de réseau de confiance profond et la définition de la profondeur de l'apprentissage de ce nouveau terme, mais la profondeur du déclenchement de l'éducation n'est qu'après 2012 qui a inauguré un tournant important, cette année, Hinton Les professeurs utiliseront le réseau de neurones de convolution basé sur le cadre de profondeur d'apprentissage appliqué au grand concours de reconnaissance d'image ImageNet, l'accès à un succès sans précédent, l'apprentissage approfondi a également reçu une attention sans précédent.
Le jeu ImageNet, qui peut être considéré comme une compétition olympique dans le domaine de la vision par ordinateur, est une variété d'arène de la technologie de l'intelligence artificielle. À partir de là, les résultats de chaque année, le jeu peut être vu, 2015 est en fait un noeud historique. Le taux correct de l'objet est d'environ 95%. Dans le Concours 2015 ImageNet, Microsoft Research Institute, grâce à la profondeur de jusqu'à 152 couches de réseau neuronal ResNet super profond, la première fois pour obtenir une précision supérieure à celle des capacités de reconnaissance visuelle humaine, Le taux d'erreur est de seulement 3,5%. Cela signifie que dans certaines circonstances spécifiques, l'ordinateur a pu remplacer le travail des personnes et une valeur commerciale énorme dès le début pour être activée.
Au fil des ans, la nouvelle structure du réseau neuronal a émergé et continue d'aller de l'avant et de la direction plus profonde, la concurrence ImageNet utilisée dans la profondeur du réseau neuronal, une courte période de 5 ans, le niveau a évolué de 8 couches à plus de 1000 couches Et ces algorithmes et logiciels au-dessus de l'innovation, dans le matériel apporte également de nouvelles exigences. Il existe un informatique réseau si complexe, tant du côté de la formation du serveur que du côté du raisonnement, doit être une puissance de calcul extrêmement puissante pour faire face à la profondeur du réseau neuronal La complexité de calcul requise.
Les algorithmes d'apprentissage de la profondeur peuvent être utilisés pour traiter les images, les sons et le traitement du langage naturel, mais le domaine le plus répandu concerne les problèmes liés à la vision par ordinateur. La vision de l'ordinateur peut être intégrée à plusieurs types de problèmes, à la classification de l'image, au positionnement, à la détection et à la segmentation. Dites cette image, la classification de la réponse est que cette image est un chat ou un chien, le positionnement devrait être souligné que le chat dans l'image de quelle zone apparaît, et la nécessité de détecter les différents objets, plus qu'un chat, plus de chiens séparés et La segmentation de l'instance doit distinguer les limites des pixels de chaque objet. L'algorithme basique de vision par ordinateur est la pierre angulaire des diverses applications d'intelligence artificielle, des applications de sécurité, des applications de robots Ye Hao, derrière sont inséparables du support de la vision par ordinateur.
Et la combinaison de la vision par ordinateur et de l'apprentissage en profondeur, le développement rapide de l'objet. Par exemple, l'algorithme de détection de reconnaissance d'objet dans le jeu de données PASCAL VOC sur le passé, avec l'algorithme R-CNN peut atteindre 53,3%, et maintenant utiliser R-CNN plus rapide À 83,8%. Performance de la mise à niveau R-CNN 0.5fps au YOLO 155fps. La segmentation des instances d'objet, dans l'ensemble de données COCO, la précision de segmentation à partir de 2015 CVPR FCN 62,2% à 74,7% actuel. L'application de l'extension de segmentation d'image est la segmentation de la vidéo. L'apprentissage en profondeur est également appliqué au champ de segmentation vidéo pour identifier l'objet de chaque image dans laquelle appartient la vidéo.
Il s'agit des problèmes traditionnels de la vision par ordinateur, tels que la reconnaissance de visage commune, le paiement par pinceau, la reconnaissance de gestes et d'autres applications, la grande majorité peut être classée parmi les quatre premiers types de problèmes et maintenant le niveau d'innovation de l'algorithme, L'innovation dans le logiciel fait partie de cela, nous voyons beaucoup de nouvelles technologies, pour activer les nouveaux scénarios d'application. Par exemple, nous voyons ici l'image, la conversion de vidéo à texte. Au contraire, de nouveaux algorithmes ont commencé à faire du texte à l'image De la conversion, comme la dictée utilisateur d'un passage, le système pour générer l'image correspondante. Voici une description de texte d'un avion volant dans le ciel bleu à l'intérieur, l'ordinateur a généré automatiquement une telle image de ce différent média entre la conversion, Nous pouvons non seulement consommer intelligemment des contenus numériques, mais aussi nous permettre de créer du contenu numérique de manière entièrement nouvelle.
Il y a plusieurs directions évolutives importantes à l'avenir, la première est l'évolution de l'apprentissage supervisé à l'apprentissage semi-supervisé et à l'apprentissage non supervisé. Nous savons que l'apprentissage supervisé dépend des données marquées pour la formation et l'apprentissage. Les progrès passionnants enregistrés dans ImageNet sont le résultat de l'utilisation de données marquées et bien qu'il y ait beaucoup de progrès sur les méthodes d'apprentissage supervisées basées sur des données marquées, il semble que nous examinons une large gamme de segments L'application de la scène est loin d'être suffisante.Pourquoi, la dépendance à un grand nombre de données d'étiquette est un coût énorme, et ce coût entrave l'innovation. Les grandes entreprises avec des données massives dans le développement de l'intelligence artificielle occuperont un avantage naturel, mais L'innovation de la panne de la scène est la nécessité de compter sur beaucoup de petites micro-entreprises pour réaliser, comment pouvons-nous faire de petites micro-entreprises peuvent participer au processus d'innovation en intelligence artificielle? Ne comptez pas sur les données d'étiquette de l'apprentissage semi-supervisé et non surveillé est la clé Le
La deuxième direction importante de l'apprentissage en profondeur est de réduire la dépendance à l'égard de la quantité de données pouvant être appris avec moins de données de formation.
Si les algorithmes d'intelligence artificielle peuvent compter sur des quantités massives de données, ne comptez pas sur les données marquées, vous pouvez utiliser une large gamme de données non marquées, réduire considérablement le coût de notre acquisition de données, en substance, est de créer une intelligence artificielle Les entreprises plus démocratiques, les grandes entreprises et les petites entreprises ont plus de pouvoir égal pour participer à cette compétition. L'industrie s'est rendue compte que l'on ne peut pas satisfaire à la supervision de l'apprentissage aujourd'hui, a besoin d'explorer davantage comment rompre la dépendance à l'égard des données, en fonction de l'absence Données de balises pour atteindre la capacité d'apprentissage.
Le concours ImageNet est basé sur des données étiquetées, et cette année est la dernière de sa dernière, et le sommet du concours WebVision dans le domaine de la reconnaissance de la vision par ordinateur est né. La principale caractéristique de la concurrence pour ImageNet est que l'ensemble de données est une donnée non pilote, C'est un tournant remarquable. Malheureusement, par la porte de participer à l'investissement du code, Long Technology a remporté la compétition WebVision de cette année dans le monde.
La troisième direction de l'innovation en apprentissage profond est d'évoluer à partir de la capacité cognitive de base de l'identification de base, l'orientation, la segmentation, etc. au niveau humain. Ici, nous voyons des exemples d'images automatiques basées sur le réseau de confrontation de génération conditionnelle (CGAN) Nous avons une brève description de texte, c'est-à-dire une question de texte, la figure suivante est basée sur le texte par l'algorithme CGAN, calculé automatiquement une carte de texte. Ici, nous pouvons voir que l'intelligence artificielle n'est pas seulement Peut être utilisé pour reconnaître le monde connu, mais aussi créer un monde inconnu.
L'application du réseau de confrontation a un cas d'application du constructeur d'aéronef qui utilise le réseau de neurones de confrontation intégrée pour concevoir l'aile de l'avion. La structure de l'aile de l'avion comporte beaucoup de méthodes de conception classiques, Les projections, combinées aux méthodes d'analyse des éléments finis pour faire le design.Open a déclaré, il n'y a aucune possibilité de briser le paradigme de conception existant, la conception d'un poids plus léger, une plus grande résistance de l'aile? Dans le passé, elles reposent sur l'expérience, définissent manuellement la direction de conception et ont Une certaine théorie de l'ingénierie de la méthode de conception, je ne peux pas la transmettre à l'approche axée sur les données pour la conception. Donc, ils ont conçu un réseau de confrontation de fond, par la machine en l'absence d'expérience faite par l'homme dans l'espace de solution infinie pour explorer l'aile Ce qui est surprenant, c'est que, comme le chien Alpha pour explorer les gens, il n'a pas pensé à un miracle, le processus de conception pour explorer une structure d'aile complètement nouvelle, cette structure est qu'ils ne penseront à aucun moyen L'aile peut également être fabriquée de la sorte, à la fois pour maintenir la force et pour maintenir un poids très léger.
Le laboratoire d'intelligence artificielle de MIT a développé la technologie de prédiction vidéo avec CGAN. Il a résolu le problème en disant que j'ai donné à l'ordinateur beaucoup de vidéos à apprendre, mais je n'ai pas fait d'étiquettes, puis l'ordinateur pour observer les changements dans le contenu vidéo entre les différents cadres Quelle est la tendance. Une fois que vous avez terminé et vous donner une nouvelle vidéo, lorsque la vidéo s'arrête, elle peut prédire les deux ou trois secondes suivantes, cette vidéo deviendra comme celle-ci, la prochaine image, la prochaine image, puis la prochaine image Quelle sorte de capacité de prévision est non seulement peut être utilisé dans le cinéma et la télévision dans certaines occasions clés, même l'application de la capacité de sauver des vies, comme un avertissement dangereux --- les lunettes de notre peuple et l'interaction du cerveau, pour de nombreuses situations dangereuses ont la capacité de juger Par exemple, en tant que personne en fuite, devant des marchandises dangereuses, nous pouvons rapidement trouver et interférer. Plus sérieux, comme il y a quelques années, au Xinjiang, des bandits sérieux dans des attaques terroristes publiques. Si nous pouvons avancer deux Deuxièmement, trois secondes pour prédire l'endroit où les voyous seront violents, et prononcer rapidement un avertissement, arrêtez-vous, nous pourrons économiser quelques étudiants précieux La vie.
Un autre exemple intéressant est la prédiction de l'action. C'est un réseau de confrontation une autre application très amusante. Le réseau adaptif peut voir la vidéo lorsque le personnel a prédit l'action de suivi, afin de voir deux personnes venir, vous pouvez deviner À l'étape suivante, ils se serreront pour se serrer la main pour voir cette vidéo, selon cette courte vidéo, l'ordinateur pourra spéculer que les deux maîtres s'embrassent. Nous avons ouvert le trou du cerveau, ces technologies peuvent penser à beaucoup d'applications.
Et certains de l'algorithme sur l'innovation, y compris le renforcement de l'apprentissage sur l'innovation, c'est la société DeepMind, je crois que beaucoup d'étudiants dans les premières années de la machine rouge et blanche ont joué au jeu BrickBreaker. La société DeepMind basée sur une technologie d'apprentissage améliorée a développé une Programme, ne comprennent pas les règles du jeu sous la prémisse de DeepMind laissez le programme à travers une caméra face à l'écran, observez les changements dans l'écran, prenez l'initiative d'apprendre les objectifs du jeu et les règles du jeu, puis lui donner la tâche autant que possible pour obtenir le meilleur score du jeu Le programme en cours de formation tout au long du jeu continue de comprendre les compétences du jeu, dans la vidéo, nous pouvons le voir dès le début pour jouer pourri jusqu'à la dernière après 240 minutes après que l'entraînement est devenu le maître supérieur, réellement trouvé dans le mur Cueillir la balle sur le mur et autour de l'éjection répétée et détruire automatiquement les briques.
Ces algorithmes et innovations logicielles ont réellement ouvert la voie à la voie générale de l'intelligence artificielle pour nous inspirer à créer l'avenir des possibilités infinies. Nous voyons également beaucoup d'entrepreneurs dans cet effort, en particulier pour leur respect Dédié au sommet de la percée de l'algorithme, il est dans l'avenir de nous donner plus de scénarios d'application à long terme pour fournir des armes à feu et des munitions indispensables.
3 forcer l'innovation
Le développement de l'algorithme n'est pas le développement du pouvoir informatique, qui est la pierre angulaire de l'intelligence artificielle dans la partie de l'informatique, et l'apprentissage par machine d'aujourd'hui doit s'appuyer sur une infrastructure à forte intensité de calcul - la quantité d'effort de calcul Trop, besoin d'avoir une architecture informatique spéciale pour faire face à la profondeur de l'apprentissage de la charge de travail de la profondeur d'apprentissage il existe deux types de tâches informatiques, une formation est un raisonnement, ces deux parties ont beaucoup de calcul.
Nous pouvons constater que les actions de NVIDIA ont augmenté de sept ans en deux ans, car les calculs exigés par l'intelligence artificielle exigent la demande d'architectures informatiques à haut débit. Il existe de nombreuses raisons dans le cloud, y compris Microsoft, Amazon, etc. Ces entreprises, Dans le domaine de l'équipement, il y a une variété de produits, au début de septembre, Huawei a annoncé la coopération avec le Cambrian, dans la puce du téléphone mobile Kirin 970 au-dessus de l'utilisation de la profondeur d'apprentissage pour fournir l'IP, afin de calculer la profondeur pour accélérer Intel a dépensé plus de 10 milliards de dollars pour acheter MobileEye et Nervana Systems, Movidius, etc., car l'intelligence artificielle nécessite un nouveau matériel pour supporter l'informatique intelligente dans le centre de données et à la fin.
Cette évolution est toujours en cours. Nous voyons que, à partir de l'original, nous utilisons le processeur, de différentes façons, avec le GPU et le FPGA avec une puce ASIC dédiée, on peut dire que plusieurs voies techniques se développent dans différents Un représentant typique d'un démarrage de puce d'intelligence artificielle est Wave Computing, qui intègre plus de 16 000 processeurs indépendants sur une puce de flux de données avec une approche super parallèle, puis 16 puces sont chargées en tant que groupe À la machine, c'est un serveur qu'il y a 25 mille 6 mille nucléaires, cette innovation architecturale est sans précédent. Avec la TPU de Google, y compris la taille de l'innovation de l'entreprise, on voit la non-stop dans l'émergence d'artifices Les innovations dans le domaine des jetons intelligents seront une condition préalable indispensable aux applications dynamiques de l'intelligence artificielle et au soutien solide.
Et dans le plus grand nombre d'équipements sur le côté de l'intelligente, la puce de l'intelligence artificielle a été appliquée dans l'appareil du téléphone mobile. Apple iPhone X CPU, A11 bionic chip intégré à la performance du moteur neuronal de 0.6TFlops, c'est-à-dire, Un ordinateur haute performance capable d'effectuer 600 milliards d'opérations à virgule flottante par seconde! La puce de téléphone intelligent Huawei, annoncée juste, la licorne 970, possède une puissance informatique intelligente allant jusqu'à 1,92 trillion par seconde, mais même avec un tel pouvoir informatique , La demande croissante pour les applications intelligentes est capable de dévorer ces nouvelles architectures pour nous fournir le calcul, nous voulons aussi que la nouvelle architecture informatique continue d'émerger, d'avoir une puissance informatique plus puissante, une puissance inférieure Consommation pour répondre aux besoins d'une grande variété d'applications qui apparaîtront pour d'énormes besoins de calcul.
Tous les éléments ci-dessus sont résumés dans le domaine de l'intelligence artificielle dans le domaine des algorithmes, du matériel et des scénarios d'application des trois principales innovations, et ces trois aspects de l'innovation se font également la promotion mutuelle. Nous parlons aujourd'hui de l'importance de l'intelligence artificielle dans le sommet des semiconducteurs , Le développement de l'industrie de l'intelligence artificielle a laissé l'industrie des semi-conducteurs comme un pilier important, il est impossible de développer. À l'innovation de la scène, l'innovation en matière de conduite, de matériel et de logiciels comme support, l'intelligence artificielle peut créer de nouveaux merveilles. Nous sommes également très présents dans ce forum Aidez-nous à témoigner d'une combinaison plus dure et douce de l'intelligence artificielle merveilleuse!