Google usa AI para extraer pistas independientes de entornos ruidosos: o hay problemas de privacidad@goodchinabrand.com

Los investigadores de Google han desarrollado un sistema de aprendizaje profundo que puede ayudar a las computadoras a reconocer y distinguir mejor la voz de una persona en un entorno ruidoso.

Un artículo publicado esta semana en el blog de Google Research muestra que un equipo interno de la compañía está tratando de hacer que la inteligencia artificial (AI), como el cerebro humano, se concentre activamente en una fuente de sonido mientras filtra otras fuentes de sonido, como en una fiesta. Cuando hablas con amigos

El enfoque de Google utiliza un modelo audiovisual que le permite concentrarse en los sonidos de un video. La compañía también lanzó varios videos de YouTube para demostrar el efecto real de la tecnología.

Google dijo que la tecnología se puede aplicar a una sola pista de vídeo, sino también por el algoritmo separa el contenido de audio y vídeo en diferentes personas, sino que también permite al usuario seleccionar manualmente la persona en la cara de vídeo, específicamente para escuchar la voz de la persona.

Google dijo que los elementos visuales es la clave, ya que la tecnología se centrará en el movimiento de los labios de una persona para determinar mejor en algún momento debería estar preocupado por lo que el segmento de voz, y crear pistas separadas más precisos a un vídeo más largo.

Google investigadores mediante la recopilación de 100.000 segmentos de YouTube vídeo de presentación 'desarrollaron este modelo, un total de cerca de 2000 horas para extraer el contenido, y luego se mezcla, añadir estas pistas en un ruido de fondo artificial.

Google luego entrenó la tecnología para segmentar el audio mixto al observar los espectrogramas de las caras y las pistas de video en cada fotograma del video. Este sistema puede distinguir qué fuente pertenece a cada cara en un momento específico y es Todos hacen una pista de audio separada.

Google cree que los sistemas de subtitulado se convertirán en un área de aplicación importante para el sistema. También contemplan una gama más amplia de aplicaciones y están explorando más oportunidades para integrarlas en varios productos de Google. Por ejemplo, si Al agregarlo al altavoz inteligente de Google Home, puede distinguir las instrucciones emitidas por diferentes usuarios.

Sin embargo, este modelo necesita funcionar bien con el video, por lo que puede ser más adecuado para el Amazon Echo Show. Google abrió el asistente de Google para pantallas inteligentes como Echo Show a principios de este año, pero la compañía aún no ha lanzado dichos productos.

Sin embargo, esta tecnología también puede causar problemas de privacidad. Aunque el efecto real de la tecnología es mucho menor que una presentación de video, de hecho puede convertirse en una poderosa herramienta de monitoreo y monitoreo con algunos ajustes menores.