Una IA mejora la comunicación de personas con problemas en el habla
Google desvela en su evento I/O dos herramientas que ayudarán a que personas con dificultades en el habla se comuniquen con mayor libertad
«Entender y ser entendido, nada más increíble». Lo dice Dimitri Kanevsky, un investigador del habla de Google que aprendió inglés antes de quedar sordo cuando joven en Rusia. Dimitri tiene la suerte de trabajar en una tecnológica en la que hay un equipo de trabajo dedicado a construir una herramienta para entender a personas con trastornos del habla, y a que sean entendidos.
Entre sus varios proyectos enfocados en personas con necesidades especiales, y como parte de su programa de inteligencia artificial para el bien social, Google desveló esta semana algunos de los avances en su misión de facilitar la vida de quienes tienen dificultades para expresarse verbalmente. Parte de la conferencia Google I/O trató precisamente sobre esto.
Y es que Google suscitó suspiros en la presentación al poner el foco sobre el Proyecto Eufonía, en el que utiliza la inteligencia artificial para mejorar la habilidad de las máquinas para entender los distintos patrones del habla, así como los problemas de la comunicación según qué enfermedad. Por ejemplo, a los pacientes con esclerosis lateral amiotrófica (ELA) conversar no se les da fácil.
El software de Google ahora puede grabar muestras de la voz de los pacientes y convertirlas en espectogramas, que es la representación visual del sonido. El proceso de aprendizaje automático se encarga de aprender escalonadamente a reconocer las formas menos comunes del habla. El vídeo a continuación demuestra su funcionamiento.
Más avances de Google para que todos se puedan comunicar
Por ahora, Google trabaja en este proyecto enfocado en personas que hablan inglés y que tienen los síntomas del ELA, que usualmente incluyen problemas del habla. «Estamos emocionados por ver a dónde nos lleva esto, y necesitamos tu ayuda», explica la multinacional estadounidense, que pide a pacientes con estas condiciones llenar un formulario para tomar parte.
Adicionalmente, y aprovechando el marco del evento I/O, Google presentó Live Relay, un proyecto para personas con dificultades en el habla y la audición. Este sistema hace reconocimiento del audio y conversión de texto a voz, permitiendo a estas personas interactuar con el móvil o con otros a través del dispositivo.
Un sistema como Live Relay podrá permitir en un futuro no muy lejano que personas mudas o sordas realicen llamadas telefónicas, por ejemplo. Pero también sirve a todos los tipos de usuarios, pues, por ejemplo, permite responder una llamada con la opción de escribir la respuesta en vez de hablar, convirtiendo el software el habla en texto.
No obstante, para Google lo más importante en este sentido es ayudar a hablar a quienes toda su vida han sido incapaces de hablar. «La mayoría de aspectos de la vida involucran comunicarse con otros, y ser entendido por ellos también. Muchos damos estos por sentado, pero imagina la dificultad y frustración que sentirías si nadie pudiera entender lo que dices», comentó la empresa.