El fallo de Facebook revela cómo la IA etiqueta las fotos compartidas
El etiquetado automático de las fotografías de Facebook genera un texto que describe el contenido de las imágenes para los usuarios con problemas de visión
Ayer miércoles todas las plataformas del grupo Facebook sufrían problemas de funcionamiento que, en el mejor de los casos, impedían la descarga de contenidos en Whatsapp y la visualización de fotografías y vídeos en Facebook e Instagram.
A causa de este problema cuando se accedía a fotografías compartidas en Facebook, propias o de contactos, no aparecían las imágenes. En cambio sí podían verse las descripciones que asigna Facebook a esas imágenes.
Ejemplo de la descripción automática de una fotografía compartida en Facebook.
En estas descripciones se podían leer los posibles contenidos de cada imagen; si correspondía a objetos, a situaciones cotidianas, a momentos del día, a personas y cuántas y que estaban haciendo, o dónde fue tomada la fotografía. Facebook lo denomina «texto alternativo automático».
Facebook utiliza la inteligencia artificial para analizar las fotografías y reconocer su contenido. Entre otras cosas esta información permite a Facebook obtener más información de la vida de los usuarios.
Pero también permite que las personas con problemas de visión tenga una descripción de las fotografías que no pueden ver, para convertir imágenes en voz hablada. Esto posibilita que cerca de 40 millones de personas ciegas (y los 250 millones con problemas de visión más o menos severos) que hay en Facebook participen de la conversación y de los contenidos compartidos.
Inteligencia artificial que reconoce el contenido de las fotografías
Según explicaba Facebook en 2016, cuando comenzó a implementar este algoritmo de reconocimiento de imágenes, «los usuarios de Facebook que hagan uso de la función de lectura de pantalla escucharán una lista de los elementos que aparecen en una foto cuando pasen por ella. Hasta ahora en ese momento únicamente escuchaban decir ‘foto’. Ahora recibirán una descripción más completa de qué hay en la foto gracias al texto alternativo automático. Por ejemplo, alguien podría escuchar ‘imagen que contiene a tres personas sonriendo, al aire libre’.»
El sistema de texto alternativo automático para las imágenes utiliza la tecnología de reconocimiento de imagen de Facebook que analiza y compara una las imágenes que suben los usuarios a las redes sociales de la compañía (Facebook, Instagram).
Cada una de esas imágenes se compara con imágenes de ejemplo que ya tienen una descripción acerca de su contenido. Por ejemplo, si la red neuronal sabe cómo suelen ser las fotos que muestran a gente en una fiesta podrá reconoce con mucha probabilidad de acertar otras fotografías (de los usuarios) en los que aparezcan personas en una fiesta, incluso aunque el sistema nunca haya visto antes esa fotografía concreta.
Según Facebook, aunque se trata todavía de una tecnología incipiente, aprovechar sus capacidades actuales para describir fotos es un paso importante para proporcionar a las personas con discapacidad visual los mismos beneficios y las emociones que disfrutan todos los demás usuarios de la red.