Facebook desarrolla inteligencia artificial para detectar memes ofensivos

El algoritmo de aprendizaje automático llamado Rosetta, que toma su nombre del fragmento de piedra que permitió descifrar los jeroglíficos egipcios, es la última herramienta desarrollada por Facebook para combatir el contenido inapropiado y dañino.

Detectar este tipo de contenidos cuando se comparten en forma de texto escrito es relativamente fácil a estas alturas; pero comprender el sentido de un texto escrito sobre una imagen y evaluar el conjunto formado por el texto y la imagen es algo más complicado.

La dificultad de entender el contexto del conjunto ‘imagen y texto’

Según explican en el blog de Facebook cada día Rosetta «extrae el texto contenido en más de mil millones de imágenes públicas de Facebook e Instagram y en fotograma de vídeo en diversos idiomas y en tiempo real» para incorporarlo a un sistema de reconocimiento de texto entrenado «para entender el contexto del texto y la imagen juntos.»

La extracción del texto contenido en una imagen se realiza en dos pasos independientes: detección y reconocimiento, explican desde Facebook.

El primer paso consiste en detectar las regiones rectangulares que potencialmente contienen texto; el segundo paso consiste en realiza un reconocimiento de texto dentro de esas regiones utilizando una red neuronal convolucional (CNN) para reconocer y transcribir la palabra.

En paralelo el sistema de reconocimiento de imágenes identifica qué sujetos aparecen en una imagen con un sistema neuronal entrenado a partir de miles de fotografías previamente anotadas —que describen su contenido— disponibles públicamente y procedentes de Facebook e Instagram.

Así es como Facebook espera detectar el discurso de odio cuando se difunde como imágenes con texto y en diferentes idiomas para «identificar proactivamente el contenido inapropiado o dañino y mantener nuestra comunidad segura.»

Recibe nuestra newsletter diaria

La dificultad de entender el contexto del conjunto ‘imagen y texto’

Recibe nuestra newsletter diaria