¿Cuán predecibles somos en las redes sociales?
Una investigación se propone definir la previsibilidad de nuestras interacciones digitales y encuentra que somos más predecibles de lo que creemos
El texto predictivo y el autocorrector del móvil suelen darnos una idea de cuán predecibles somos al escribir y comunicarnos textualmente con los demás. Pero tras un nuevo estudio, un grupo de científicos alega que las redes sociales pueden predecir nuestros comentarios incluso si no participamos o si nuestras publicaciones suelen ser muy reducidas.
Tirando de una base de datos de tuits, los investigadores de la Universidad de Vermont consiguieron adivinar las palabras que un usuario utilizaría a continuación, y sus resultados fueron todavía más efectivos si podían ver lo que los contactos y amigos de ese usuario estaban diciendo en Twitter en ese momento.
Para efectivamente predecir los tuits de una cuenta de Twitter, los científicos trabajaron alrededor de tres conceptos: la entropía, la perplejidad y la previsibilidad.
Estudiando la previsibilidad de nuestros tuits
Los investigadores ven la entropía en este contexto como la cantidad de bits que se necesitan para describir la incertidumbre sobre la elección de palabras en el futuro. «Una forma de ver esto es que, si estás seguro de que la próxima palabra saldrá de una lista de 16, entonces la entropía sería 4 (24 es 16)», explicó el medio especializado Ars Technica.
Usando el mismo ejemplo la perplejidad sería el 16, siendo este valor el resultado de la entropía. Y, finalmente, la previsibilidad es la probabilidad de predecir eficazmente la próxima palabra que se utilizará. Los conceptos son complejos, pero la forma en la que fueron puestos en práctica es la parte más interesante del estudio.
Los científicos crearon una base de datos de unos 14.000 usuarios de Twitter que colectivamente publicaron más de 30 millones de tuits. Después identificaron a 927 usuarios y los 15 contactos con los que interactúan de forma más frecuente. Todas sus interacciones pasaron entonces a un algoritmo para medir la previsibilidad de las palabras que usarán en el futuro.
«La mayoría de estos 927 usuarios se agruparon en el área de una entropía entre 5,5 y 8 bits, lo que significa que la siguiente palabra normalmente se encuentra en una lista de entre 45 y 256 palabras. Luego, eligieron al usuario con el que la persona interactúa más frecuentemente. La entropía entre usuarios resultó ser típicamente en el rango de 6 a 12 bits», informó Ars Technica.
Con solo un contacto la previsibilidad fue de entre el 40% y el 60%, pero los científicos descubrieron que entre más contactos analizaba el algoritmo menor era la entropía, y por ende más fácil era adivinar las palabras que utilizaría el usuario principal en su próximo mensaje. Es decir, que lo que dicen nuestros amigos nos hace más predecibles que lo que nosotros mismos decimos.
El comportamiento de los usuarios también es importante: aquellos que publican regularmente en Twitter más de ocho tuits al día solían ser más predecibles. Más allá de eso, el estudio ilumina otro potencial problema de privacidad en internet: si unos científicos externos a Twitter lograron adivinar los tuits de terceros con un algoritmo independiente, ¿cuánto es capaz de predecir la propia red social?