Internet, la religión del ‘Me gusta’. Byron Maher Sancho Somalo

Internet
Cómo los algoritmos disciernen nuestro estado de ánimo por lo que escribimos online

Investigadores y empresas están utilizando los ordenadores para identificar las emociones tras nuestras palabras escritas. Aunque el análisis de sentimientos está lejos de ser perfecto, consigue destilar significado de enormes cantidades de datos y un día podría incluso evaluar la salud mental.

Dana Mackenzie

30 sep 2020 06:41

Mucha gente ha declarado a 2020 como el peor año de la historia. Aunque una descripción de este tipo puede parecer irremediablemente subjetiva, según una medida es cierta.

Esa referencia es el Hedonómetro, una forma computerizada de evaluar tanto nuestra felicidad como nuestro desaliento. Funciona día a día en ordenadores de la Universidad de Vermont (UVM), donde reúne alrededor de 50 millones de tuits de Twitter y después da una lectura rápida del estado de ánimo del público. Según el Hedonómetro, 2020 ha sido de largo el año más horrible desde que empezó a hacer seguimiento en 2008.

El Hedonómetro es una encarnación relativamente reciente de una tarea en la que los informáticos han estado trabajando durante más de 50 años: usar los ordenadores para evaluar el tono emocional de las palabras. Para construir el Hedonómetro, el informático de la UVM Chris Danforth tuvo que enseñar a una máquina a entender las emociones tras esos tuits ya que ningún humano tendría posibilidad de leerlos todos. Este proceso, llamado análisis de sentimientos, ha hecho grandes avances en años recientes y está encontrando cada vez más usos.

Además de tomar la temperatura emocional del usuario de Twitter, los investigadores están empleando el análisis de sentimientos para medir las percepciones de la gente del cambio climático y para examinar sabiduría convencional como, en la música, si un acorde menor es más triste que un acorde mayor (y cuánto más). Los negocios que codician información sobre los sentimientos de los consumidores están utilizando el análisis de sentimientos para evaluar críticas en plataformas como Yelp. Algunos lo están usando para medir los estados de ánimo de los empleados en las redes sociales internas en funcionamiento. La técnica puede tener también aplicaciones médicas, como identificar a las personas deprimidas que necesitan ayuda.

El análisis de sentimientos está permitiendo a los investigadores examinar una avalancha de datos que era previamente larga y difícil de recoger, por no hablar de estudiar, dice Danforth. “En la ciencia social tendemos a medir cosas que son fáciles, como el producto interior bruto. La felicidad es una cosa importante que es difícil de medir”.

Deconstruir el ‘guiso de palabras’

Podrías pensar que el primer paso en el análisis de sentimientos sería enseñar al ordenador a entender lo que están diciendo los humanos. Pero eso es algo que los informáticos no pueden hacer: entender el lenguaje es uno de los problemas notoriamente difíciles en la inteligencia artificial. Pero hay abundantes claves para las emociones tras un texto escrito, que los ordenadores pueden reconocer incluso sin entender el significado de las palabras.

El enfoque más temprano al análisis de sentimientos es el recuento de palabras. La idea es bastante sencilla: contar el número de palabras positivas y restar el número de palabras negativas. Una medida incluso mejor puede obtenerse pesando las palabras: “Excelente”, por ejemplo, conlleva un sentimiento más fuerte que “bueno”. Estos pesos son generalmente asignados por expertos humanos y son parte de la creación de los diccionarios palabra-emoción, llamados lexicons, que el análisis de sentimientos a menudo utilizan.

Los informáticos están usando algoritmos de aprendizaje automático que enseñan a un programa informático a reconocer pautas, como las relaciones significativas entre palabras

Pero el recuento de palabras tiene problemas inherentes. Uno es que ignora el orden de las palabras, tratando a una frase como una especie de guiso de palabras. Y el recuento de palabras puede pasar por alto señales específicas del contexto. Considera esta crítica de producto: “Estoy tan feliz de que mi iPhone no sea como mi viejo y feo Droid”. La frase tiene tres palabras negativas (‘no’, ‘viejo’ y ‘feo’) y sólo una positiva (‘feliz’). Mientras que un humano reconoce inmediatamente que ‘viejo’ y ‘feo’ se refieren a un teléfono diferente, para el ordenador, parece negativo. Y las comparaciones presentan dificultades adicionales: ¿Qué significa ‘no sea como’? ¿Significa que el hablante no está comparando el iPhone con el Android? El lenguaje puede ser muy confuso.

Para abordar estos asuntos, los informáticos han recurrido cada vez más a enfoques más sofisticados que dejan a los humanos completamente al margen. Están usando algoritmos de aprendizaje automático que enseñan a un programa informático a reconocer pautas, como las relaciones significativas entre palabras. Por ejemplo, el ordenador puede aprender que parejas de palabras como ‘banco’ y ‘parque’ a menudo se dan juntas. Estas asociaciones pueden dar claves respecto a significado o sentimiento. Si ‘banco’ y ‘dinero’ están en la misma frase, probablemente sea un tipo de banco diferente.

Un gran paso en estos métodos se dio en 2013, cuando Tomas Mikolov, de Google Brain, aplicó el aprendizaje automatizado para construir una herramienta llamada Word Embeddings (incrustaciones de palabras). Ésta convierte cada palabra en una lista de 50 a 300 números, llamada vector. Los números son como una huella que describe una palabra, y concretamente las otras palabras a las que tiende a frecuentar.

Para obtener estos descriptores, el programa de Mikolov miró millones de palabras en artículos de prensa e intentó predecir la siguiente palabra de texto, dadas las palabras previas. Las incrustaciones de Mikolov reconocen sinónimos: palabras como ‘dinero’ o ‘efectivo’ tienen vectores muy parecidos. Más sutilmente, las Word Embeddings capturan analogías elementales ─que rey es a reina lo que chico es a chica, por ejemplo─ aunque no pueden definir esas palabras (una hazaña remarcable dado que tales analogías eran parte de cómo los exámenes de acceso a la universidad en EEUU evaluaban el desempeño).

Las Word Embeddings de Mikolov eran generadas por lo que se llama una red neuronal con una capa oculta. Las redes neuronales, que están ligeramente modeladas según el cerebro humano, han permitido increíbles avances en el aprendizaje automatizado, incluido AlphaGo (que aprendió a jugar al juego de go mejor que el campeón del mundo). La red de Mikolov era una red deliberadamente más superficial, así que podía ser útil para variedades tareas, como traducción y análisis de temas.

Las redes neuronales más profundas, con más capas de cortex, pueden extraer incluso más información sobre el sentimiento de una palabra en el contexto de una frase o documento concretos. Una tarea de referencia común es que el ordenador lea la crítica de una película en IMDB y prediga si el crítico la aprobó o suspendió. Los primeros métodos de léxico consiguieron cerca del 74% de precisión. Los más sofisticados llegaron al 87%. Las primeras redes neuronales, en 2011, consiguieron el 89%. Hoy actúan con más del 94% de precisión ─acercándose a la de un humano. (El humor y el sarcasmo siguen siendo grandes escollos, porque las palabras escritas pueden expresar literalmente lo contrario del sentimiento que se pretende).

A pesar de los beneficios de las redes neuronales, los métodos basados en léxico son todavía populares; el Hedonómetro, por ejemplo, usa un léxico, y Danforth no tiene intención de cambiarlo. Aunque las redes neuronales pueden ser más precisas para algunos problemas, vienen con un coste. Sólo el periodo de formación es una de las tareas informáticamente más intensas que puedes pedir hacer a un ordenador.

Pacientes diagnosticados con depresión tenían estilos de escritura distintivos, como el uso de los pronombres ‘yo’ y ‘mí’ más a menudo

“Básicamente, estás limitado por cuánta electricidad tienes”, dice Robert Stine, de Wharton School, que cubre la evolución del análisis de sentimientos en el Annual Review of Statistics and Its Application de 2019. “¿Cuánta electricidad utilizó Google para preparar AlphaGo? El chiste que escuché fue que la suficiente como para cocer el océano”, dice Stine.

Además de las necesidades de electricidad, las redes neuronales requieren hardware caro y conocimiento técnico, y hay una falta de transparencia porque el ordenador está descifrando cómo abordar la tarea, más que siguiendo las instrucciones explícitas de un programador. “Es más fácil corregir errores con un léxico”, dice Bing Liu, de la Universidad de Illinois en Chicago, uno de los pioneros del análisis de sentimientos.

Medir la salud mental

Aunque el análisis de sentimientos cae a menudo en la esfera de los informáticos, tiene profundas raíces en la psicología. En 1962, el psicólogo de Harvard Philip Stone desarrolló el General Inquirer, el primer programa informatizado de análisis de textos de carácter general para utilización en psicología; en los 90, el psicólogo social James Pennebaker desarrolló un temprano programa para análisis de sentimientos (el Linguistic Inquiry and Word Count) como mirada a los mundos psicológicos de la gente. Estas primeras evaluaciones revelaron y confirmaron pautas que los expertos habían observado desde hace tiempo: pacientes diagnosticados con depresión tenían estilos de escritura distintivos, como el uso de los pronombres ‘yo’ y ‘mí’ más a menudo. Usaban más palabras con afectividad negativa, y a veces más palabras relacionadas con la muerte.

Hay todavía trabajo que hacer para mostrar cuán útiles son estos análisis: muchos estudios que evalúan la salud mental no consiguen definir sus términos adecuadamente

Los investigadores están ahora examinando la expresión de la salud mental en el lenguaje y la escritura analizando publicaciones en redes sociales. Andrew Reece, psicólogo de Danforth y Harvard, por ejemplo, analizó las publicaciones de Twitter de personas con diagnósticos formales de depresión o desorden por estrés post-traumático que fueron escritos antes de la diagnosis (con el consentimiento de los participantes). Empezaron a aparecer signos de depresión hasta nueve meses antes. Y Facebook tiene un algoritmo para detectar usuarios que parecen estar en riesgo de suicidio; expertos humanos revisan los casos y, si corresponde, envían a los usuarios indicaciones o números de ayuda telefónica.

Predecir la depresión de los tuits

Pero los datos de redes sociales están todavía muy lejos de ser usados en atención al paciente. Los temas de privacidad son una inquietud obvia. Además, hay todavía trabajo que hacer para mostrar cuán útiles son estos análisis: muchos estudios que evalúan la salud mental no consiguen definir sus términos adecuadamente o no proporcionan suficiente información como para replicar sus resultados, dice Stevie Chancellor, una experta en informática centrada en las personas de la NorthWestern University y coautor de una crítica reciente de 75 estudios de este tipo. Pero aun así cree que el análisis de sentimientos podría ser útil clínicamente, por ejemplo al hacer el triaje de un nuevo paciente. E incluso sin datos personales, el análisis de sentimientos puede identificar tendencias como el nivel general de estrés de estudiantes universitarios durante una pandemia, o los tipos de interacciones en redes sociales que disparan las recaídas entre las personas con desórdenes alimenticios.

Leer los estados de ánimo

El análisis de sentimientos también está abordando cuestiones más desenfadadas, como los efectos del clima sobre el estado de ánimo. En 2016, Nick Obradovich, ahora en el Instituto Max Planck para el Desarrollo Humano de Berlín, analizó alrededor de 2.000 millones de publicaciones de Facebook y mil millones de publicaciones en Twitter. Un poco de lluvia rebajaba la felicidad expresada por la gente alrededor de un 1%. Las temperaturas bajo cero la rebajaban alrededor del doble. En un estudio de seguimiento ─y más desalentador─, Obradovich y otros colegas miraron Twitter para entender los sentimientos sobre el cambio climático. Descubrieron que tras cinco años de aumento del calor, la sensación de los usuarios de Twitter de lo ‘normal’ cambió y ya no tuiteaban sobre una ola de calor. No obstante, la sensación de bienestar de los usuarios aún era afectada, muestran los datos. “Es un problema que progresa tan despacio que no se percibe”, dice Obradovich. “Ése fue uno de los descubrimientos empíricos más preocupantes que nunca he hecho”.

Aunque ‘lunes’ es el nombre de día que suscita las reacciones más negativas, el martes era en realidad el día en que la gente estaba más triste

La reputación del lunes como peor día de la semana también requirió investigación. Aunque ‘lunes’ es el nombre de día que suscita las reacciones más negativas, el martes era en realidad el día en que la gente estaba más triste, descubrió un temprano análisis de tuits por el Hedonómetro de Danforth. El viernes y el sábado, por supuesto, eran los días más felices. Pero la pauta semanal cambió tras las elecciones presidenciales estadounidenses de 2016. Aunque probablemente todavía hay una señal semanal, “superpuesta sobre ella están acontecimientos que atrapan nuestra atención y se habla sobre ellos más que sobre lo básico de la vida”, dice Danforth. Traducción: en Twitter, la política nunca para. “Cualquier día de la semana puede ser el más triste”, dice.

Otro tópico puesto a prueba es que en la música, los acordes mayores se perciben como más alegres que los acordes menores. Yong-Yeol Ahn, un experto en ciencia social informática de la Universidad de Indiana, puso a prueba esta idea analizando el sentimiento de las letras que acompañan a cada acorde en 123.000 canciones. Los acordes mayores de hecho estaban asociados con palabras más alegres, 6,3 comparado con 6,2 para los acordes menores en una escala de 1 a 9. Aunque la diferencia parece pequeña, es aproximadamente la mitad de la diferencia de sentimiento entre Navidad y un día de la semana normal en el Hedonómetro. Ahn también comparó los géneros y descubrió que el rock de los 60 era el más feliz; el heavy metal era el más negativo.

Sagacidad empresarial

El mundo de los negocios también está asumiendo la herramienta. El análisis de sentimientos se está volviendo ampliamente usado por las empresas, pero muchas no hablan sobre ello así que precisamente aumentar su popularidad es difícil. “Todas lo están haciendo: Microsoft, Google, Amazon, todas. Algunas de ellas tienen múltiples grupos de investigación”, dice Liu. Una medida de interés de fácil acceso es el gran número de programas de software de análisis de sentimientos comerciales y académicos que están disponibles públicamente: una comparación de referencia de 2018 detalló 28 programas de este tipo.

Algunas empresas usan el análisis de sentimientos para entender lo que sus clientes están diciendo en las redes sociales. Como ejemplo posiblemente apócrifo, Expedia Canada llevó a cabo una campaña de márketing en 2013 que se hizo viral de la forma equivocada, porque la gente odiaba la chirriante música de violín de fondo. Expedia sustituyó rápidamente el molesto anuncio con nuevos vídeos que se reían del antiguo (por ejemplo, invitaron a un disgustado usuario de Twitter a destrozar el violín). Se afirma frecuentemente que Expedia fue alertada de la respuesta de las redes sociales por el análisis de sentimientos. Aunque esto es difícil de confirmar, ciertamente es el tipo de cosa que el análisis de sentimientos podría hacer.

Otras empresas utilizan el análisis de sentimientos para hacer seguimiento de la satisfacción de la plantilla, por ejemplo, monitoreando las redes sociales internas de la empresa. IBM, por ejemplo, desarrolló un programa llamado Social Pulse que hacía seguimiento de la intranet de la compañía para ver de qué se estaban quejando los empleados. Por motivos de privacidad, el software sólo miraba a las publicaciones que se compartían con toda la empresa. Incluso así, esta tendencia molesta a Danforth, quien dice: “Mi preocupación sería que la privacidad de los empleados no estuviera en consonancia con la esencia de la empresa. Es una cosa éticamente dudosa”.

Es probable que la ética siga siendo un problema a medida que el análisis de sentimientos se vuelve más común. Y las empresas, los profesionales de la salud mental y de cualquier otro campo que consideren su uso deberían tener en mente que aunque el análisis de sentimientos es infinitamente prometedor, cumplir esa promesa puede ser difícil todavía. Las matemáticas que subyacen a los análisis son la parte fácil. La parte difícil es entender a los humanos. Como dice Liu, “Ni siquiera entendemos lo que es entender”.

Knowable Magazine

Artículo original: How algorithms discern our mood from what we write online, publicado el licencia creative commons y traducido por Eduardo Pérez para El Salto.

Archivado en: Salud mental ‧ Coronavirus ‧ Redes sociales ‧ Internet

Informar de un error

Es necesario tener cuenta y acceder a ella para poder hacer envíos. Regístrate. Entra en tu cuenta.

Relacionadas

Redes sociales

El asesino de los CEO El fenómeno fan Luigi Mangione, ¿por qué tanta gente apoya a un asesino?

Yago Álvarez Barba

El caso del chico de clase alta que disparó sobre un CEO de una aseguradora médica ha desatado una ola cultural y de apoyo como no se había visto antes.

Inteligencia artificial

Centros de datos Internet y la inteligencia artificial no son invisibles: su huella de carbono es igual a la de los aviones

Emma González

La expansión de los centros de datos en nuestro país amenaza nuestras reservas y recursos energéticos.

Redes sociales

Redes sociales La paradoja de 'Los ingenieros del caos'

Yanina Welp

La obra propone que los “ingenieros del caos” han reinventado la propaganda para adaptarla a la era de las redes sociales, pero adolece de un análisis sistemático ni una propuesta exploratoria de conexiones y relaciones entre causas y efectos

Comentarios Es necesario acceder para comentar

Comentar

Suscríbete y comenta sin moderación Si ya estás suscrita
inicia sesión

Represión

Represión Una marcha reclama la liberación de los seis de Zaragoza tras un año en prisión

Redacción El Salto

Organizaciones como Amnistía Internacional han expresado su preocupación por este caso, apuntando a posibles vulneraciones de derechos y al aumento de la represión de la protesta social.

Globalización

Crisis del multilateralismo El terremoto Trump sacude las instituciones del orden mundial y la “globalización feliz”

Martín Cúneo

Muchas de las instituciones que marcaron la vida internacional desde la caída del Muro han entrado en crisis. ¿Todas? No, especialmente aquellas que intentan regular los derechos humanos, de los pueblos y de la naturaleza.

Crisis de los aranceles La claudicación de Trump: del momento Lehman a la derrota a lo Liz Truss

Ecuador

Ecuador El día que Simón Bolívar escuchó del ‘Ecuador’: un análisis de la segunda vuelta electoral

Nicolás Buckley

Las elecciones entre el conservador Daniel Noboa y la correista Luisa González han sido definidas como “históricas”. Sin embargo, no parece que ninguno de los candidatos represente la “gran figura” que el momento lo requiere.

Palestina

Palestina Israel ataca el hospital más importante de la ciudad de Gaza

Redacción El Salto

El hospital Al Ahli ha sido bombardeado esta madrugada provocando daños severos y la evacuación de pacientes y personal.

Brasil

Brasil ¿Bolsonaro preso? Brasil a las puertas de un juicio histórico

Gerardo Szalkowicz

El expresidente se podría enfrentar hasta a 40 años de cárcel.

Brasil Bolsonaro es acusado por la policía del intento de asesinato de Lula da Silva para dar un golpe de Estado

La vida y ya

La vida y ya Una espiga entre los dientes

María González Reyes

La idea de que las armas sirven para mantener la paz se coloca con la confianza con la que el polvo se deposita encima de los libros apilados en un desván sabiendo que nadie vendrá a limpiarlo.

Literatura

50 aniversario Aresti vive en la memoria de un pueblo vasco en disputa

Jon Bernat Zubiri Rey

Hoy comienzan en Bilbao los actos del 50 aniversario de la muerte de Gabriel Aresti, referencia ineludible e incómoda de la literatura vasca moderna.

Que no te lo cuenten

El Salto Radio De violencia institucional y protestas

VV.AA.

Mientras Granada se revela contra el acoso de seis policía local a una víctima de violencia machista, en Catalunya se presenta un informe que concluye que el 65% de los casos de violencia institucional se archivan sin que se completen las pesquisas

Últimas

Podemos

Izquierda Podemos mantiene el ‘modo revancha’ y en Sumar se dividen entre el hartazgo y la resignación

Daniel Galvalizi

En su V Asamblea Estatal, la formación morada pisa el acelerador en su confrontación pública con el grupo de Yolanda Díaz. Con Montero ya precandidata, la confluencia electoral parece una quimera aunque algunos yolanders no ven otra opción.

Sanidad

Sanidad La Atención Primaria, uno de los escalones de la Sanidad más abandonados

Redacción El Salto

Este 12 de abril se celebra el Día Internacional del primer peldaño de acceso a los servicios sanitarios. Falta de inversión, largas listas de espera y falta de tiempo para atender son algunas de las denuncias más repetidas.

Eventos

Taller de podcast El Salto invita a estudiantes a explorar las posibilidades del formato audiovisual

El Salto

Proponemos un taller de guion y producción de programas para estudiantes de comunicación y periodismo los días 24 de abril y 8 de mayo.

Memoria histórica

Memoria histórica Sin fondos para identificar los restos de la primera exhumación en la Comunidad de Madrid

Laura L. Ruiz

La asociación impulsora de los trabajos de recuperación en el cementerio de Colmenar Viejo denuncia que no tienen contestación sobre la financiación prometida por el Gobierno.

Palestina

Palestina Israel avanza en su plan con la anexión de Rafah y el sur de la franja de Gaza

Redacción El Salto

Con este movimiento, Israel ha declarado “zona de seguridad israelí” el 20% del territorio del sur mientras que mantiene bajo su custodia el 66% de la franja.

Inteligencia artificial

Inteligencia artificial La demanda energética de los centros de datos de IA se cuadruplicará para 2030, según un informe

Redacción El Salto

Un estudio de la Agencia Internacional de la Energía predice que los centros de datos aumentarán la demanda de electricidad en un 20% de aquí a 2030 en el Norte global.

Centros de datos Internet y la inteligencia artificial no son invisibles: su huella de carbono es igual a la de los aviones

Más noticias

Ilustración solidarity de Clifford Harper

Internet Cómo los algoritmos disciernen nuestro estado de ánimo por lo que escribimos online

Deconstruir el ‘guiso de palabras’

Medir la salud mental

Predecir la depresión de los tuits

Leer los estados de ánimo

Sagacidad empresarial

Relacionadas

El asesino de los CEO El fenómeno fan Luigi Mangione, ¿por qué tanta gente apoya a un asesino?

Centros de datos Internet y la inteligencia artificial no son invisibles: su huella de carbono es igual a la de los aviones

Redes sociales La paradoja de 'Los ingenieros del caos'

Represión Una marcha reclama la liberación de los seis de Zaragoza tras un año en prisión

Crisis del multilateralismo El terremoto Trump sacude las instituciones del orden mundial y la “globalización feliz”

Ecuador El día que Simón Bolívar escuchó del ‘Ecuador’: un análisis de la segunda vuelta electoral

Palestina Israel ataca el hospital más importante de la ciudad de Gaza

Brasil ¿Bolsonaro preso? Brasil a las puertas de un juicio histórico

La vida y ya Una espiga entre los dientes

50 aniversario Aresti vive en la memoria de un pueblo vasco en disputa

El Salto Radio De violencia institucional y protestas

Últimas

Izquierda Podemos mantiene el ‘modo revancha’ y en Sumar se dividen entre el hartazgo y la resignación

Sanidad La Atención Primaria, uno de los escalones de la Sanidad más abandonados

Taller de podcast El Salto invita a estudiantes a explorar las posibilidades del formato audiovisual

Memoria histórica Sin fondos para identificar los restos de la primera exhumación en la Comunidad de Madrid

Palestina Israel avanza en su plan con la anexión de Rafah y el sur de la franja de Gaza

Inteligencia artificial La demanda energética de los centros de datos de IA se cuadruplicará para 2030, según un informe

Opinión Sindicalismo que gana: la clave no es la unidad, sino organizar a las mayorías

València La exconsellera Salomé Pradas se declara “una ignorante en emergencias” y señala a los técnicos

Israel Un nuevo cargamento militar rumbo a Israel cruzará el Estrecho de Gibraltar con la complicidad de los puertos

Recomendadas

Cambio de paradigma De la deprescripción de psicofármacos al refuerzo de plantillas: claves del Plan Nacional de Salud Mental

Especies protegidas Organizaciones tratan de evitar la caza del lobo: “Volver a la receta de la gestión letal no funciona”

Unión Europea La derecha intenta deslegitimar a las ONG y entidades sociales en la Unión Europea

Vietnam Luces y sombras del nuevo modelo arancelario de Estados Unidos en los países del Sudeste Asiático

Internet
Cómo los algoritmos disciernen nuestro estado de ánimo por lo que escribimos online