En la Universidad de São Paulo (Brasil), investigadores usan IA y Twitter para predecir ansiedad y depresión antes del diagnóstico clínico. Un estudio reciente en Language Resources and Evaluation presenta SetembroBR, una base de datos de 47 millones de tuits públicos de 3,900 usuarios que informaron haber sido diagnosticados o tratados por problemas de salud mental.

La investigación comenzó con la creación de una base de datos, llamada SetembroBR. Esta incluye un corpus de textos en portugués y la red de conexiones de 3,900 usuarios de Twitter que han sido diagnosticados o tratados por problemas de salud mental. La base de datos contiene todos los tuits públicos publicados por estos usuarios individualmente (sin retuits). Es decir, equivale a unos 47 millones de textos cortos.

Vía Freepik.

Hallazgos preliminares del estudio

El segundo paso del estudio aún está en progreso, pero ha revelado algunos descubrimientos preliminares. Por ejemplo, la capacidad de identificar la probabilidad de que una persona desarrolle depresión según sus amigos y seguidores en las redes sociales, independientemente de sus propias publicaciones. Además, se recolectaron tuits de amigos y seguidores, ya que se ha observado que las personas con problemas de salud mental suelen seguir cuentas específicas, como foros de discusión, influencers y celebridades que hablan abiertamente sobre su depresión.

Los trastornos de salud mental, como la depresión y la ansiedad, están en aumento en todo el mundo. La Organización Mundial de la Salud informó que alrededor de 280 millones de personas, equivalente al 3,8% de la población mundial, se vieron afectadas por la depresión en 2021. Además, la OMS ha señalado un aumento del 25% en la prevalencia de estos problemas de salud mental en todo el mundo durante la pandemia de COVID-19. El estudio recopiló tweets durante este período.

Según investigaciones anteriores, los problemas de salud mental a menudo se reflejan en el lenguaje utilizado por los enfermos. Este hallazgo ha dado lugar a un número considerable de estudios que involucran el procesamiento del lenguaje natural (PNL), con un enfoque en la depresión, la ansiedad y el trastorno bipolar, entre otros. Sin embargo, la mayoría de estos estudios analizan textos en inglés y no siempre coinciden con el perfil de la mayoría de los brasileños.

Técnicas de IA analizan tuits para detectar depresión y ansiedad en Brasil

Los investigadores preprocesaron el corpus para eliminar hashtags, URL, emoticonos y caracteres no estándar manteniendo los textos originales. Luego implementaron el aprendizaje profundo. Esta es una técnica de IA que enseña a las computadoras a procesar datos de una manera inspirada en el cerebro humano, para crear cuatro clasificadores de texto e incrustaciones de palabras (representaciones matemáticas dependientes del contexto de las relaciones entre palabras). Esto lo logran usando modelos basados en representaciones de codificadores bidireccionales como from transformers (BERT), un algoritmo de aprendizaje automático para NLP.

La investigación utilizó técnicas de aprendizaje automático para analizar los tuits de los usuarios en busca de signos de depresión y ansiedad. Utilizaron una muestra aleatoria de 200 tuits de cada usuario para entrenar y validar su modelo. Descubrieron que el modelo BERT tuvo el mejor desempeño en términos de predicción. Además pudieron observar que las personas con depresión tienden a escribir sobre sí mismas y temas relacionados con la muerte y la crisis. Los datos recopilados se anonimizaron para proteger la privacidad de los usuarios. Los investigadores están trabajando en la ampliación de la base de datos y la mejora de las técnicas para crear una herramienta que pueda ayudar en la detección temprana de problemas de salud mental. Brasil ocupa el tercer lugar en consumo de redes sociales en el mundo.

Referencias:

SetembroBR: a social media corpus for depression and anxiety disorder prediction: https://doi.org/10.1007/s10579-022-09633-0

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *