Ciencia, Tecnología y Humanidades
¿Puede el análisis de voz que funciona con inteligencia artificial ayudar a detectar enfermedades mentales?
Ingrid K. Williams | The New York Times
Imagínate una prueba para detectar de manera confiable un trastorno de ansiedad o para pronosticar una inminente recaída depresiva que sea tan rápida y sencilla como tomar la temperatura o medir la presión arterial.
Los profesionales de la salud cuentan con muchas herramientas para valorar las enfermedades físicas de los pacientes, pero no con biomarcadores confiables —indicadores objetivos del estado de salud que se observa desde la parte externa del paciente— para comprobar la salud mental.
No obstante, ahora algunos investigadores en inteligencia artificial creen que el sonido de la voz podría ser la clave para conocer nuestro estado de salud mental… y la inteligencia artificial es idónea para detectar los cambios, mismos que de otra manera son difíciles de percibir, si no es que imposible. El resultado es una serie de aplicaciones y herramientas en internet diseñadas para monitorear nuestro estado de salud mental, así como programas capaces de ofrecerles evaluaciones de la salud mental en tiempo real a los profesionales de la salud en centros telefónicos y de telemedicina.
Desde hace mucho tiempo, los psicólogos han sabido que algunos problemas mentales se pueden detectar escuchando no solo lo que dice la persona, sino cómo lo dice, comentó Maria Espinola, psicóloga y profesora adjunta de la Facultad de Medicina de la Universidad de Cincinnati.
Espinola explicó que en el caso de los pacientes deprimidos “su modo de hablar, por lo general, es más monótono, plano y tranquilo. También emplean una gama de tonos más reducida y un volumen más bajo. Hacen más pausas y se detienen con mayor frecuencia”.
Los pacientes que sufren de ansiedad sienten más tensión en el cuerpo, lo cual también puede modificar la forma en que suena su voz, comentó. “Tienden a hablar más rápido. Les cuesta más trabajo respirar”.
En la actualidad, ese tipo de características vocales están siendo aprovechadas por los especialistas en aprendizaje automático para pronosticar la depresión y la ansiedad, al igual que otras enfermedades mentales como la esquizofrenia y el trastorno de estrés postraumático. Mediante el uso de algoritmos de aprendizaje profundo se pueden descubrir otros patrones y características, captados en grabaciones cortas de voz, que tal vez no sean evidentes ni siquiera para los expertos bien entrenados.
“La tecnología que estamos usando ahora puede detectar características que pueden ser significativas y que ni siquiera el oído humano puede captar”, señaló Kate Bentley, profesora adjunta en la Escuela de Medicina de la Universidad de Harvard y psicóloga clínica en el Hospital General de Massachusetts.
“Hay mucho interés por encontrar indicadores biológicos o más objetivos para el diagnóstico psiquiátrico que rebasen las formas más subjetivas de evaluación que se usan tradicionalmente, como las entrevistas calificadas por un médico o las evaluaciones de los autoinformes”, comentó. Otras pistas que los investigadores están siguiendo incluyen los cambios en el nivel de actividad, los patrones de sueño y la información en las redes sociales.
Estos avances tecnológicos llegan en un momento en el que es muy apremiante la necesidad de atender la salud mental. Según un informe de la Alianza Nacional sobre Enfermedades Mentales, uno de cada cinco adultos en Estados Unidos padeció enfermedades mentales en 2020. Y las cifras siguen aumentando.
A fin de probar esta nueva tecnología, comencé por descargar la aplicación llamada Mental Fitness, de Sonde Health, una empresa de tecnología dedicada a la salud, para ver si el malestar que sentía era una señal de algo grave o si solo era agotamiento. Descrita como “un producto para registrar y monitorear la salud mental que se activa con la voz”, esta aplicación gratuita me invitaba a asentar mi primer registro, una entrada verbal de 30 segundos, misma que calificaría mi salud mental en una escala del 1 al 100.
Un minuto después, ya tenía mi puntuación: una calificación nada buena de 52. “Preste atención”, advertía la aplicación.
La aplicación marcaba que el nivel de vitalidad detectado en mi voz era notablemente bajo. ¿Mi voz sonaba monótona solo porque estaba tratando de hablar con tranquilidad? ¿Debo escuchar las sugerencias de la aplicación para mejorar mi salud mental saliendo a caminar u organizando mi espacio? (La primera pregunta podría indicar una de las posibles fallas de la aplicación: como consumidor, puede ser difícil saber por qué oscilan los niveles de la voz).
Después, sintiéndome nerviosa entre una entrevista y otra, probé otro programa de análisis de voz que se enfocaba en detectar los niveles de ansiedad. La StressWaves Test es una herramienta gratuita en internet elaborada por Cigna, el consorcio de aseguradoras y atención médica, desarrollada en colaboración con Ellipsis Health, la especialista en inteligencia artificial, para evaluar los niveles de estrés mediante grabaciones de voz de 60 segundos.
“¿Qué te quita el sueño?” era la indicación que daba el sitio web para comenzar. Luego de pasar un minuto contando mis constantes preocupaciones, el programa calificó mi grabación y me envió un dictamen por correo electrónico: “Su nivel de estrés es moderado”. A diferencia de la aplicación Sonde, el correo electrónico de Cigna no me dio ninguna recomendación para que mejorara por mí misma.
Otras tecnologías añaden un grado potencialmente útil de interacción humana, como Kintsugi, una empresa con sede en Berkeley, California, que hace poco recaudó 20 millones de dólares en financiamiento de la serie A. Kintsugi recibe su nombre por la práctica japonesa de reparar la cerámica rota con filones de oro.
Fundada por Grace Chang y Rima Seiilova-Olson, quienes congeniaron por su experiencia compartida de haber tenido problemas para poder recibir atención a su salud mental, Kintsugi desarrolla tecnología para profesionales de la salud en centros telefónicos y de telemedicina que les puede ayudar a identificar a los pacientes a quienes quizás beneficie un mayor apoyo.
Por ejemplo, es posible que gracias al uso del programa de análisis de voz de Kintsugi, una enfermera quiera tomarse un momento para preguntarle cómo se siente a alguna persona preocupada porque su bebé tiene cólicos.
Una inquietud acerca del desarrollo de estas tecnologías de aprendizaje automático es el problema de los prejuicios: garantizar que los programas funcionen de manera equitativa para todos los pacientes, sin importar su edad, género, procedencia étnica, nacionalidad y otros criterios demográficos.
“Para que los modelos de aprendizaje automático funcionen bien, en verdad hay que contar con un conjunto de datos muy grande, diverso y sólido”, mencionó Chang, y señaló que, para evitar este problema en particular, Kintsugi usaba grabaciones de voz de todo el mundo y en muchos idiomas.
Otra inquietud importante en este campo emergente es la privacidad, sobre todo porque los datos de voz pueden usarse para identificar a las personas, comentó Bentley.
Incluso cuando los pacientes aceptan que los graben, en ocasiones el consentimiento es doble. Además de evaluar la salud mental del paciente, algunos programas de análisis de voz usan las grabaciones para desarrollar y perfeccionar sus propios algoritmos.
Según Bentley, otro reto es la posible desconfianza del consumidor en el aprendizaje automático y en los algoritmos llamados de la caja negra, los cuales funcionan de modos en que ni siquiera los desarrolladores mismos son capaces de explicar, sobre todo qué características usan para hacer los pronósticos.
“Una cosa es crear el algoritmo y otra es entender el algoritmo”, explicó Alexander Young, director interino del Instituto Semel para la Neurociencia y el Comportamiento Humano y presidente de psiquiatría en la Universidad de California, Los Ángeles, sumándose a las inquietudes de muchos investigadores sobre la inteligencia artificial y el aprendizaje automático en general: que existe poca, o ninguna, supervisión de seres humanos durante la fase de entrenamiento del programa.
aranza