Inteligência artificial quer identificar ansiedade e depressão pela voz

Pesquisadores afirmam que a tonalidade de voz e nuances imperceptíveis ao ouvido humano na fala podem ajudar no diagnóstico de doenças como depressão e ansiedade

PUBLICIDADE

Por Ingrid K. Williams
Alguns aplicativos de celular já conseguem fazer uma pequena análise de voz para determinar startus de saúde mental Foto: Alexey Malgavko/Reuters

Imagine um exame tão simples e rápido quanto medir a temperatura ou aferir a pressão arterial que fosse capaz de identificar um transtorno de ansiedade ou prever uma próxima crise de depressão.

PUBLICIDADE

Os profissionais de saúde têm muitas ferramentas para avaliar a condição física de um paciente, mas nenhum biomarcador confiável – indicadores objetivos do estado de saúde do paciente – para avaliar a saúde mental.

Mas agora alguns pesquisadores de inteligência artificial acreditam que o som da sua voz talvez seja a chave para entender seu estado mental – e que a inteligência artificial é perfeitamente preparada para detectar essas mudanças difíceis, se não impossíveis, de perceber de outra maneira. O resultado é um conjunto de aplicativos e ferramentas online desenvolvidas para monitorar seu estado mental, assim como programas que fornecem avaliações de saúde mental em tempo real para serviços de telemedicina e triagem de pacientes por telefone.

Os psicólogos sabem há muito tempo que certos problemas de saúde mental podem ser detectados ao escutar não apenas o que uma pessoa diz, mas como ela diz, afirma Maria Espinola, psicóloga e professora da Faculdade de Medicina da Universidade de Cincinnati.

Segundo ela, no caso de pacientes deprimidos, “o modo de falar costuma ser mais monótono, sem alterações de tom e mais brando. Eles também apresentam uma variedade de tons de voz reduzida e volume mais baixo. Fazem mais pausas e param com mais frequência”.

Publicidade

Pacientes com ansiedade sentem mais tensão em seus corpos, o que também pode mudar a forma como a voz deles soa, disse ela. “Eles tendem a falar mais rápido. E têm mais dificuldade em respirar.”

Atualmente, esses tipos de características vocais estão sendo aproveitados por pesquisadores de aprendizado de máquina para prognosticar depressão e ansiedade, assim como outros transtornos mentais, como esquizofrenia e transtorno de estresse pós-traumático. O uso de algoritmos de aprendizado profundo pode detectar padrões e características adicionais, como os registrados em gravações de voz curtas, que talvez não sejam evidentes nem mesmo para especialistas treinados.

“A tecnologia que estamos usando agora é capaz de identificar características significativas que nem mesmo o ouvido humano consegue captar”, disse Kate Bentley, professora da Escola de Medicina Harvard e psicóloga clínica do Hospital Geral de Massachusetts.

“Há muito entusiasmo sobre encontrar indicadores biológicos ou mais objetivos de diagnósticos psiquiátricos que vão além das formas mais subjetivas de avaliação tradicionalmente usadas, como entrevistas realizadas por médicos ou relatos pessoais”, disse ela. Outras pistas que os pesquisadores estão monitorando incluem mudanças nos níveis de atividade, padrões de sono e informações nas redes sociais.

Esses avanços tecnológicos chegam em um momento no qual a necessidade de cuidados de saúde mental é especialmente alta. De acordo com um relatório da Aliança Nacional de Doenças Mentais dos Estados Unidos, um em cada cinco adultos no país apresentou um transtorno mental em 2020. E os números continuam a aumentar.

Publicidade

Embora a tecnologia de inteligência artificial não possa solucionar a escassez de profissionais de saúde mental qualificados – não há o suficiente para dar conta da demanda no país, disse Kate – há esperança de que ela talvez reduza as dificuldades para receber um diagnóstico correto, ajudar os médicos a identificar pacientes talvez resistentes em procurar atendimento e facilitar a autoavaliação entre as consultas.

“Muita coisa pode acontecer entre as consultas, e a tecnologia pode de fato nos oferecer a possibilidade de melhorar o acompanhamento e a avaliação de maneira mais contínua”, disse Kate.

Para testar essa nova tecnologia, comecei baixando o aplicativo Mental Fitness da Sonde Health, empresa de tecnologia para saúde, para ver se meus sentimentos de angústia eram sinal de algo sério ou se eu estava apenas definhando. Descrito como “um produto de acompanhamento de saúde mental por voz e diário”, o aplicativo gratuito me convidou a gravar meu primeiro registro, um relato de 30 segundos, que classificaria minha saúde mental em uma escala de 1 a 100.

Um minuto depois eu tinha minha pontuação: um não tão agradável 52. “Fique atento”, alertou o aplicativo.

Ele sinalizou que o nível de ânimo detectado na minha voz estava perceptivelmente baixo. Soei monótono apenas por estar tentando falar de forma calma? Devo considerar as sugestões do aplicativo para melhorar minha saúde mental e dar um passeio ou organizar minha casa? (A primeira pergunta talvez indique uma das possíveis falhas do aplicativo: como consumidor, pode ser difícil saber por que seu jeito de falar varia.) 

Publicidade

Mais tarde, sentindo-me tenso após fazer entrevistas, testei outro programa de análise de voz, este focado em detectar níveis de ansiedade. O StressWaves Test é uma ferramenta online gratuita da Cigna, multinacional de cuidados de saúde e seguros, desenvolvida em colaboração com a especialista em inteligência artificial Ellipsis Health para avaliar os níveis de estresse usando amostras de 60 segundos de fala gravada.

“O que lhe faz perder o sono à noite?” era a sugestão de tema do site. Depois de passar um minuto relatando minhas preocupações constantes, o programa avaliou minha gravação e me enviou um veredito por e-mail: “Seu nível de estresse é moderado”. Ao contrário do aplicativo da Sonde, o e-mail da Cigna não dava dicas úteis de como poderia melhorar por conta própria.

Outras tecnologias oferecem um possível aprimoramento à interação humana, como a Kintsugi, empresa com sede em Berkeley, na Califórnia, que arrecadou US$ 20 milhões em uma rodada de financiamento de série A recentemente. O nome da empresa faz referência à prática japonesa de recuperar porcelanas usando materiais para destacar os remendos, como ouro.

Fundada por Grace Chang e Rima Seiilova-Olson, que se uniram depois de compartilharem experiências anteriores de dificuldade para ter acesso a cuidados de saúde mental, a Kintsugi desenvolve tecnologia para a prática de telemedicina e triagem de pacientes por telefone para ajudar a identificar aqueles que talvez precisem de um maior suporte.

Ao usar o programa de análise de voz da Kintsugi, uma enfermeira pode receber, por exemplo, a sugestão de usar um minuto extra da consulta para perguntar a um pai atormentado com um bebê com cólica como ele anda se sentindo.

Publicidade

Uma preocupação com o desenvolvimento desses tipos de tecnologias de aprendizado de máquina é a questão do preconceito – garantir que os programas funcionem de forma imparcial para todos os pacientes, independentemente de idade, gênero, etnia, nacionalidade e outros critérios demográficos.

“Para que os modelos de aprendizado de máquina funcionem bem, você precisa de verdade ter um conjunto de dados muito grande, diversificado e robusto”, disse Grace, observando que a Kintsugi usou gravações de voz de todo o mundo, em muitos idiomas diferentes, para se proteger contra esse problema em particular.

Outra grande preocupação nessa nova área é a privacidade – sobretudo os dados de voz, que podem ser usados para identificar pessoas, disse Kate. 

E mesmo quando os pacientes concordam em ser gravados, a questão do consentimento às vezes não se limita àquele momento. Além de avaliar a saúde mental de um paciente, alguns programas de análise de voz usam as gravações para desenvolver e refinar seus próprios algoritmos.

Outro desafio, segundo Kate, é a possível desconfiança dos consumidores em relação ao aprendizado de máquina e à chamada caixa preta dos algoritmos, expressão usada para se referir ao fato de nem mesmo os próprios desenvolvedores serem capazes de explicar completamente o funcionamento deles – em especial, quais recursos eles usam para fazer essas previsões.

Publicidade

“Existe a criação do algoritmo e a compreensão do algoritmo”, disse Alexander Young, diretor interino do Instituto Semel de Neurociência e Comportamento Humano e chefe do departamento de psiquiatria da UCLA, reiterando as preocupações que muitos pesquisadores têm em relação à inteligência artificial e aprendizado de máquina em geral: que pouca ou nenhuma supervisão humana está presente durante a fase de treinamento do programa.

Por enquanto, Young mantém um otimismo cauteloso a respeito do potencial das tecnologias de análise de voz, principalmente como ferramentas para o acompanhamento dos pacientes por eles mesmos.

“Eu acredito mesmo que você possa identificar o estado de saúde mental das pessoas ou ter uma aproximação dele de uma maneira geral”, disse ele. “As pessoas gostam de poder se autoavaliar, de modo especial aquelas com doenças crônicas.”

Mas antes que as tecnologias automatizadas de análise de voz se tornem comuns, alguns profissionais estão exigindo investigações rigorosas da precisão delas.

“Sem dúvidas precisamos de mais validação não apenas da tecnologia de voz, mas, também, dos modelos de inteligência artificial e aprendizado de máquina desenvolvidos com outros fluxos de dados”, disse Kate. “E precisamos obter essa validação a partir de estudos significativos em larga escala e bem definidos.”

Publicidade

Até lá, a tecnologia de análise de voz com base na inteligência artificial continua sendo uma ferramenta promissora, porém não comprovada, que talvez no futuro seja um método comum para medir a temperatura do nosso bem-estar mental./TRADUÇÃO DE ROMINA CÁCIA