Nova IA surge como candidata a ‘super cérebro’ de hospitais e grupos de saúde


Med PaLM M entende diferentes tipos de dados, transfere conhecimento entre áreas e realiza tarefas variadas na área biomédica

Por Bruno Romani
Atualização:

Enquanto médicos e pacientes ainda tentam entender como a inteligência artificial (IA) se encaixa em suas rotinas, um avanço na área promete criar uma nova classe de sistemas com potencial para ser o “super cérebro” de hospitais e grupos de saúde, comandando desde a triagem de pessoas até análises genéticas.

A pista para o futuro da IA na saúde veio em 26 de julho, quando pesquisadores do Google e de sua empresa ‘irmã’, a DeepMind, descreveram em um artigo científico os caminhos para uma IA “generalista” em biomedicina. Em outras palavras, um sistema capaz de realizar várias tarefas diferentes dentro do campo biomédico, algo inédito no momento.

Embora algoritmos médicos não sejam totalmente uma novidade, a maneira como eles operam é bastante diferente do que propõe uma IA generalista. Normalmente, esses sistemas são conhecidos como “algoritmos rasos” - trabalham apenas em uma única tarefa e não conseguem transportar conhecimento entre áreas de atividade. Uma IA para análise de imagem de exames, por exemplo, não é capaz de oferecer sugestões de tratamentos registrados na literatura médica.

continua após a publicidade

O que o artigo do Google propõe é um super algoritmo capaz de trabalhar com multimodalidade - essa palavra se refere a um sistema capaz de lidar com vários tipos de dados ao mesmo tempo, como fotos, vídeos, tabelas e texto em linguagem natural. É uma área da IA que está ganhando atenção, mas cujos avanços permanecem quase misteriosos.

A control monitor is seen during a heart catheterization at the Heidelberg University Hospital (Universitaetsklinikum Heidelberg) in Heidelberg, Germany, August 14, 2018. Picture taken August 14, 2018. To match Insight HEALTHCARE-MEDICAL TECHNOLOGY/AI REUTERS/Ralph Orlowski Foto: RALPH ORLOWSKI / REUTERS

Em março, a OpenAI anunciou que o GPT-4, o “novo cérebro” do ChatGPT, seria capaz de entender texto e fotos, mas esse recurso nunca foi disponibilizado publicamente. O Google também anunciou capacidade do tipo para o Bard, mas apenas nos EUA. Nos dois casos, as promessas eram simples: respostas em texto para comandos feitos a partir de imagens.

continua após a publicidade

A multimodalidade na saúde, porém, carrega enorme potencial. Ela quebra a barreira entre diferentes tipos de dados e torna mais fácil a manipulação por profissionais. Exames de imagem, fichas de pacientes e literatura médica passam a conversar em único ambiente. “Sistemas desse tipo facilitam a interação entre homem e máquina”, explica André Filipe Batista, professor do Insper.

Batizado de Med Palm M, a nova IA é capaz de realizar 14 tarefas diferentes, entre elas análise e geração de laudo de exames de raio-x, classificação de dados genéticos, geração de respostas a partir de literatura médica e análise de exames de mamografia e de dermatologia.

continua após a publicidade

Os resultados parecem promissores. O material comparou a performance do Med Palm M com a de médicos na produção de laudos de exames de imagem do tórax. Em 246 casos, um grupo de profissionais demonstrou preferência pelo trabalho da máquina em 40,5% dos casos.

Google CEO Sundar Pichai speaks on stage during the annual Google I/O developers conference in San Jose, California, U.S., May 17, 2017. REUTERS/Stephen Lam Foto: STEPHEN LAM / REUTERS

Mais importante: os cientistas notaram que o sistema apresentou raciocínio “zero shot”. Ou seja, ele conseguiu aprender informações com um tipo de dado e transferir esse conhecimento ao analisar outro tipo de dado. “Sistemas desse tipo são um sonho, pois são muito mais precisos e úteis. Eles serão mais parecidos com um médico humano porque vão juntar informações diferentes para elaborar algo novo”, explica Felipe Kitamura, diretor de inovações aplicadas e IA da Rede Dasa.

continua após a publicidade

A complexidade na execução de tarefas de sistemas como o Med Pal M reflete a sofisticação de como foram construídos - é como se ele englobasse vários algoritmos diferentes que passam a se comunicar no mesmo “idioma”.

Para construir o Med Palm M, os pesquisadores treinaram com dados médicos o PaLM-E, uma sistema de IA multimodal, que é o resultado da junção de duas outras IAs: o PaLM (um sistema parecido com o GPT) e o ViT (especializado em imagens).

Vantagens e desvantagens

continua após a publicidade

Alexandre Chiavegatto Filho, diretor do Laboratório de Big Data e Análise Preditiva em Saúde (Labdaps) da USP, recebeu com cautela o artigo do Med PaLM M. “Nada indica que ele será um marco no campo da IA”, afirma ele. “Os pesquisadores não divulgaram o código para avaliação externa e já houve muitos algoritmos que prometeram muito e entregaram pouco”, diz.

Um dos exemplos é o Watson Health, da IBM, que prometia auxiliar diferentes áreas da saúde, mas que não conseguiu entregar os resultados esperados. De fato, o Med PaLM M é apresentado como uma prova de conceito, que precisa de muitos testes antes de sair do campo científico. Até aqui, nem o artigo passou por revisão de pares.

Já Kitamura explica que um dos obstáculos de IAs multimodais na saúde é conseguir reunir ao mesmo tempo todas as informações dos pacientes, que costumam ficar espalhados em diferentes lugares do processo, como laboratórios, consultórios, hospitais.

continua após a publicidade

Caso consiga provar suas funcionalidades e reunir os dados necessários, modelos multitarefas podem ter papel importante na medicina. “Em áreas remotas, que não contam com médicos especialistas, a IA generalista poderá ajudar médicos a navegarem por áreas nas quais não são especialistas”, explica Chiavegatto.

O que os especialistas dizem é o seguinte: provavelmente, a IA jamais terá o mesmo nível de conhecimento de um médico oncologista, mas ela poderá ser uma ferramenta importante para ajudar um clínico geral em municípios afastados a entender e tomar decisões relacionadas ao câncer. O tempo vai dizer se a super IA da saúde vai virar realidade.

“Há desafios a superar, mas a área é promissora. De modo geral, no mundo da IA, estamos na pré-história. Quando falamos de IA multimodais na saúde, estamos antes da pré-história”, diz Chiavegatto.

Enquanto médicos e pacientes ainda tentam entender como a inteligência artificial (IA) se encaixa em suas rotinas, um avanço na área promete criar uma nova classe de sistemas com potencial para ser o “super cérebro” de hospitais e grupos de saúde, comandando desde a triagem de pessoas até análises genéticas.

A pista para o futuro da IA na saúde veio em 26 de julho, quando pesquisadores do Google e de sua empresa ‘irmã’, a DeepMind, descreveram em um artigo científico os caminhos para uma IA “generalista” em biomedicina. Em outras palavras, um sistema capaz de realizar várias tarefas diferentes dentro do campo biomédico, algo inédito no momento.

Embora algoritmos médicos não sejam totalmente uma novidade, a maneira como eles operam é bastante diferente do que propõe uma IA generalista. Normalmente, esses sistemas são conhecidos como “algoritmos rasos” - trabalham apenas em uma única tarefa e não conseguem transportar conhecimento entre áreas de atividade. Uma IA para análise de imagem de exames, por exemplo, não é capaz de oferecer sugestões de tratamentos registrados na literatura médica.

O que o artigo do Google propõe é um super algoritmo capaz de trabalhar com multimodalidade - essa palavra se refere a um sistema capaz de lidar com vários tipos de dados ao mesmo tempo, como fotos, vídeos, tabelas e texto em linguagem natural. É uma área da IA que está ganhando atenção, mas cujos avanços permanecem quase misteriosos.

A control monitor is seen during a heart catheterization at the Heidelberg University Hospital (Universitaetsklinikum Heidelberg) in Heidelberg, Germany, August 14, 2018. Picture taken August 14, 2018. To match Insight HEALTHCARE-MEDICAL TECHNOLOGY/AI REUTERS/Ralph Orlowski Foto: RALPH ORLOWSKI / REUTERS

Em março, a OpenAI anunciou que o GPT-4, o “novo cérebro” do ChatGPT, seria capaz de entender texto e fotos, mas esse recurso nunca foi disponibilizado publicamente. O Google também anunciou capacidade do tipo para o Bard, mas apenas nos EUA. Nos dois casos, as promessas eram simples: respostas em texto para comandos feitos a partir de imagens.

A multimodalidade na saúde, porém, carrega enorme potencial. Ela quebra a barreira entre diferentes tipos de dados e torna mais fácil a manipulação por profissionais. Exames de imagem, fichas de pacientes e literatura médica passam a conversar em único ambiente. “Sistemas desse tipo facilitam a interação entre homem e máquina”, explica André Filipe Batista, professor do Insper.

Batizado de Med Palm M, a nova IA é capaz de realizar 14 tarefas diferentes, entre elas análise e geração de laudo de exames de raio-x, classificação de dados genéticos, geração de respostas a partir de literatura médica e análise de exames de mamografia e de dermatologia.

Os resultados parecem promissores. O material comparou a performance do Med Palm M com a de médicos na produção de laudos de exames de imagem do tórax. Em 246 casos, um grupo de profissionais demonstrou preferência pelo trabalho da máquina em 40,5% dos casos.

Google CEO Sundar Pichai speaks on stage during the annual Google I/O developers conference in San Jose, California, U.S., May 17, 2017. REUTERS/Stephen Lam Foto: STEPHEN LAM / REUTERS

Mais importante: os cientistas notaram que o sistema apresentou raciocínio “zero shot”. Ou seja, ele conseguiu aprender informações com um tipo de dado e transferir esse conhecimento ao analisar outro tipo de dado. “Sistemas desse tipo são um sonho, pois são muito mais precisos e úteis. Eles serão mais parecidos com um médico humano porque vão juntar informações diferentes para elaborar algo novo”, explica Felipe Kitamura, diretor de inovações aplicadas e IA da Rede Dasa.

A complexidade na execução de tarefas de sistemas como o Med Pal M reflete a sofisticação de como foram construídos - é como se ele englobasse vários algoritmos diferentes que passam a se comunicar no mesmo “idioma”.

Para construir o Med Palm M, os pesquisadores treinaram com dados médicos o PaLM-E, uma sistema de IA multimodal, que é o resultado da junção de duas outras IAs: o PaLM (um sistema parecido com o GPT) e o ViT (especializado em imagens).

Vantagens e desvantagens

Alexandre Chiavegatto Filho, diretor do Laboratório de Big Data e Análise Preditiva em Saúde (Labdaps) da USP, recebeu com cautela o artigo do Med PaLM M. “Nada indica que ele será um marco no campo da IA”, afirma ele. “Os pesquisadores não divulgaram o código para avaliação externa e já houve muitos algoritmos que prometeram muito e entregaram pouco”, diz.

Um dos exemplos é o Watson Health, da IBM, que prometia auxiliar diferentes áreas da saúde, mas que não conseguiu entregar os resultados esperados. De fato, o Med PaLM M é apresentado como uma prova de conceito, que precisa de muitos testes antes de sair do campo científico. Até aqui, nem o artigo passou por revisão de pares.

Já Kitamura explica que um dos obstáculos de IAs multimodais na saúde é conseguir reunir ao mesmo tempo todas as informações dos pacientes, que costumam ficar espalhados em diferentes lugares do processo, como laboratórios, consultórios, hospitais.

Caso consiga provar suas funcionalidades e reunir os dados necessários, modelos multitarefas podem ter papel importante na medicina. “Em áreas remotas, que não contam com médicos especialistas, a IA generalista poderá ajudar médicos a navegarem por áreas nas quais não são especialistas”, explica Chiavegatto.

O que os especialistas dizem é o seguinte: provavelmente, a IA jamais terá o mesmo nível de conhecimento de um médico oncologista, mas ela poderá ser uma ferramenta importante para ajudar um clínico geral em municípios afastados a entender e tomar decisões relacionadas ao câncer. O tempo vai dizer se a super IA da saúde vai virar realidade.

“Há desafios a superar, mas a área é promissora. De modo geral, no mundo da IA, estamos na pré-história. Quando falamos de IA multimodais na saúde, estamos antes da pré-história”, diz Chiavegatto.

Enquanto médicos e pacientes ainda tentam entender como a inteligência artificial (IA) se encaixa em suas rotinas, um avanço na área promete criar uma nova classe de sistemas com potencial para ser o “super cérebro” de hospitais e grupos de saúde, comandando desde a triagem de pessoas até análises genéticas.

A pista para o futuro da IA na saúde veio em 26 de julho, quando pesquisadores do Google e de sua empresa ‘irmã’, a DeepMind, descreveram em um artigo científico os caminhos para uma IA “generalista” em biomedicina. Em outras palavras, um sistema capaz de realizar várias tarefas diferentes dentro do campo biomédico, algo inédito no momento.

Embora algoritmos médicos não sejam totalmente uma novidade, a maneira como eles operam é bastante diferente do que propõe uma IA generalista. Normalmente, esses sistemas são conhecidos como “algoritmos rasos” - trabalham apenas em uma única tarefa e não conseguem transportar conhecimento entre áreas de atividade. Uma IA para análise de imagem de exames, por exemplo, não é capaz de oferecer sugestões de tratamentos registrados na literatura médica.

O que o artigo do Google propõe é um super algoritmo capaz de trabalhar com multimodalidade - essa palavra se refere a um sistema capaz de lidar com vários tipos de dados ao mesmo tempo, como fotos, vídeos, tabelas e texto em linguagem natural. É uma área da IA que está ganhando atenção, mas cujos avanços permanecem quase misteriosos.

A control monitor is seen during a heart catheterization at the Heidelberg University Hospital (Universitaetsklinikum Heidelberg) in Heidelberg, Germany, August 14, 2018. Picture taken August 14, 2018. To match Insight HEALTHCARE-MEDICAL TECHNOLOGY/AI REUTERS/Ralph Orlowski Foto: RALPH ORLOWSKI / REUTERS

Em março, a OpenAI anunciou que o GPT-4, o “novo cérebro” do ChatGPT, seria capaz de entender texto e fotos, mas esse recurso nunca foi disponibilizado publicamente. O Google também anunciou capacidade do tipo para o Bard, mas apenas nos EUA. Nos dois casos, as promessas eram simples: respostas em texto para comandos feitos a partir de imagens.

A multimodalidade na saúde, porém, carrega enorme potencial. Ela quebra a barreira entre diferentes tipos de dados e torna mais fácil a manipulação por profissionais. Exames de imagem, fichas de pacientes e literatura médica passam a conversar em único ambiente. “Sistemas desse tipo facilitam a interação entre homem e máquina”, explica André Filipe Batista, professor do Insper.

Batizado de Med Palm M, a nova IA é capaz de realizar 14 tarefas diferentes, entre elas análise e geração de laudo de exames de raio-x, classificação de dados genéticos, geração de respostas a partir de literatura médica e análise de exames de mamografia e de dermatologia.

Os resultados parecem promissores. O material comparou a performance do Med Palm M com a de médicos na produção de laudos de exames de imagem do tórax. Em 246 casos, um grupo de profissionais demonstrou preferência pelo trabalho da máquina em 40,5% dos casos.

Google CEO Sundar Pichai speaks on stage during the annual Google I/O developers conference in San Jose, California, U.S., May 17, 2017. REUTERS/Stephen Lam Foto: STEPHEN LAM / REUTERS

Mais importante: os cientistas notaram que o sistema apresentou raciocínio “zero shot”. Ou seja, ele conseguiu aprender informações com um tipo de dado e transferir esse conhecimento ao analisar outro tipo de dado. “Sistemas desse tipo são um sonho, pois são muito mais precisos e úteis. Eles serão mais parecidos com um médico humano porque vão juntar informações diferentes para elaborar algo novo”, explica Felipe Kitamura, diretor de inovações aplicadas e IA da Rede Dasa.

A complexidade na execução de tarefas de sistemas como o Med Pal M reflete a sofisticação de como foram construídos - é como se ele englobasse vários algoritmos diferentes que passam a se comunicar no mesmo “idioma”.

Para construir o Med Palm M, os pesquisadores treinaram com dados médicos o PaLM-E, uma sistema de IA multimodal, que é o resultado da junção de duas outras IAs: o PaLM (um sistema parecido com o GPT) e o ViT (especializado em imagens).

Vantagens e desvantagens

Alexandre Chiavegatto Filho, diretor do Laboratório de Big Data e Análise Preditiva em Saúde (Labdaps) da USP, recebeu com cautela o artigo do Med PaLM M. “Nada indica que ele será um marco no campo da IA”, afirma ele. “Os pesquisadores não divulgaram o código para avaliação externa e já houve muitos algoritmos que prometeram muito e entregaram pouco”, diz.

Um dos exemplos é o Watson Health, da IBM, que prometia auxiliar diferentes áreas da saúde, mas que não conseguiu entregar os resultados esperados. De fato, o Med PaLM M é apresentado como uma prova de conceito, que precisa de muitos testes antes de sair do campo científico. Até aqui, nem o artigo passou por revisão de pares.

Já Kitamura explica que um dos obstáculos de IAs multimodais na saúde é conseguir reunir ao mesmo tempo todas as informações dos pacientes, que costumam ficar espalhados em diferentes lugares do processo, como laboratórios, consultórios, hospitais.

Caso consiga provar suas funcionalidades e reunir os dados necessários, modelos multitarefas podem ter papel importante na medicina. “Em áreas remotas, que não contam com médicos especialistas, a IA generalista poderá ajudar médicos a navegarem por áreas nas quais não são especialistas”, explica Chiavegatto.

O que os especialistas dizem é o seguinte: provavelmente, a IA jamais terá o mesmo nível de conhecimento de um médico oncologista, mas ela poderá ser uma ferramenta importante para ajudar um clínico geral em municípios afastados a entender e tomar decisões relacionadas ao câncer. O tempo vai dizer se a super IA da saúde vai virar realidade.

“Há desafios a superar, mas a área é promissora. De modo geral, no mundo da IA, estamos na pré-história. Quando falamos de IA multimodais na saúde, estamos antes da pré-história”, diz Chiavegatto.

Enquanto médicos e pacientes ainda tentam entender como a inteligência artificial (IA) se encaixa em suas rotinas, um avanço na área promete criar uma nova classe de sistemas com potencial para ser o “super cérebro” de hospitais e grupos de saúde, comandando desde a triagem de pessoas até análises genéticas.

A pista para o futuro da IA na saúde veio em 26 de julho, quando pesquisadores do Google e de sua empresa ‘irmã’, a DeepMind, descreveram em um artigo científico os caminhos para uma IA “generalista” em biomedicina. Em outras palavras, um sistema capaz de realizar várias tarefas diferentes dentro do campo biomédico, algo inédito no momento.

Embora algoritmos médicos não sejam totalmente uma novidade, a maneira como eles operam é bastante diferente do que propõe uma IA generalista. Normalmente, esses sistemas são conhecidos como “algoritmos rasos” - trabalham apenas em uma única tarefa e não conseguem transportar conhecimento entre áreas de atividade. Uma IA para análise de imagem de exames, por exemplo, não é capaz de oferecer sugestões de tratamentos registrados na literatura médica.

O que o artigo do Google propõe é um super algoritmo capaz de trabalhar com multimodalidade - essa palavra se refere a um sistema capaz de lidar com vários tipos de dados ao mesmo tempo, como fotos, vídeos, tabelas e texto em linguagem natural. É uma área da IA que está ganhando atenção, mas cujos avanços permanecem quase misteriosos.

A control monitor is seen during a heart catheterization at the Heidelberg University Hospital (Universitaetsklinikum Heidelberg) in Heidelberg, Germany, August 14, 2018. Picture taken August 14, 2018. To match Insight HEALTHCARE-MEDICAL TECHNOLOGY/AI REUTERS/Ralph Orlowski Foto: RALPH ORLOWSKI / REUTERS

Em março, a OpenAI anunciou que o GPT-4, o “novo cérebro” do ChatGPT, seria capaz de entender texto e fotos, mas esse recurso nunca foi disponibilizado publicamente. O Google também anunciou capacidade do tipo para o Bard, mas apenas nos EUA. Nos dois casos, as promessas eram simples: respostas em texto para comandos feitos a partir de imagens.

A multimodalidade na saúde, porém, carrega enorme potencial. Ela quebra a barreira entre diferentes tipos de dados e torna mais fácil a manipulação por profissionais. Exames de imagem, fichas de pacientes e literatura médica passam a conversar em único ambiente. “Sistemas desse tipo facilitam a interação entre homem e máquina”, explica André Filipe Batista, professor do Insper.

Batizado de Med Palm M, a nova IA é capaz de realizar 14 tarefas diferentes, entre elas análise e geração de laudo de exames de raio-x, classificação de dados genéticos, geração de respostas a partir de literatura médica e análise de exames de mamografia e de dermatologia.

Os resultados parecem promissores. O material comparou a performance do Med Palm M com a de médicos na produção de laudos de exames de imagem do tórax. Em 246 casos, um grupo de profissionais demonstrou preferência pelo trabalho da máquina em 40,5% dos casos.

Google CEO Sundar Pichai speaks on stage during the annual Google I/O developers conference in San Jose, California, U.S., May 17, 2017. REUTERS/Stephen Lam Foto: STEPHEN LAM / REUTERS

Mais importante: os cientistas notaram que o sistema apresentou raciocínio “zero shot”. Ou seja, ele conseguiu aprender informações com um tipo de dado e transferir esse conhecimento ao analisar outro tipo de dado. “Sistemas desse tipo são um sonho, pois são muito mais precisos e úteis. Eles serão mais parecidos com um médico humano porque vão juntar informações diferentes para elaborar algo novo”, explica Felipe Kitamura, diretor de inovações aplicadas e IA da Rede Dasa.

A complexidade na execução de tarefas de sistemas como o Med Pal M reflete a sofisticação de como foram construídos - é como se ele englobasse vários algoritmos diferentes que passam a se comunicar no mesmo “idioma”.

Para construir o Med Palm M, os pesquisadores treinaram com dados médicos o PaLM-E, uma sistema de IA multimodal, que é o resultado da junção de duas outras IAs: o PaLM (um sistema parecido com o GPT) e o ViT (especializado em imagens).

Vantagens e desvantagens

Alexandre Chiavegatto Filho, diretor do Laboratório de Big Data e Análise Preditiva em Saúde (Labdaps) da USP, recebeu com cautela o artigo do Med PaLM M. “Nada indica que ele será um marco no campo da IA”, afirma ele. “Os pesquisadores não divulgaram o código para avaliação externa e já houve muitos algoritmos que prometeram muito e entregaram pouco”, diz.

Um dos exemplos é o Watson Health, da IBM, que prometia auxiliar diferentes áreas da saúde, mas que não conseguiu entregar os resultados esperados. De fato, o Med PaLM M é apresentado como uma prova de conceito, que precisa de muitos testes antes de sair do campo científico. Até aqui, nem o artigo passou por revisão de pares.

Já Kitamura explica que um dos obstáculos de IAs multimodais na saúde é conseguir reunir ao mesmo tempo todas as informações dos pacientes, que costumam ficar espalhados em diferentes lugares do processo, como laboratórios, consultórios, hospitais.

Caso consiga provar suas funcionalidades e reunir os dados necessários, modelos multitarefas podem ter papel importante na medicina. “Em áreas remotas, que não contam com médicos especialistas, a IA generalista poderá ajudar médicos a navegarem por áreas nas quais não são especialistas”, explica Chiavegatto.

O que os especialistas dizem é o seguinte: provavelmente, a IA jamais terá o mesmo nível de conhecimento de um médico oncologista, mas ela poderá ser uma ferramenta importante para ajudar um clínico geral em municípios afastados a entender e tomar decisões relacionadas ao câncer. O tempo vai dizer se a super IA da saúde vai virar realidade.

“Há desafios a superar, mas a área é promissora. De modo geral, no mundo da IA, estamos na pré-história. Quando falamos de IA multimodais na saúde, estamos antes da pré-história”, diz Chiavegatto.

Enquanto médicos e pacientes ainda tentam entender como a inteligência artificial (IA) se encaixa em suas rotinas, um avanço na área promete criar uma nova classe de sistemas com potencial para ser o “super cérebro” de hospitais e grupos de saúde, comandando desde a triagem de pessoas até análises genéticas.

A pista para o futuro da IA na saúde veio em 26 de julho, quando pesquisadores do Google e de sua empresa ‘irmã’, a DeepMind, descreveram em um artigo científico os caminhos para uma IA “generalista” em biomedicina. Em outras palavras, um sistema capaz de realizar várias tarefas diferentes dentro do campo biomédico, algo inédito no momento.

Embora algoritmos médicos não sejam totalmente uma novidade, a maneira como eles operam é bastante diferente do que propõe uma IA generalista. Normalmente, esses sistemas são conhecidos como “algoritmos rasos” - trabalham apenas em uma única tarefa e não conseguem transportar conhecimento entre áreas de atividade. Uma IA para análise de imagem de exames, por exemplo, não é capaz de oferecer sugestões de tratamentos registrados na literatura médica.

O que o artigo do Google propõe é um super algoritmo capaz de trabalhar com multimodalidade - essa palavra se refere a um sistema capaz de lidar com vários tipos de dados ao mesmo tempo, como fotos, vídeos, tabelas e texto em linguagem natural. É uma área da IA que está ganhando atenção, mas cujos avanços permanecem quase misteriosos.

A control monitor is seen during a heart catheterization at the Heidelberg University Hospital (Universitaetsklinikum Heidelberg) in Heidelberg, Germany, August 14, 2018. Picture taken August 14, 2018. To match Insight HEALTHCARE-MEDICAL TECHNOLOGY/AI REUTERS/Ralph Orlowski Foto: RALPH ORLOWSKI / REUTERS

Em março, a OpenAI anunciou que o GPT-4, o “novo cérebro” do ChatGPT, seria capaz de entender texto e fotos, mas esse recurso nunca foi disponibilizado publicamente. O Google também anunciou capacidade do tipo para o Bard, mas apenas nos EUA. Nos dois casos, as promessas eram simples: respostas em texto para comandos feitos a partir de imagens.

A multimodalidade na saúde, porém, carrega enorme potencial. Ela quebra a barreira entre diferentes tipos de dados e torna mais fácil a manipulação por profissionais. Exames de imagem, fichas de pacientes e literatura médica passam a conversar em único ambiente. “Sistemas desse tipo facilitam a interação entre homem e máquina”, explica André Filipe Batista, professor do Insper.

Batizado de Med Palm M, a nova IA é capaz de realizar 14 tarefas diferentes, entre elas análise e geração de laudo de exames de raio-x, classificação de dados genéticos, geração de respostas a partir de literatura médica e análise de exames de mamografia e de dermatologia.

Os resultados parecem promissores. O material comparou a performance do Med Palm M com a de médicos na produção de laudos de exames de imagem do tórax. Em 246 casos, um grupo de profissionais demonstrou preferência pelo trabalho da máquina em 40,5% dos casos.

Google CEO Sundar Pichai speaks on stage during the annual Google I/O developers conference in San Jose, California, U.S., May 17, 2017. REUTERS/Stephen Lam Foto: STEPHEN LAM / REUTERS

Mais importante: os cientistas notaram que o sistema apresentou raciocínio “zero shot”. Ou seja, ele conseguiu aprender informações com um tipo de dado e transferir esse conhecimento ao analisar outro tipo de dado. “Sistemas desse tipo são um sonho, pois são muito mais precisos e úteis. Eles serão mais parecidos com um médico humano porque vão juntar informações diferentes para elaborar algo novo”, explica Felipe Kitamura, diretor de inovações aplicadas e IA da Rede Dasa.

A complexidade na execução de tarefas de sistemas como o Med Pal M reflete a sofisticação de como foram construídos - é como se ele englobasse vários algoritmos diferentes que passam a se comunicar no mesmo “idioma”.

Para construir o Med Palm M, os pesquisadores treinaram com dados médicos o PaLM-E, uma sistema de IA multimodal, que é o resultado da junção de duas outras IAs: o PaLM (um sistema parecido com o GPT) e o ViT (especializado em imagens).

Vantagens e desvantagens

Alexandre Chiavegatto Filho, diretor do Laboratório de Big Data e Análise Preditiva em Saúde (Labdaps) da USP, recebeu com cautela o artigo do Med PaLM M. “Nada indica que ele será um marco no campo da IA”, afirma ele. “Os pesquisadores não divulgaram o código para avaliação externa e já houve muitos algoritmos que prometeram muito e entregaram pouco”, diz.

Um dos exemplos é o Watson Health, da IBM, que prometia auxiliar diferentes áreas da saúde, mas que não conseguiu entregar os resultados esperados. De fato, o Med PaLM M é apresentado como uma prova de conceito, que precisa de muitos testes antes de sair do campo científico. Até aqui, nem o artigo passou por revisão de pares.

Já Kitamura explica que um dos obstáculos de IAs multimodais na saúde é conseguir reunir ao mesmo tempo todas as informações dos pacientes, que costumam ficar espalhados em diferentes lugares do processo, como laboratórios, consultórios, hospitais.

Caso consiga provar suas funcionalidades e reunir os dados necessários, modelos multitarefas podem ter papel importante na medicina. “Em áreas remotas, que não contam com médicos especialistas, a IA generalista poderá ajudar médicos a navegarem por áreas nas quais não são especialistas”, explica Chiavegatto.

O que os especialistas dizem é o seguinte: provavelmente, a IA jamais terá o mesmo nível de conhecimento de um médico oncologista, mas ela poderá ser uma ferramenta importante para ajudar um clínico geral em municípios afastados a entender e tomar decisões relacionadas ao câncer. O tempo vai dizer se a super IA da saúde vai virar realidade.

“Há desafios a superar, mas a área é promissora. De modo geral, no mundo da IA, estamos na pré-história. Quando falamos de IA multimodais na saúde, estamos antes da pré-história”, diz Chiavegatto.

Atualizamos nossa política de cookies

Ao utilizar nossos serviços, você aceita a política de monitoramento de cookies.