Meta lança IA que cria sons, vídeos e até sensação térmica a partir de textos

Novo modelo ImageBind é parte de uma pesquisa e inclui dados como de áudio e de temperatura

PUBLICIDADE

Foto do author Alice Labate
Atualização:

A gigante de tecnologia Meta, entrou na corrida da inteligência artificial (IA) e anunciou sua nova IA de código aberto — chamada ImageBind — capaz de gerar resultados multissensoriais, como áudio, imagens, vídeo e até mapas de calor a partir de um comando do usuário. A apresentação do recurso foi feita nesta terça-feira, 9, no site da companhia.

PUBLICIDADE

A ideia é criar um ecossistema de sensações: na plataforma, o usuário pode fazer o upload de um som de floresta, por exemplo, e receber imagens geradas a partir do som. Outra possibilidade é dar um comando em texto e receber um vídeo com o pedido. Isso porque a IA consegue conectar vários fluxos de dados, sendo esses visuais, textuais, térmicos, de movimento, de profundidade e de áudio.

O novo modelo da empresa faz parte de um projeto que estuda a capacidade de IAs generativas de criar experiências multissensoriais. O foco da pesquisa é reunir vários tipos de dados em uma só plataforma, para que seja possível usá-los com a linguagem de uma inteligência artificial.

A nova IA da meta conecta vários fluxos de dados Foto: Meta/Reprodução

De acordo com a empresa, a ferramenta poderá ser utilizada com equipamentos específicos no futuro, para produzir sensações ainda mais precisas — um pedido de “dia na praia” por escrito poderá transmitir o som das ondas no mar, o calor do ambiente e até a reprodução da paisagem em vídeo.

“O modelo aprende uma única incorporação, ou espaço de representação compartilhado, não apenas para texto, imagem/vídeo e áudio, mas também para sensores que registram profundidade (3D), informações térmicas (radiação infravermelha) e unidades de medição inercial (IMU), que calculam movimento e posição”, explicou a empresa no site.

Publicidade

Geradores de imagens por IA mais conhecidos , como a Midjourney e o DALL E -2, por exemplo, em fase de treinamento, precisam dos sistemas que unem palavras e imagens para que a tecnologia aprenda a associar ambos. Sendo assim, essa é a forma que IAs generativas — incluindo a ImageBind — são capazes de associar mais de um tipo de informação ao mesmo tempo.

A Meta já havia anunciado em fevereiro que planejava criar sua própria IA e competir no mercado das inteligências artificiais junto de outras granes empresas como o Google e a Microsoft.

Essa “febre” das IAs surgiu pouco tempo depois do lançamento do ChatGPT, pela OpenAI, co-fundada por Elon Musk, um dos bilionários que assinaram a carta anti-IA pedindo para que os desenvolvimentos de IA fossem pausados.

Comentários

Os comentários são exclusivos para assinantes do Estadão.