ChatGPT agora consegue ‘enxergar’ vídeo ao vivo e responder com voz; veja sistema em ação

Chatbot responde a informações exibidas pela câmera, além de perceber o que acontece na tela do celular do usuário

PUBLICIDADE

Foto do author Bruno Romani

No sexto dos 12 dias de anúncios da OpenAI, a companhia revelou nesta quinta, 12, que o chatbot agora consegue compreender informação em vídeo em tempo real e responder ao usuário com voz. O recurso começa a ficar disponível a partir desta quinta no aplicativo para usuários dos planos Plus e Pro, além da assinatura corporativa.

Com o novo recurso, o usuário pode abrir a câmera do celular e conversar com o ChatGPT sobre o mundo em volta dele. Ele, por exemplo, consegue memorizar nomes e características de pessoas ou reconhecer objetos para dar dicas. Segundo a OpenAI, a ferramenta compreende o áudio do usuário, relaciona essa informação com as imagens que enxerga pelas lentes do celular e produz uma resposta de áudio de maneira nativa - é mais uma demonstração de multimodalidade dos modelos atuais. Ou seja, a capacidade nativa de novos sistemas de inteligência artificial (IA) de processarem informação em formatos variados. Veja abaixo.

ChatGPT agora entende vídeo em tempo real e responde com voz  Foto: Michael Dwyer/AP

PUBLICIDADE

Outro recurso do tipo apresentado é a capacidade do ChatGPT ‘enxergar’ a tela do celular do usuário e interagir com voz baseado nas informações exibidas. Ele, por exemplo, pode sugerir respostas para mensagens de texto ou figurinhas recebidas em apps de bate-papo. O recurso também estreia nesta quinta.

Para completa os anúncios do dia, a OpenAI lançou um “modo Papai Noel”, no qual o chatbot emula com voz a personalidade do principal personagem de Natal - uma ferramenta que deve divertir crianças, embora esteja disponível apenas em inglês

Publicidade

Pedido de desculpas

A live desta quinta, no entanto, começou menos festiva. Ela abriu com Kevin Well, diretor de produtos da companhia, pedindo desculpa pelo apagão sofrido pela OpenAI na noite desta quarta. Todos os serviços da companhia, incluindo ChatGPT, o Sora e APIs usadas por desenvolvedores, ficaram fora do ar. Ele afirmou que a OpenAI vai emitir um comunicado sobre o tema e que as operações já voltaram ao normal.

No entanto, desde segunda, 9, os servidores da OpenAI estão sobrecarregados - o congestionamento ocorre desde a apresentação da IA Sora, que gera imagens a partir de comandos. Quatro dias depois, usuários relatam que não conseguem acessar o serviço - o Estadão vem monitorando a situação e também encontrou mensagem de tráfego alto na página do serviço.

Tudo Sobre
Comentários

Os comentários são exclusivos para assinantes do Estadão.