No sexto dos 12 dias de anúncios da OpenAI, a companhia revelou nesta quinta, 12, que o chatbot agora consegue compreender informação em vídeo em tempo real e responder ao usuário com voz. O recurso começa a ficar disponível a partir desta quinta no aplicativo para usuários dos planos Plus e Pro, além da assinatura corporativa.
Com o novo recurso, o usuário pode abrir a câmera do celular e conversar com o ChatGPT sobre o mundo em volta dele. Ele, por exemplo, consegue memorizar nomes e características de pessoas ou reconhecer objetos para dar dicas. Segundo a OpenAI, a ferramenta compreende o áudio do usuário, relaciona essa informação com as imagens que enxerga pelas lentes do celular e produz uma resposta de áudio de maneira nativa - é mais uma demonstração de multimodalidade dos modelos atuais. Ou seja, a capacidade nativa de novos sistemas de inteligência artificial (IA) de processarem informação em formatos variados. Veja abaixo.
Outro recurso do tipo apresentado é a capacidade do ChatGPT ‘enxergar’ a tela do celular do usuário e interagir com voz baseado nas informações exibidas. Ele, por exemplo, pode sugerir respostas para mensagens de texto ou figurinhas recebidas em apps de bate-papo. O recurso também estreia nesta quinta.
Para completa os anúncios do dia, a OpenAI lançou um “modo Papai Noel”, no qual o chatbot emula com voz a personalidade do principal personagem de Natal - uma ferramenta que deve divertir crianças, embora esteja disponível apenas em inglês
Leia também
Pedido de desculpas
A live desta quinta, no entanto, começou menos festiva. Ela abriu com Kevin Well, diretor de produtos da companhia, pedindo desculpa pelo apagão sofrido pela OpenAI na noite desta quarta. Todos os serviços da companhia, incluindo ChatGPT, o Sora e APIs usadas por desenvolvedores, ficaram fora do ar. Ele afirmou que a OpenAI vai emitir um comunicado sobre o tema e que as operações já voltaram ao normal.
No entanto, desde segunda, 9, os servidores da OpenAI estão sobrecarregados - o congestionamento ocorre desde a apresentação da IA Sora, que gera imagens a partir de comandos. Quatro dias depois, usuários relatam que não conseguem acessar o serviço - o Estadão vem monitorando a situação e também encontrou mensagem de tráfego alto na página do serviço.