Durante o mês de dezembro, a OpenAI, empresa dona do ChatGPT, fez 12 transmissões ao vivo diárias em seu canal de YouTube para anunciar novidades de seus produtos. Entre as principais, estão o anúncio da sua nova IA, a OpenAI o3; o lançamento da Sora - ferramenta de inteligência artificial (IA) que produz vídeos realistas -; uma assinatura mais cara do ChatGPT e a integração do chatbot com o WhatsApp e a Siri.
Relembre como foi a maratona da empresa.
Navegue neste conteúdo
Anúncio do OpenAI-o3
O mais novo modelo da startup, o OpenAI o3, sucessor do OpenAI o1, foi anunciado. Ao contrário da família “GPT”, a classe “o” é focada em raciocínio lógico, matemática e programação, e foi mostrada inicialmente em setembro. Segundo a companhia, o o3 exibe sinais de avanços poderosos na área e, por isso, não foi disponibilizada inicialmente para o público, apenas para pesquisadores de segurança. Surgiu até a hipótese de que o sistema apresenta sinais de ser uma AGI (quando uma máquina tem capacidade cognitiva similar ou maior que a humana), mas críticos dizem que é marketing.
Sora chega aos usuários
Provavelmente, a novidade mais esperada desses 12 lançamentos foi a Sora, ferramenta de inteligência artificial (IA) que produz vídeos realistas. O recurso está disponível apenas para os assinantes das versões pagas do chatbot, o ChatGPT Pro e o ChatGPT Plus.
Em Sora.com, a tecnologia funciona com base nos comandos dos usuários, podendo transformar textos e imagens em vídeos de até 20 segundos, em diferentes formatos e em resolução de até 1.080p. Além de criar vídeo do zero, o usuário também pode trazer um vídeo “real” e alterar partes dele, por exemplo. A ferramenta chamada Storyboard permite que o usuário “brinque” com a sequência produzida pela IA, podendo mudá-la quando e como quiser. Além disso, é possível continuar o vídeo apenas escrevendo o que deseja ver e, assim, a IA criará uma imagem com base na descrição de texto fornecida pelo usuário.
Mas o lançamento foi atrapalhado: a companhia teve cinco dias de servidores instáveis e os resultados dos vídeos não empolga como nos vídeos promocionais.
ChatGPT por mais de R$ 1,2 mil
O ChatGPT ficou mais caro para usuários avançados. O chatbot ganhou uma nova opção de plano de assinatura, o ChatGPT Pro, que custa US$ 200 por mês (mais de R$ 1,2 mil). Segundo Sam Altman, CEO da OpenAI, o novo plano vai dar acesso aos modelos de inteligência artificial mais sofisticadas da startup.
Agora, no plano ChatGPT Pro está disponível também o o1 Pro, que usa ainda mais poder computacional para “pensar” as respostas. O plano mais barato continua a existir, no entanto, a assinatura mais cara dará também acesso ilimitado aos modelos OpenAI o1, o1-mini, GPT-4o e Advanced Voice (que permite conversar com o sistema).
ChatGPT vai brigar com o Google
Em mais um passo em direção ao fim do reinado das buscas do Google, a OpenAI tornou o SearchGPT - ferramenta de pesquisa da empresa - disponível para todos os usuários do chatbot. Anteriormente, a ferramenta só estava disponível para assinantes.
Ela combina a interação em linguagem natural com a capacidade de buscar e processar dados da web em tempo real. A novidade, que integra o mecanismo de busca à interface do chatbot, permite o acesso a links para as fontes utilizadas pela IA. Ou seja, ao pesquisar uma sugestão de restaurante, por exemplo, o chatbot fornecerá fontes com links da web.
Diferentemente dos buscadores tradicionais, que exibem uma lista de links como resultado de uma pesquisa, o SearchGPT organiza e interpreta as informações encontradas na web, fornecendo respostas diretas, contextualizadas e complementadas por links para as fontes originais. A funcionalidade permite que os usuários verifiquem a veracidade das informações, além de contribuir para a transparência e a confiabilidade da ferramenta.
ChatGPT no WhatsApp
Além de conversar por mensagens, arquivos e fotos com o ChatGPT, usuários agora podem ligar para o chatbot para interagir apenas com voz e se conectar com o robô pelo WhatsApp.
A ligação para o ChatGPT segue o modelo de canais 0800 de ajuda - como um sac ou uma central de informações. Pelo contato, é possível interagir apenas por voz com a IA, que pode responder perguntas, fornecer dados ou mesmo jogar conversa fora. O recurso, que atende pelo número 1-800-242-8478 (ou, para os adeptos dos teclados numéricos, 1-800-CHATGPT), pode ser acionado de qualquer telefone, inclusive linhas de telefonia fixa, mas está disponível apenas nos EUA.
Além da ligação, o ChatGPT agora está disponível no WhatsApp, por meio do mesmo número fornecido para as chamadas. Ao salvar o contato, basta iniciar uma conversa com o chatbot e a mensagem vai aparecer na tela principal do app da Meta. As conversas já estão disponíveis em todo o mundo e atende diversos idiomas - inclusive o português. Pelo WhatsApp, porém, a interação ocorre apenas por texto - ou seja, não é possível enviar áudios ou fazer ligações para o ChatGPT. Também não é necessário ter uma conta para acessar o chatbot no mensageiro.
ChatGPT integrado à Siri
A integração do ChatGPT com a assistente da Apple, a Siri, faz parte da “segunda fase” das funcionalidades da Apple Intelligence, nova ferramenta de IA da marca. Agora, ao pedir algo para a Siri, se o usuário desejar, a pesquisa pode ser feita diretamente no chatbot da OpenAI.
A Apple Intelligence só está disponível para os a linha de iPhones 16 e para o iPhone 15 Pro. Para ter acesso à integração, além de ter um aparelho compatível, o usuário precisa atualizar o smartphone para o sistema operacional mais novo, o iOS 18.2.
Ferramentas para tornar IA especialista em assuntos específicos
A OpenAI lançou um novo programa de ajuste fino para aumentar a personalização de tarefas dos modelos inseridos na IA. O ajuste fino (ou fine tuning) é uma técnica que permite tornar modelos de IA especialistas em tarefas específicas - é o oposto, por exemplo, do ChatGPT que é generalista. Segundo a empresa, esse programa é voltado para institutos de pesquisa, universidades e empresas. O programa está disponível para modelos recentes da IA, como o o1 e o1 mini.
“Essa nova técnica permite que os desenvolvedores personalizem nossos modelos usando dezenas a milhares de tarefas de alta qualidade e classifiquem a resposta do modelo com as respostas de referência fornecidas”, afirmou a OpenAI.
ChatGPT passa a entender informações em vídeo e responde por voz
Agora, o chatbot consegue compreender informação em vídeo em tempo real e responder ao usuário com voz. O recurso está disponível para usuários dos planos Plus e Pro, além da assinatura corporativa.
Com o novo recurso, o usuário pode abrir a câmera do celular e conversar com o ChatGPT sobre o mundo em volta dele. Ele, por exemplo, consegue memorizar nomes e características de pessoas ou reconhecer objetos para dar dicas. Segundo a OpenAI, a ferramenta compreende o áudio do usuário, relaciona essa informação com as imagens que enxerga pelas lentes do celular e produz uma resposta de áudio de maneira nativa - é mais uma demonstração de multimodalidade dos modelos atuais. Ou seja, a capacidade nativa de novos sistemas de inteligência artificial de processarem informação em formatos variados.
Outro recurso é a capacidade do ChatGPT ‘enxergar’ a tela do celular do usuário e interagir com voz baseado nas informações exibidas. Ele, por exemplo, pode sugerir respostas para mensagens de texto ou figurinhas recebidas em apps de bate-papo.
ChatGPT ganha seu próprio ‘Google Docs’
A empresa lançou nova ferramenta de suporte de escrita para o ChatGPT, o Canvas. A tecnologia abre uma aba fora da conversa com o chatbot, permitindo que o usuário modifique um texto ou crie um código sem precisar dar um novo comando para a inteligência artificial.
O Canvas funciona para criar uma experiência mais integrada aos usuários do chatbot. Anteriormente, para editar um texto do ChatGPT, era necessário transferi-lo para outra ferramenta, como o Word ou Google Docs, por exemplo. Agora, é possível fazer mudanças sem sair da plataforma. A novidade não é útil apenas para textos, mas também para programação de códigos. O usuário pode pedir para que a ferramenta corrija partes do código e até crie um gráfico para ele, por exemplo.
Aba ‘Projetos’ no ChatGPT
A nova “área” do chatbot permite que o usuário organize melhor suas pesquisas no ChatGPT. Ao pesquisar um assunto, agora, é possível salvar a pesquisa com um título e criar uma pasta. Assim, concentrando todas as buscas do mesmo assunto em um só lugar.
A novidade permite que o usuário dê comandos personalizados para cada projeto. E também, ao baixar um arquivo na pasta, o chatbot pode fazer pesquisas diretamente nesse arquivo, facilitando o trabalho. O novo recurso também pode ser usado para organizar informações e pesquisas sobre codificação dentro do ChatGPT, mantendo todas as informações reunidas.
Por enquanto, ‘Projetos” está disponível para os usuários do ChatGPT Plus e ChatGPT Pro. Em breve, os demais usuários também deverão contar com o recurso.
‘SuperAI’ para integração de serviços
O novo modelo de IA, OpenAI o1, vai integrar APIs de parceiros. O sistema é uma evolução do LLM capaz de processar mais tarefas de uma só vez de forma integrada - o que melhora a compreensão e processamento da linguagem. A novidade vai estar disponível para empresas que usam o ChatGPT dentro de seus produtos.
De acordo com a OpenAI, o novo modelo vai permitir que as empresas tenham um nível maior de customização de seus produtos equipados com o ChatGPT. A grande vantagem do o1 é que ele funciona como um aprendiz de si mesmo: o modelo pode fazer diversas checagens de dados dentro da sua própria base para garantir que a resposta fornecida seja correta.
ChatGPT mais integrado com aplicativos
A versão do ChatGPT para desktop dos sistemas Mac estão mais integradas com aplicativos de texto e programação, promovendo mais facilidades aos usuários.
Além de trazer uma janela para trabalhar diretamente no chatbot, o usuário pode interagir de maneira mais personalizada, pedindo pesquisas, melhorias e análise de dados para a inteligência artificial (IA). A integração é feita por meio de aplicativos como o Notas, Notion, XCode e outros aplicativos de texto e programação.
Por enquanto, a novidade só está disponível na versão desktop para os usuários Apple. Segundo a OpenAI, os recursos deverão chegar para sistemas Windows em breve.
*Mariana Cury é estagiária sob supervisão do editor Bruno Romani
Os comentários são exclusivos para assinantes do Estadão.