A próxima promessa da OpenAI, empresa dona do ChatGPT, é o GPT-5, apelidado de Orion, a tecnologia seria um grande avanço para tornar os chatbots de inteligência artificial (IA) muito mais inteligentes e autônomos. Entretanto, talvez, o mundo não tenha dados o suficiente para alimentar a ferramenta que tem custo bilionário e está atrasada. As informações foram divulgadas pelo jornal The Wall Street Journal.
Segundo a reportagem, a empresa realizou dois grandes treinamentos - envolvendo meses de processamento de dados - para trabalhar na inteligência do Orion. Os testes, que apresentaram diversos erros operacionais, não satisfizeram as expectativas dos especialistas. A Microsoft, principal investidora da OpenAI, esperava ver resultados do GPT-5 até o meio de 2024, o que não aconteceu. A nova IA está em desenvolvimento há, pelo menos, 18 meses.
Segundo os pesquisadores, o projeto não avançou o bastante para justificar a manutenção de seu funcionamento. Apenas contando com os custos de computação, um treinamento de seis meses da tecnologia pode custar cerca de US$ 500 milhões.
Atualmente, a empresa de Sam Altman é avaliada em US$ 157 bilhões. Esse valor de mercado conta com a previsão de que o GPT-5 será um grande avanço em todos os tipos de assuntos e tarefas de IA. A nova tecnologia deve ser capaz de revelar descobertas científicas, além de conseguir realizar tarefas humanas cotidianas, como marcar agendamentos ou voos, por exemplo. Seu sucesso representaria um passo rumo a uma maior “independência” das IAs.
Outra diferença esperada no Orion, é a capacidade da IA cometer menos erros e até mesmo reconhecer a dúvida, algo difícil para os modelos atuais, que erram com confiança, ou seja, “alucinam”. Para efeito de comparação, a empresa disse que o ChatGPT se comporta como um aluno de ensino médio, enquanto isso, é possível esperar uma inteligência de nível PhD do GPT-5.
A reportagem afirma que o que atrasa o desenvolvimento da nova IA é a falta de dados no mundo para seu treinamento. Algumas empresas preferem criar modelos com menor quantidade de dados, entretanto, a OpenAI optou por criar dados do zero. A empresa está contratando funcionários para escrever novos códigos e resolver problemas matemáticos, assim, fazendo com que a IA aprenda com esses comandos mais complexos.
Pesquisadores da Epoch AI estimaram que, em 2028, o tamanho do conjunto de dados necessário para treinar uma IA terá o mesmo tamanho que todo o estoque de textos públicos na internet. A pesquisa estima que os textos disponíveis na internet somam 3,1 quadrilhões de tokens, os pedacinhos de palavras que são detectados por sistemas de IA.
Segundo a pesquisa da Epoch AI, o conteúdo público na internet cresce 10% ao ano, enquanto o consumo de dados no treinamento de IAs mais do que dobra anualmente, o que resultaria no consumo total das informações nos próximos quatro anos. E os desafios para a coleta de dados estão aumentando: há processos por direitos autorais, redes sociais fechando seus conteúdos e sites bloqueando a coleta de informações.
Leia também
Assim, a OpenAI passou a trabalhar no desenvolvimento de dados sintéticos, ou seja, dados que são criados pela própria IA. Os resultados podem apresentar problemas de funcionamento, já que, muitas vezes, a tecnologia produz informações sem sentido.
A reportagem conclui dizendo que a evolução do GPT-5, que representaria uma nova era para as IAs, ainda parece estar distante e não está claro se, um dia, ela se tornará efetivamente real.
*Mariana Cury é estagiária sob supervisão do editor Bruno Romani.
Os comentários são exclusivos para assinantes do Estadão.