Nesta quinta-feira, 30, o bebê ChatGPT completa um ano de vida. Os seus pais são técnicas que já eram bem conhecidas da comunidade científica. Em primeiro lugar, a essência do seu aprendizado é realizada pelo algoritmo Transformer, inventado por pesquisadores do Google em 2017. E em cima desse algoritmo existe uma camada de segurança composta por algoritmos de aprendizado por reforço com feedback humano.
Assim que o ChatGPT foi lançado pela OpenAI no ano passado, Big Techs como a Meta e o Google se apressaram em declarar que já tinham internamente algoritmos tão bons ou até melhores. A grande inovação da OpenAI foi na verdade disponibilizar o seu algoritmo para uso gratuito, uma audácia até então restrita a startups sem muito a perder.
E assim, de repente, a inteligência artificial (IA) virou assunto de mesa de bar. As pessoas começaram pela primeira vez a pensar em ativamente buscar o auxílio de uma IA, em vez serem apenas usuárias indiretas desses algoritmos nas redes sociais, sites de busca, anúncios online e aplicativos de rotas de trânsito. E isso fez toda a diferença.
O resultado dessa popularização da IA tem sido o maior afluxo de investimentos e, consequentemente, de profissionais para a área. E é de fato essa ampliação das possibilidades dos usos de algoritmos de IA que tem sido o verdadeiro impacto do ChatGPT.
Desde o início deste ano, muitos laboratórios e empresas de IA foram criados – e suas novas aplicações estão aparecendo quase todos os dias. Algoritmos de machine learning já estão sendo usados para resolver problemas cada vez mais complexos na agricultura, astronomia, mudanças climáticas, saúde, entre muitos outros.
Um outro resultado da chegada desses novos investimentos tem sido o aumento da velocidade dos avanços científicos. Ao longo do ano, têm aparecido novas técnicas potencialmente revolucionárias, principalmente em relação ao uso dos algoritmos de aprendizado por reforço.
Algumas dessas novas descobertas científicas estão, segundo reportagens da imprensa dos EUA, por trás do pânico no conselho da OpenAI, o que levou à demissão do Sam Altman.
A principal delas é o desenvolvimento de algoritmos de aprendizado por reforço para a supervisão de processos, que conseguem dar feedback em etapas intermediárias do raciocínio em vez de apenas na decisão final.
A combinação dessa técnica com as novas árvores de pensamentos, que permitem a exploração deliberada de diferentes caminhos de raciocínio, é a possível chave para os avanços futuros de IA.
Como escreveu Arthur C. Clark, toda tecnologia suficientemente avançada é indistinguível da magia. As técnicas por trás do ChatGPT definitivamente não são magia, mas têm inspirado muitos pesquisadores a sonhar.