Por que não precisamos de um LLM nacional

Os avanços recentes em inteligência artificial (IA) generativa têm transformado profundamente a interação entre humanos e computadores. Tecnologias como chatbots e agentes de IA agora entendem e geram linguagem natural, tornando a comunicação com máquinas significativamente mais fluida e intuitiva. O ChatGPT, por exemplo, atingiu 1 milhão de usuários em apenas cinco dias e hoje é utilizado por centenas de milhões de pessoas globalmente. Estima-se que essa produtividade adicional possa acrescentar entre US$ 2,6 e 4,4 trilhões ao PIB mundial.

É natural que o tema ganhe espaço nas discussões estratégicas. No Brasil, o lançamento do Plano Brasileiro de Inteligência Artificial (PBIA) reflete essa importância, impulsionado por uma provocação do presidente Lula da Silva em março, que incentivou os cientistas a “criarem uma IA brasileira”, sem especificar os detalhes dessa missão.

O plano apresenta investimentos em supercomputação e infraestrutura para IA, além de anunciar a criação de cursos de graduação na área – medidas louváveis. Contudo, a proposta de criar uma “IA baseada em dados nacionais” – um Large Language Model (LLM) em português – com R$ 1,1 bilhão de recursos alocados é controversa.

A proposta de criar um LLM nacional é justificada em duas partes. A primeira parte, “fomento à curadoria de conjuntos de dados nacionais”, visa a construir e melhorar a qualidade de conjuntos de dados nacionais. Essa iniciativa pode gerar um valor significativo, não apenas para pesquisadores, mas também para futuras aplicações no serviço público. Imagine, por exemplo, o impacto que dados bem organizados do SUS ou da educação pública poderiam ter ao possibilitar soluções mais personalizadas aos cidadãos brasileiros.

A segunda parte, no entanto, me preocupa: “apoio ao desenvolvimento de modelos fundacionais especializados em português”. O plano justifica essa iniciativa com base em princípios como o direito ao desenvolvimento e a soberania nacional, defendendo a promoção da autonomia tecnológica. Esses argumentos ecoam ideologias de soberania nacional e desenvolvimentismo econômico. Essa visão se alinha com políticas históricas de substituição de importações e com a ideia de que o Estado deve desempenhar um papel ativo na proteção da indústria nacional. Há também um argumento cultural implícito de que um modelo treinado especificamente em português brasileiro capturaria melhor as nuances linguísticas e culturais do País.

Do ponto de vista econômico, não há uma demanda significativa por um desempenho superior em português que justifique tal investimento. Os modelos de IA mais avançados já apresentam bom desempenho em outras línguas, incluindo o português.

O argumento de soberania nacional também é frágil. A natureza descentralizada e de código aberto de muitos projetos de IA reduz o risco geopolítico e a necessidade de um modelo puramente nacional. Além disso, o verdadeiro gargalo estratégico na IA não está no software, mas no hardware especializado – as Graphics Processing Units (GPUs), que são desenvolvidas por um grupo pequeno de empresas nos EUA e em Taiwan. Desenvolver um LLM brasileiro não mitiga essa nossa dependência de hardware estrangeiro.

Também é questionável se um modelo de linguagem nacional é a melhor forma de “preservar a nossa cultura”. Como exposto anteriormente, os LLMs disponíveis atualmente são treinados com dados públicos da internet. Na prática, a cultura brasileira está amplamente representada no vasto corpus de dados disponível online, que é utilizado para treinar ou aprimorar modelos existentes.

A proposta de criar um LLM brasileiro, embora bem-intencionada, revela falta de ambição do potencial do Brasil no cenário global de IA. Ao invés de nos contentarmos com uma limitada versão nacional de tecnologias já existentes, deveríamos aspirar a uma participação mais significativa e inovadora na cadeia de valor global da IA. As empresas brasileiras têm potencial de se tornarem competitivas, especializando-se em setores e produtos que atendam a demandas reais de consumidores e empresas em todo o mundo. Áreas como segurança, adtech e fintech são campos nos quais o Brasil já possui expertise significativa e poderia liderar desenvolvimentos em IA.

Embora algumas iniciativas do PBIA sejam nobres, é necessária uma abordagem mais ambiciosa e global. Isso inclui: atrair capital estrangeiro incentivando empresas globais de IA a operarem no Brasil e contratarem mão de obra local; facilitar a entrada de talentos internacionais, como nômades digitais; promover colaborações internacionais entre universidades, centros de pesquisa e empresas; e realizar melhoria do ambiente regulatório.

Ao adotar essa abordagem mais ambiciosa e globalizada, o Brasil não apenas evitará desperdiçar recursos em projetos de eficácia questionável, como o LLM nacional, mas também posicionará o País para se tornar um hub de inovação em IA, gerando empregos de alta qualidade e maior competitividade econômica.

ENGENHEIRO DE MACHINE LEARNING E COFUNDADOR DA ORBY AI, É MESTRE EM ESTATÍSTICA PELA UNIVERSIDADE STANFORD E BACHAREL EM MATEMÁTICA PELA UNIVERSIDADE DUKE

Opinião por Matheus Dias

Engenheiro de Machine Learning e cofundador da Orby AI, é mestre em Estatística pela Universidade Stanford e bacharel em Matemática pela Universidade Duke

Tudo Sobre

Espaço Aberto

Opinião|Por que não precisamos de um LLM nacional

Ao invés de nos contentarmos com uma limitada versão nacional de tecnologias já existentes, deveríamos aspirar a uma participação mais inovadora na cadeia de valor global da IA

Últimas: Opinião

Debate político e bate-bocas apaixonados no Brasil

A agenda perdida Brasil-EUA

Eventos políticos extremos

A taxa Selic e os impactos de longo prazo na atividade empresarial e na economia

Mais lidas

Enel, uma vilã muito conveniente

Israel entre a paz duradoura e o abismo

Sem limites para benesses

Duas notícias que se neutralizam

Fórum dos Leitores