ChatGPT, da OpenAI, e Gemini, do Google, são alguns dos chatbots mais famosos da inteligência artificial (IA), mas os rivais americanos ganharam um concorrente chinês de peso recentemente. Trata-se do Qwen, uma família de modelos de código aberto focado em programação criado pela gigante Alibaba Cloud, empresa “irmão” do AliExpress.
A versão mais poderosa da família é o Qwen 2.5, e testes comparativos entre o modelo chinês e IAs americanas mais famosas (ChatGPT e Gemini) mostram que a nova ferramenta dá respostas mais precisas, pode ser instalada localmente – o que protege os dados e dispensa conexão à internet – e atende mais necessidades de personalização do usuário.
E por que o Qwen 2.5 supera o ChatGPT e o Gemini? O modelo chinês foi treinado com o dobro de tokens – ou unidades básicas de texto – do que o ChatGPT 4o. Isso significa mais detalhes nas informações obtidas por ele, além de ter padrões e soluções mais sofisticados.
Na prática, essa IA oferece respostas mais elaboradas, precisão em cálculos e linguística e eficiência no consumo de energia. As funcionalidades da Qwen também miram o setor empresarial, por exemplo: é possível adaptar o modelo para focar em áreas especificas, como marketing.
O modelo também ganha pontos por ser multilíngue, isso significa que ele domina a semântica de mais idiomas do que seus concorrentes, que apenas traduzem a resposta do inglês. “Até por isso o Qwen conseguiu chegar nesse tamanho de banco de dados que nenhum idioma, nem mesmo o inglês, seria capaz de oferecer”, diz Anderson Soares, coordenador do primeiro bacharelado em Inteligência Artificial da Universidade de Goiás (UFG).
A rapidez com que o Alibaba Cloud se tornou competitiva no cenária do AI foi uma surpresa na mesma medida em que abrir seu código fonte pode significar um ganho para o ecossistema de tecnologia. “Ele treina modelos que custam centenas de milhões de dólares para fazer e disponibilizam de graça, isso tem um efeito cascata muito interessante”, afirma Soares.
Uma técnica esperta de treinar a IA foi encontrada pela chinesa: o modelo anterior ao Qwen 2.5 gerava códigos de forma artificial para alimentá-la com esses dados, de modo a criar mais variações do mesmo código. “A premissa básica do treinamento é fazer com que a IA consiga prever a palavra seguinte, com isso eles ensinam a língua e não a corretude de informações”, diz.
Essa estratégia é particularmente boa porque o Qwen usa menos parâmetros – expressões matemáticas que conectam palavras – do que os concorrentes. Ou seja: um ciclo virtuoso de informação é gerado.
No fim do dia, o importante é que as pessoas criem projetos mesmo sem alto conhecimento em programão, segundo Soares. “Vai depende muito da criatividade, um dos objetivos é saber o que as pessoas vão saber fazer com essas LLMs que eu treinei”, diz. “A codificação de aplicativos é o mais impressionante dessa versão, até agora”.
Dá para saber qual é a melhor IA?
Para comparar IAs de forma objetiva, alguns benchmarks são feitos por meio de tarefas específicas em cada uma delas. O resultado mede o desempenho de resposta com base nas concorrentes ou mesmo em humanos, que é o caso da HumanEval.
“O que chama a atenção nos modelos chineses é que com bem menos dados, eles se aproximam de modelos muito maiores” explica Anderson Amaral, fundador da Scoras, empresa brasileira especializada em desenvolvimento de agentes de IA. “O talento desse modelo chinês vem dessa instrução interna muito maior, isso ajuda a superar a quantidade dos parâmetros”.
A economia de parâmetros tem outros benefícios: a compactação e o preço. Ao mesmo tempo em que o custo operacional cai, é possível instalar o modelo em computadores menos potentes e em servidores menores. Empresas com menos espaço e recurso agradecem.
Leia também
“Uma empresa qualquer pode instalar o servidor dela e nunca permitir contato externo. Além disso, não fica dependente de terceiros, como servidores de outras empresas, e pode ajustar o modelo às suas necessidades sem pagar nada”, diz Amaral. “Daqui a pouco ele vai estar dentro do celular”.
É possível conferir alguns experimentos práticos do Qwen. O desenvolvedor Florent Daudens construiu um aplicativo de jogo de cartas em menos de 30 segundos com apenas um comando. “Impressionante! Acabei de criar um aplicativo web de flashcards completo em menos de 30 segundos usando o novo demo Coder do Qwen! Parecido com os artefatos do Claude, mas de código aberto”, publicou Daudens no X.
Mas o que falta para todo mundo usar o Qwen? Para Amaral, barreiras geopolíticas e pouca divulgação internacional são obstáculos vitais que restringem essa tecnologia. “Há resistências em adotar tecnologias chinesas em muitos países ocidentais por questões de confiança e estratégia”, diz. “Isso cria bolhas de conhecimento que não se comunicam, que impede que tecnologias como o Qwen ganhem espaço fora de suas áreas de origem”.
O outro lado da moeda
Segundo Amaral, o modelo – tal como todos os outros – carrega traços relacionados a seu país de origem. Por isso, espere respostas “diferenciadas” em caso de perguntas que envolvam política, exército ou correntes filosóficas.
“Empresas norte-americanas não gostam que use [Qwen], em algumas perguntas dá para notar diferença de resposta e por isso evitam usar no ocidente”, diz. “Se perguntar sobre comunismo ou questões geopolíticas, você vê um viés ali porque nada impede que a influenciar [as respostas] dos modelos vire uma coisa estratégica”.