Google Tradutor adiciona língua Quéchua à sua plataforma


Adição de uma das línguas indígenas mais faladas nas Américas pode ajudar servidores públicos e profissionais de saúde a se conectarem com suas comunidades

Por Mitra Taj

LIMA, Peru - Quando Irma Alvarez Ccoscco soube que o idioma que ela falou durante toda a vida, o Quéchua, havia sido adicionado ao Google Tradutor, ela correu para o computador para experimentá-lo.

“Eu disse: ‘É isso. O dia finalmente chegou’”, lembrou Alvarez Ccoscco, poeta, professora e ativista digital, em entrevista por telefone. Ela começou com algumas frases básicas. “Eu não queria me decepcionar”, ela disse. “E sim, funcionou.”

A adição do quéchua, uma das línguas indígenas mais faladas nas Américas, ao Google Tradutor pode ajudar funcionários públicos e trabalhadores da saúde a se conectarem com suas comunidades. Foto: Marco Garro/The New York Times
continua após a publicidade

Era mais do que uma nova ferramenta de comunicação; foi uma reivindicação de que o Quéchua e seus vários milhões de falantes na América do Sul mereciam uma voz maior e também visibilidade, disse Alvarez Ccoscco.

Ela e outros ativistas Quéchuas vinham reivindicando há anos. Afinal, o Quéchua é uma das línguas indígenas mais faladas nas Américas. Mas agora, “uma empresa tão grande quanto o Google está reconhecendo isso”, ela disse. “É como dizer ao mundo: ‘olha, estamos aqui!’”

O Quéchua - ou mais precisamente o Quéchua do sul, a principal língua da família linguística Quéchua - foi uma das 24 línguas que o Google adicionou ao seu serviço de tradução em maio. Coletivamente, elas são faladas por cerca de 300 milhões de pessoas. Muitas, como o Quéchua, são principalmente línguas orais que foram marginalizadas há muito tempo, faladas por grupos indígenas ou minoritários.

continua após a publicidade

O Google disse que o objetivo era incluir idiomas sub-representados na tecnologia para “conectar comunidades em todo o mundo”.

A ferramenta também pode ajudar os profissionais de saúde, professores, funcionários públicos, policiais e outros a se conectarem com falantes em suas próprias comunidades.

“Nos Andes, faltam profissionais bilíngues em áreas muito críticas”, disse o Dr. Américo Mendoza-Mori, um acadêmico falante de Quéchua da Universidade de Harvard que estuda identidade indígena e linguística. “Existem milhões de falantes que precisam ser atendidos e tratados como cidadãos de seu próprio país.”

continua após a publicidade

Eliana Cancha, uma enfermeira peruana de 26 anos, disse que apenas dois em cada 10 profissionais de saúde falam a língua Quéchua que é amplamente usada na região onde ela trabalha, forçando muitos pacientes a tentar explicar o que os aflige apontando para partes de seu corpo.

“Eles não podem se expressar com o médico como deveriam”, disse Cancha, uma falante nativa de Quéchua. “Isso significa que eles não estão recebendo tratamento adequado”.

O Quéchua surgiu entre os agricultores e pastores nos Andes centrais do Peru há mais de 1.500 anos. No século V, havia se expandido em dois grupos principais, com ainda mais variantes, e no século XV, os incas adotaram uma delas como língua franca de seu vasto império, que se estende da Colômbia à Argentina.

continua após a publicidade

Hoje, estima-se que as línguas Quéchuas sejam faladas por cerca de 8 a 10 milhões de pessoas na América do Sul - principalmente no Peru, Bolívia e Equador. O Quéchua do sul é de longe o mais falado, com cerca de 7 milhões de falantes.

Até recentemente, o sistema de aprendizado automático do Google Tradutor precisava ver traduções de um idioma para outros idiomas que conhece para dominá-lo, disse Isaac Caswell, pesquisador do Google Tradutor. Mas a ferramenta tem tanta experiência agora que pode aprender a traduzir um novo idioma com pouco mais do que o texto nesse idioma.

Caswell comparou o processo de aprendizado a um poliglota sendo trancado em uma sala com nada além de uma pilha de livros em um novo idioma; se tivesse tempo suficiente, o poliglota poderia descobri-lo.

continua após a publicidade

Idiomas sub-representados como o Quéchua têm uma presença online crescente e, portanto, o modelo de tradução do Google aprendeu o idioma selecionando na web pública textos escritos nesse idioma.

“À medida que mais comunidades ficam online, é mais possível fazer esse tipo de coisa”, disse Caswell.

O Lingala, uma língua da África Central, também foi adicionado recentemente ao Google Tradutor, embora seja falado por cerca de 45 milhões de pessoas. Línguas europeias como a Sueca, Finlandesa ou Catalã, com um número muito menor de falantes nativos, estão na ferramenta de tradução há anos, principalmente porque foram super-representadas em textos online, disse Caswell.

continua após a publicidade
Artistas de La Tunantada, uma dança tradicional andina, em Lima, Peru. Foto: Marco Garro/The New York Times

“As pessoas estão comemorando”, disse Maryk Francq Mavie Amonga, assistente de produção do serviço de notícias multilíngue Africanews e falante nativo de Lingala. “Há muitos lugares que ainda não nos conhecem.”

Há pouco mais de uma década, o Quéchua mal estava na internet, disse Alvarez Ccoscco, o ativista.

Mas ela e outros ativistas da língua Quéchua têm estado ocupados digitalizando dicionários, adaptando software de código aberto para o Quéchua, escrevendo blogs e revistas eletrônicas em Quéchua e oferecendo versões Quéchuas de tudo, desde textos coloniais e contos a videogames.

“O Google está realmente se juntando a esse ecossistema existente de esforços digitais para garantir que a língua esteja lá”, disse Mendoza-Mori, o estudioso de Harvard.

Ele disse que houve um movimento crescente na comunidade de língua Quéchua nos últimos anos que abraçou a língua e lutou contra os estereótipos que a retratam como uma relíquia do passado ou uma curiosidade cultural.

Após a conquista espanhola do Império Inca em 1532, o Quéchua passou a ser visto como um sinal de atraso ou fonte de suspeita pela nova classe dominante. Seu uso foi oficialmente proibido depois que o líder indígena Túpac Amaru II liderou uma revolta que varreu o sul dos Andes no final do século XVIII, terminando com sua tortura pública, desmembramento e decapitação.

Ainda assim, os falantes de Quéchua continuaram a constituir a maioria da população do Peru no início do século 20.

Mas em 2017, a porcentagem de peruanos que identificaram o Quéchua como sua primeira língua era de apenas 14%.

À medida que os falantes de Quéchua migraram dos planaltos andinos para as cidades - alguns em busca de oportunidades, outros desenraizados por conflitos - a língua não foi transmitida às novas gerações.

Nos anos 1980 e 90, batalhas sangrentas entre insurgentes de esquerda e forças de segurança do Estado dizimaram aldeias de língua Quéchua, deixando para trás tantos corpos torturados e valas comuns que as famílias dos “desaparecidos” ainda estão coletando seus restos mortais.

Em Lima, para onde muitos fugiram para escapar, “você não podia falar Quéchua abertamente porque seria considerado um comunista, um terrorista”, disse Ricardo Flores, um rapper, historiador e professor falante de Quéchua que cresceu parcialmente em San Juan de Lurigancho, distrito da capital com alta concentração de falantes do idioma.

Flores disse que ainda hoje, “os caras em mercados e parques, eles fingem que não falam o idioma”.

“Mas eles falam”, ele disse. “Mas só falam em casa.”

Um estigma pesa tanto sobre o Quéchua que não está claro se o idioma está crescendo ou em declínio, disse Mendoza-Mori. Embora o último censo do Peru tenha registrado um aumento no número de falantes do idioma, pode ser apenas porque mais pessoas estão dispostas a reconhecer que o falam, ele disse.

De todas as traduções de Quéchua que Alvarez Ccoscco tentou, ela disse que uma em particular a encheu de orgulho: “Musqusqaykimanta astawan karutaraq chayasaqku”.

Era uma linha escrita pelo escritor peruano José María Arguedas em um poema dedicado a Túpac Amaru II, que ela disse que o Google traduziu mais ou menos corretamente para “Vamos chegar mais longe do que você jamais sonhou”. /TRADUÇÃO LÍVIA BUELONI GONÇALVES

The New York Times Licensing Group - Todos os direitos reservados. É proibido todo tipo de reprodução sem autorização por escrito do The New York Times

LIMA, Peru - Quando Irma Alvarez Ccoscco soube que o idioma que ela falou durante toda a vida, o Quéchua, havia sido adicionado ao Google Tradutor, ela correu para o computador para experimentá-lo.

“Eu disse: ‘É isso. O dia finalmente chegou’”, lembrou Alvarez Ccoscco, poeta, professora e ativista digital, em entrevista por telefone. Ela começou com algumas frases básicas. “Eu não queria me decepcionar”, ela disse. “E sim, funcionou.”

A adição do quéchua, uma das línguas indígenas mais faladas nas Américas, ao Google Tradutor pode ajudar funcionários públicos e trabalhadores da saúde a se conectarem com suas comunidades. Foto: Marco Garro/The New York Times

Era mais do que uma nova ferramenta de comunicação; foi uma reivindicação de que o Quéchua e seus vários milhões de falantes na América do Sul mereciam uma voz maior e também visibilidade, disse Alvarez Ccoscco.

Ela e outros ativistas Quéchuas vinham reivindicando há anos. Afinal, o Quéchua é uma das línguas indígenas mais faladas nas Américas. Mas agora, “uma empresa tão grande quanto o Google está reconhecendo isso”, ela disse. “É como dizer ao mundo: ‘olha, estamos aqui!’”

O Quéchua - ou mais precisamente o Quéchua do sul, a principal língua da família linguística Quéchua - foi uma das 24 línguas que o Google adicionou ao seu serviço de tradução em maio. Coletivamente, elas são faladas por cerca de 300 milhões de pessoas. Muitas, como o Quéchua, são principalmente línguas orais que foram marginalizadas há muito tempo, faladas por grupos indígenas ou minoritários.

O Google disse que o objetivo era incluir idiomas sub-representados na tecnologia para “conectar comunidades em todo o mundo”.

A ferramenta também pode ajudar os profissionais de saúde, professores, funcionários públicos, policiais e outros a se conectarem com falantes em suas próprias comunidades.

“Nos Andes, faltam profissionais bilíngues em áreas muito críticas”, disse o Dr. Américo Mendoza-Mori, um acadêmico falante de Quéchua da Universidade de Harvard que estuda identidade indígena e linguística. “Existem milhões de falantes que precisam ser atendidos e tratados como cidadãos de seu próprio país.”

Eliana Cancha, uma enfermeira peruana de 26 anos, disse que apenas dois em cada 10 profissionais de saúde falam a língua Quéchua que é amplamente usada na região onde ela trabalha, forçando muitos pacientes a tentar explicar o que os aflige apontando para partes de seu corpo.

“Eles não podem se expressar com o médico como deveriam”, disse Cancha, uma falante nativa de Quéchua. “Isso significa que eles não estão recebendo tratamento adequado”.

O Quéchua surgiu entre os agricultores e pastores nos Andes centrais do Peru há mais de 1.500 anos. No século V, havia se expandido em dois grupos principais, com ainda mais variantes, e no século XV, os incas adotaram uma delas como língua franca de seu vasto império, que se estende da Colômbia à Argentina.

Hoje, estima-se que as línguas Quéchuas sejam faladas por cerca de 8 a 10 milhões de pessoas na América do Sul - principalmente no Peru, Bolívia e Equador. O Quéchua do sul é de longe o mais falado, com cerca de 7 milhões de falantes.

Até recentemente, o sistema de aprendizado automático do Google Tradutor precisava ver traduções de um idioma para outros idiomas que conhece para dominá-lo, disse Isaac Caswell, pesquisador do Google Tradutor. Mas a ferramenta tem tanta experiência agora que pode aprender a traduzir um novo idioma com pouco mais do que o texto nesse idioma.

Caswell comparou o processo de aprendizado a um poliglota sendo trancado em uma sala com nada além de uma pilha de livros em um novo idioma; se tivesse tempo suficiente, o poliglota poderia descobri-lo.

Idiomas sub-representados como o Quéchua têm uma presença online crescente e, portanto, o modelo de tradução do Google aprendeu o idioma selecionando na web pública textos escritos nesse idioma.

“À medida que mais comunidades ficam online, é mais possível fazer esse tipo de coisa”, disse Caswell.

O Lingala, uma língua da África Central, também foi adicionado recentemente ao Google Tradutor, embora seja falado por cerca de 45 milhões de pessoas. Línguas europeias como a Sueca, Finlandesa ou Catalã, com um número muito menor de falantes nativos, estão na ferramenta de tradução há anos, principalmente porque foram super-representadas em textos online, disse Caswell.

Artistas de La Tunantada, uma dança tradicional andina, em Lima, Peru. Foto: Marco Garro/The New York Times

“As pessoas estão comemorando”, disse Maryk Francq Mavie Amonga, assistente de produção do serviço de notícias multilíngue Africanews e falante nativo de Lingala. “Há muitos lugares que ainda não nos conhecem.”

Há pouco mais de uma década, o Quéchua mal estava na internet, disse Alvarez Ccoscco, o ativista.

Mas ela e outros ativistas da língua Quéchua têm estado ocupados digitalizando dicionários, adaptando software de código aberto para o Quéchua, escrevendo blogs e revistas eletrônicas em Quéchua e oferecendo versões Quéchuas de tudo, desde textos coloniais e contos a videogames.

“O Google está realmente se juntando a esse ecossistema existente de esforços digitais para garantir que a língua esteja lá”, disse Mendoza-Mori, o estudioso de Harvard.

Ele disse que houve um movimento crescente na comunidade de língua Quéchua nos últimos anos que abraçou a língua e lutou contra os estereótipos que a retratam como uma relíquia do passado ou uma curiosidade cultural.

Após a conquista espanhola do Império Inca em 1532, o Quéchua passou a ser visto como um sinal de atraso ou fonte de suspeita pela nova classe dominante. Seu uso foi oficialmente proibido depois que o líder indígena Túpac Amaru II liderou uma revolta que varreu o sul dos Andes no final do século XVIII, terminando com sua tortura pública, desmembramento e decapitação.

Ainda assim, os falantes de Quéchua continuaram a constituir a maioria da população do Peru no início do século 20.

Mas em 2017, a porcentagem de peruanos que identificaram o Quéchua como sua primeira língua era de apenas 14%.

À medida que os falantes de Quéchua migraram dos planaltos andinos para as cidades - alguns em busca de oportunidades, outros desenraizados por conflitos - a língua não foi transmitida às novas gerações.

Nos anos 1980 e 90, batalhas sangrentas entre insurgentes de esquerda e forças de segurança do Estado dizimaram aldeias de língua Quéchua, deixando para trás tantos corpos torturados e valas comuns que as famílias dos “desaparecidos” ainda estão coletando seus restos mortais.

Em Lima, para onde muitos fugiram para escapar, “você não podia falar Quéchua abertamente porque seria considerado um comunista, um terrorista”, disse Ricardo Flores, um rapper, historiador e professor falante de Quéchua que cresceu parcialmente em San Juan de Lurigancho, distrito da capital com alta concentração de falantes do idioma.

Flores disse que ainda hoje, “os caras em mercados e parques, eles fingem que não falam o idioma”.

“Mas eles falam”, ele disse. “Mas só falam em casa.”

Um estigma pesa tanto sobre o Quéchua que não está claro se o idioma está crescendo ou em declínio, disse Mendoza-Mori. Embora o último censo do Peru tenha registrado um aumento no número de falantes do idioma, pode ser apenas porque mais pessoas estão dispostas a reconhecer que o falam, ele disse.

De todas as traduções de Quéchua que Alvarez Ccoscco tentou, ela disse que uma em particular a encheu de orgulho: “Musqusqaykimanta astawan karutaraq chayasaqku”.

Era uma linha escrita pelo escritor peruano José María Arguedas em um poema dedicado a Túpac Amaru II, que ela disse que o Google traduziu mais ou menos corretamente para “Vamos chegar mais longe do que você jamais sonhou”. /TRADUÇÃO LÍVIA BUELONI GONÇALVES

The New York Times Licensing Group - Todos os direitos reservados. É proibido todo tipo de reprodução sem autorização por escrito do The New York Times

LIMA, Peru - Quando Irma Alvarez Ccoscco soube que o idioma que ela falou durante toda a vida, o Quéchua, havia sido adicionado ao Google Tradutor, ela correu para o computador para experimentá-lo.

“Eu disse: ‘É isso. O dia finalmente chegou’”, lembrou Alvarez Ccoscco, poeta, professora e ativista digital, em entrevista por telefone. Ela começou com algumas frases básicas. “Eu não queria me decepcionar”, ela disse. “E sim, funcionou.”

A adição do quéchua, uma das línguas indígenas mais faladas nas Américas, ao Google Tradutor pode ajudar funcionários públicos e trabalhadores da saúde a se conectarem com suas comunidades. Foto: Marco Garro/The New York Times

Era mais do que uma nova ferramenta de comunicação; foi uma reivindicação de que o Quéchua e seus vários milhões de falantes na América do Sul mereciam uma voz maior e também visibilidade, disse Alvarez Ccoscco.

Ela e outros ativistas Quéchuas vinham reivindicando há anos. Afinal, o Quéchua é uma das línguas indígenas mais faladas nas Américas. Mas agora, “uma empresa tão grande quanto o Google está reconhecendo isso”, ela disse. “É como dizer ao mundo: ‘olha, estamos aqui!’”

O Quéchua - ou mais precisamente o Quéchua do sul, a principal língua da família linguística Quéchua - foi uma das 24 línguas que o Google adicionou ao seu serviço de tradução em maio. Coletivamente, elas são faladas por cerca de 300 milhões de pessoas. Muitas, como o Quéchua, são principalmente línguas orais que foram marginalizadas há muito tempo, faladas por grupos indígenas ou minoritários.

O Google disse que o objetivo era incluir idiomas sub-representados na tecnologia para “conectar comunidades em todo o mundo”.

A ferramenta também pode ajudar os profissionais de saúde, professores, funcionários públicos, policiais e outros a se conectarem com falantes em suas próprias comunidades.

“Nos Andes, faltam profissionais bilíngues em áreas muito críticas”, disse o Dr. Américo Mendoza-Mori, um acadêmico falante de Quéchua da Universidade de Harvard que estuda identidade indígena e linguística. “Existem milhões de falantes que precisam ser atendidos e tratados como cidadãos de seu próprio país.”

Eliana Cancha, uma enfermeira peruana de 26 anos, disse que apenas dois em cada 10 profissionais de saúde falam a língua Quéchua que é amplamente usada na região onde ela trabalha, forçando muitos pacientes a tentar explicar o que os aflige apontando para partes de seu corpo.

“Eles não podem se expressar com o médico como deveriam”, disse Cancha, uma falante nativa de Quéchua. “Isso significa que eles não estão recebendo tratamento adequado”.

O Quéchua surgiu entre os agricultores e pastores nos Andes centrais do Peru há mais de 1.500 anos. No século V, havia se expandido em dois grupos principais, com ainda mais variantes, e no século XV, os incas adotaram uma delas como língua franca de seu vasto império, que se estende da Colômbia à Argentina.

Hoje, estima-se que as línguas Quéchuas sejam faladas por cerca de 8 a 10 milhões de pessoas na América do Sul - principalmente no Peru, Bolívia e Equador. O Quéchua do sul é de longe o mais falado, com cerca de 7 milhões de falantes.

Até recentemente, o sistema de aprendizado automático do Google Tradutor precisava ver traduções de um idioma para outros idiomas que conhece para dominá-lo, disse Isaac Caswell, pesquisador do Google Tradutor. Mas a ferramenta tem tanta experiência agora que pode aprender a traduzir um novo idioma com pouco mais do que o texto nesse idioma.

Caswell comparou o processo de aprendizado a um poliglota sendo trancado em uma sala com nada além de uma pilha de livros em um novo idioma; se tivesse tempo suficiente, o poliglota poderia descobri-lo.

Idiomas sub-representados como o Quéchua têm uma presença online crescente e, portanto, o modelo de tradução do Google aprendeu o idioma selecionando na web pública textos escritos nesse idioma.

“À medida que mais comunidades ficam online, é mais possível fazer esse tipo de coisa”, disse Caswell.

O Lingala, uma língua da África Central, também foi adicionado recentemente ao Google Tradutor, embora seja falado por cerca de 45 milhões de pessoas. Línguas europeias como a Sueca, Finlandesa ou Catalã, com um número muito menor de falantes nativos, estão na ferramenta de tradução há anos, principalmente porque foram super-representadas em textos online, disse Caswell.

Artistas de La Tunantada, uma dança tradicional andina, em Lima, Peru. Foto: Marco Garro/The New York Times

“As pessoas estão comemorando”, disse Maryk Francq Mavie Amonga, assistente de produção do serviço de notícias multilíngue Africanews e falante nativo de Lingala. “Há muitos lugares que ainda não nos conhecem.”

Há pouco mais de uma década, o Quéchua mal estava na internet, disse Alvarez Ccoscco, o ativista.

Mas ela e outros ativistas da língua Quéchua têm estado ocupados digitalizando dicionários, adaptando software de código aberto para o Quéchua, escrevendo blogs e revistas eletrônicas em Quéchua e oferecendo versões Quéchuas de tudo, desde textos coloniais e contos a videogames.

“O Google está realmente se juntando a esse ecossistema existente de esforços digitais para garantir que a língua esteja lá”, disse Mendoza-Mori, o estudioso de Harvard.

Ele disse que houve um movimento crescente na comunidade de língua Quéchua nos últimos anos que abraçou a língua e lutou contra os estereótipos que a retratam como uma relíquia do passado ou uma curiosidade cultural.

Após a conquista espanhola do Império Inca em 1532, o Quéchua passou a ser visto como um sinal de atraso ou fonte de suspeita pela nova classe dominante. Seu uso foi oficialmente proibido depois que o líder indígena Túpac Amaru II liderou uma revolta que varreu o sul dos Andes no final do século XVIII, terminando com sua tortura pública, desmembramento e decapitação.

Ainda assim, os falantes de Quéchua continuaram a constituir a maioria da população do Peru no início do século 20.

Mas em 2017, a porcentagem de peruanos que identificaram o Quéchua como sua primeira língua era de apenas 14%.

À medida que os falantes de Quéchua migraram dos planaltos andinos para as cidades - alguns em busca de oportunidades, outros desenraizados por conflitos - a língua não foi transmitida às novas gerações.

Nos anos 1980 e 90, batalhas sangrentas entre insurgentes de esquerda e forças de segurança do Estado dizimaram aldeias de língua Quéchua, deixando para trás tantos corpos torturados e valas comuns que as famílias dos “desaparecidos” ainda estão coletando seus restos mortais.

Em Lima, para onde muitos fugiram para escapar, “você não podia falar Quéchua abertamente porque seria considerado um comunista, um terrorista”, disse Ricardo Flores, um rapper, historiador e professor falante de Quéchua que cresceu parcialmente em San Juan de Lurigancho, distrito da capital com alta concentração de falantes do idioma.

Flores disse que ainda hoje, “os caras em mercados e parques, eles fingem que não falam o idioma”.

“Mas eles falam”, ele disse. “Mas só falam em casa.”

Um estigma pesa tanto sobre o Quéchua que não está claro se o idioma está crescendo ou em declínio, disse Mendoza-Mori. Embora o último censo do Peru tenha registrado um aumento no número de falantes do idioma, pode ser apenas porque mais pessoas estão dispostas a reconhecer que o falam, ele disse.

De todas as traduções de Quéchua que Alvarez Ccoscco tentou, ela disse que uma em particular a encheu de orgulho: “Musqusqaykimanta astawan karutaraq chayasaqku”.

Era uma linha escrita pelo escritor peruano José María Arguedas em um poema dedicado a Túpac Amaru II, que ela disse que o Google traduziu mais ou menos corretamente para “Vamos chegar mais longe do que você jamais sonhou”. /TRADUÇÃO LÍVIA BUELONI GONÇALVES

The New York Times Licensing Group - Todos os direitos reservados. É proibido todo tipo de reprodução sem autorização por escrito do The New York Times

Atualizamos nossa política de cookies

Ao utilizar nossos serviços, você aceita a política de monitoramento de cookies.