Conheça a rotina nada futurista de quem treina inteligência artificial


Antes de um sistema de IA conseguir aprender, alguém tem de rotular os dados fornecidos a ele, um trabalho em expansão no underground tecnológico

Por Cade Metz
Centros de treinamento de IA lembram o ambiente de trabalho de um call center Foto: Rebecca Conway/The New York Times

 Muitas pessoas de tecnologia dirão que a inteligência artificial (IA) é o futuro do seu setor, e que vem se aperfeiçoando rápido graças a uma técnica  chamada aprendizado de máquina. Mas executivos de tecnologia raramente discutem o processo de trabalho intensivo na sua criação. A IA está aprendendo com os humanos. Um grande número deles. 

Antes de um sistema de IA conseguir aprender, alguém tem de rotular os dados fornecidos a ele. O trabalho é vital para a criação de inteligência artificial como carros autônomos, sistemas de vigilância e tratamento médico automatizado. 

continua após a publicidade

As companhias de tecnologia se mantêm silenciosas sobre este trabalho. E se deparam com preocupações crescentes da parte de defensores da privacidade em relação enormes volumes de dados pessoais que estão armazenando e compartilhando com empresas de fora. 

No início deste ano, consegui uma autorização para olhar por trás da cortina que os magos do Vale do Silício raramente dão acesso. Fiz uma viagem tortuosa pela Índia e parei em uma instituição do outro lado da rua onde fica o Superdome,  no centro de Nova Orleans. Ao todo visitei cinco escritórios, onde as pessoas estão realizando um trabalho repetitivo sem fim, necessário para ensinar os sistemas de IA. Todos esses escritórios são administrados por uma companhia chamada iMerit. 

Ali vemos pesquisadores de intestinos e especialistas em separar uma boa tosse de uma tosse ruim; experts em linguagem e pessoas capazes de identificar cenas de rua. O que é um pedestre? Esta é uma linha amarela dupla ou uma linha branca pontilhada? Um dia um carro robótico precisará saber a diferença. 

continua após a publicidade

O que vi não parecia muito com o futuro – ou pelo menos o futuro automatizado que você imaginaria. Os escritórios são como call centers ou centros de processamento de pagamentos. Um estava num edifício antigo de apartamentos no meio de um bairro de baixa renda em Kolkata, repleto de pedestres, riquixás e vendedores ambulantes. 

Em escritórios como os que visitei em Bhubaneswar e outras cidades na Índia, China, Nepal, Filipinas, África Oriental e Estados Unidos, dezenas de milhares de funcionários estão batendo ponto enquanto ensinam as máquinas. 

Discurso motivacional das grandes empresas de tecnologia também chegou à Índia, onde milhares de pessoas treinam IA Foto: Rebecca Conway/The New York Times
continua após a publicidade

Dezenas de milhares de empregados terceirizados normalmente trabalhando em suas casas também anotam dados por meio de serviços de crowdsourcing como o Amazon Mechanical Turk, que permite que qualquer pessoa distribua tarefas digitais para trabalhadores independentes nos Estados Unidos e em outros países. Esses trabalhadores ganham alguns centavos por cada rotulagem. 

Com sede na China, a iMerit rotula dados para muitos dos grandes nomes nos setores de tecnologia e automobilístico. Ela não os nomeia publicamente, citando acordos de confidencialidade. Mas revelou recentemente que seus mais de dois mil funcionários em nove escritórios em todo o mundo estão contribuindo para um serviço de rotulagem de dados da Amazon chamado SageMaker Ground Truth. Anteriormente, ele listou a Microsoft como cliente. 

Um dia, quem sabe quando, a IA conseguirá esvaziar o mercado de trabalho, mas no momento ela vem gerando empregos de baixo salário. O mercado de rotulagem de dados passou dos US$ 500 milhões em 2018 e chegará a US$ 1,2 bilhão em 2023 de acordo com a empresa de pesquisa Cognilytica. Este tipo de trabalho, segundo o estudo, representa 80% do tempo gasto na criação da tecnologia da IA.

continua após a publicidade

Este é um trabalho que explora os empregados? Depende de onde você vive e no que está trabalhando. Na Índia, é uma entrada para a classe média. Em Nova Orleans, é um trabalho decente. Para uma pessoa que trabalha como terceirizado com freqüência é um beco sem saída. 

Há competências que têm de ser aprendidas – como localizar sinais de uma doença em um vídeo ou num exame médico ou manter a mão firme quando traçar um laço digital em torno da imagem de um carro ou de uma árvore. Em alguns casos, quando a tarefa envolve vídeos médicos, pornografia, ou imagens violentas, o trabalho fica aterrador. 

“Quando você vê essas coisas pela primeira vez, é bem perturbador. Você não quer voltar ao trabalho. E pode não voltar”, disse Kristy Milland, que passou anos fazendo o trabalho de rotulagem de dados na Amazon Mechanical Turk. Ele se tornou um ativista em defesa das pessoas que fazem esse serviço. 

continua após a publicidade

Todos os pesquisadores esperam criar sistemas que possam ensinar a partir de volumes menores de dados. Mas num futuro próximo o trabalho humano é essencial. 

“Este é um mundo em expansão, oculto embaixo da tecnologia”,  afirmou Mary Gray, antropóloga na Microsoft e coautora do livro Ghost Work (Trabalho Fantasma, em tradução livre), que explora o mercado de rotulagem de dados. “É difícil tirar os humanos do sistema”. 

Olho no cólon 

continua após a publicidade

Bhubaneswar é chamada Cidade de Templos. E templos hindus antigos se erguem acima dos mercados à beira da estrada na extremidade sudoeste da cidade. Torres gigantes de pedra que datam do primeiro milênio. No centro da cidade, muitas ruas não são pavimentadas. Vacas e cães selvagens perambulam entre motos, carros e caminhões. 

A cidade, com uma população de 830 mil pessoas, está se tornando um núcleo crescente de trabalho online. A cinco minutos de carro dos templos, numa estrada pavimentada perto do centro da cidade, um prédio branco de quatro andares se esconde atrás de um muro de pedra. Dentro há três salas repletas de mesas enfileiradas, cada uma com sua própria tela de computador widescreen. É ali que Namita Pradhan passa seus dias rotulando vídeos e onde a encontrei. 

Sessão de treinamento no escritório da iMerit, uma empresa de TI de Kolkata, na Índia Foto: Rebecca Conway/The New York Times

No curso do que era um dia típico de oito horas de trabalho, Namita examinou uma dezena de vídeos de colonoscopia, constantemente revertendo o vídeo para olhar mais de perto as estruturas individuais. E com freqüência encontra o que está procurando. Então, faz um laço com uma caixa delimitadora. Ela traçou centenas dessas caixas delimitadoras, rotulando os pólipos e outros sinais de enfermidade, como coágulos sanguíneos e inflamações. 

Sua cliente, uma companhia nos Estados Unidos que a iMerit não pode dar o nome,  no final vai inserir seu trabalho num sistema de IA para que ele aprenda a identificar sozinho as condições médicas. O paciente cujo cólon foi rotulado não sabe necessariamente da existência do vídeo. Pradhan não sabe de onde vieram as imagens. Tampouco a iMerit. 

Namita Pradhan aprendeu sua função durante sete dias em videoconferência com um médico não praticante baseado em Oakland, Califórnia, que auxilia no treinamento de funcionários em muitos escritórios da iMerit. Mas algumas pessoas questionam se médicos experientes e estudantes de medicina não deveriam eles próprios realizar essa rotulagem. 

Este trabalho exige pessoas “com antecedentes médicos e conhecimento relevante de anatomia e patologia”, disse o Dr. George Shih, radiologista na Weil Cornell Medicine  and New York-Presbiterian, e cofundador da startup MD.ai., que auxilia organizações a criarem inteligência artificial para tratamento médico. 

Quando conversamos sobre o trabalho dela, Namita Pradhan qualificou-o como “bem interessante”, mas cansativo. E quanto à natureza gráfica dos vídeos?  “No início foi repugnante, mas depois você se acostuma”, ela respondeu. / TRADUÇÃO TEREZINHA MARTINO

Centros de treinamento de IA lembram o ambiente de trabalho de um call center Foto: Rebecca Conway/The New York Times

 Muitas pessoas de tecnologia dirão que a inteligência artificial (IA) é o futuro do seu setor, e que vem se aperfeiçoando rápido graças a uma técnica  chamada aprendizado de máquina. Mas executivos de tecnologia raramente discutem o processo de trabalho intensivo na sua criação. A IA está aprendendo com os humanos. Um grande número deles. 

Antes de um sistema de IA conseguir aprender, alguém tem de rotular os dados fornecidos a ele. O trabalho é vital para a criação de inteligência artificial como carros autônomos, sistemas de vigilância e tratamento médico automatizado. 

As companhias de tecnologia se mantêm silenciosas sobre este trabalho. E se deparam com preocupações crescentes da parte de defensores da privacidade em relação enormes volumes de dados pessoais que estão armazenando e compartilhando com empresas de fora. 

No início deste ano, consegui uma autorização para olhar por trás da cortina que os magos do Vale do Silício raramente dão acesso. Fiz uma viagem tortuosa pela Índia e parei em uma instituição do outro lado da rua onde fica o Superdome,  no centro de Nova Orleans. Ao todo visitei cinco escritórios, onde as pessoas estão realizando um trabalho repetitivo sem fim, necessário para ensinar os sistemas de IA. Todos esses escritórios são administrados por uma companhia chamada iMerit. 

Ali vemos pesquisadores de intestinos e especialistas em separar uma boa tosse de uma tosse ruim; experts em linguagem e pessoas capazes de identificar cenas de rua. O que é um pedestre? Esta é uma linha amarela dupla ou uma linha branca pontilhada? Um dia um carro robótico precisará saber a diferença. 

O que vi não parecia muito com o futuro – ou pelo menos o futuro automatizado que você imaginaria. Os escritórios são como call centers ou centros de processamento de pagamentos. Um estava num edifício antigo de apartamentos no meio de um bairro de baixa renda em Kolkata, repleto de pedestres, riquixás e vendedores ambulantes. 

Em escritórios como os que visitei em Bhubaneswar e outras cidades na Índia, China, Nepal, Filipinas, África Oriental e Estados Unidos, dezenas de milhares de funcionários estão batendo ponto enquanto ensinam as máquinas. 

Discurso motivacional das grandes empresas de tecnologia também chegou à Índia, onde milhares de pessoas treinam IA Foto: Rebecca Conway/The New York Times

Dezenas de milhares de empregados terceirizados normalmente trabalhando em suas casas também anotam dados por meio de serviços de crowdsourcing como o Amazon Mechanical Turk, que permite que qualquer pessoa distribua tarefas digitais para trabalhadores independentes nos Estados Unidos e em outros países. Esses trabalhadores ganham alguns centavos por cada rotulagem. 

Com sede na China, a iMerit rotula dados para muitos dos grandes nomes nos setores de tecnologia e automobilístico. Ela não os nomeia publicamente, citando acordos de confidencialidade. Mas revelou recentemente que seus mais de dois mil funcionários em nove escritórios em todo o mundo estão contribuindo para um serviço de rotulagem de dados da Amazon chamado SageMaker Ground Truth. Anteriormente, ele listou a Microsoft como cliente. 

Um dia, quem sabe quando, a IA conseguirá esvaziar o mercado de trabalho, mas no momento ela vem gerando empregos de baixo salário. O mercado de rotulagem de dados passou dos US$ 500 milhões em 2018 e chegará a US$ 1,2 bilhão em 2023 de acordo com a empresa de pesquisa Cognilytica. Este tipo de trabalho, segundo o estudo, representa 80% do tempo gasto na criação da tecnologia da IA.

Este é um trabalho que explora os empregados? Depende de onde você vive e no que está trabalhando. Na Índia, é uma entrada para a classe média. Em Nova Orleans, é um trabalho decente. Para uma pessoa que trabalha como terceirizado com freqüência é um beco sem saída. 

Há competências que têm de ser aprendidas – como localizar sinais de uma doença em um vídeo ou num exame médico ou manter a mão firme quando traçar um laço digital em torno da imagem de um carro ou de uma árvore. Em alguns casos, quando a tarefa envolve vídeos médicos, pornografia, ou imagens violentas, o trabalho fica aterrador. 

“Quando você vê essas coisas pela primeira vez, é bem perturbador. Você não quer voltar ao trabalho. E pode não voltar”, disse Kristy Milland, que passou anos fazendo o trabalho de rotulagem de dados na Amazon Mechanical Turk. Ele se tornou um ativista em defesa das pessoas que fazem esse serviço. 

Todos os pesquisadores esperam criar sistemas que possam ensinar a partir de volumes menores de dados. Mas num futuro próximo o trabalho humano é essencial. 

“Este é um mundo em expansão, oculto embaixo da tecnologia”,  afirmou Mary Gray, antropóloga na Microsoft e coautora do livro Ghost Work (Trabalho Fantasma, em tradução livre), que explora o mercado de rotulagem de dados. “É difícil tirar os humanos do sistema”. 

Olho no cólon 

Bhubaneswar é chamada Cidade de Templos. E templos hindus antigos se erguem acima dos mercados à beira da estrada na extremidade sudoeste da cidade. Torres gigantes de pedra que datam do primeiro milênio. No centro da cidade, muitas ruas não são pavimentadas. Vacas e cães selvagens perambulam entre motos, carros e caminhões. 

A cidade, com uma população de 830 mil pessoas, está se tornando um núcleo crescente de trabalho online. A cinco minutos de carro dos templos, numa estrada pavimentada perto do centro da cidade, um prédio branco de quatro andares se esconde atrás de um muro de pedra. Dentro há três salas repletas de mesas enfileiradas, cada uma com sua própria tela de computador widescreen. É ali que Namita Pradhan passa seus dias rotulando vídeos e onde a encontrei. 

Sessão de treinamento no escritório da iMerit, uma empresa de TI de Kolkata, na Índia Foto: Rebecca Conway/The New York Times

No curso do que era um dia típico de oito horas de trabalho, Namita examinou uma dezena de vídeos de colonoscopia, constantemente revertendo o vídeo para olhar mais de perto as estruturas individuais. E com freqüência encontra o que está procurando. Então, faz um laço com uma caixa delimitadora. Ela traçou centenas dessas caixas delimitadoras, rotulando os pólipos e outros sinais de enfermidade, como coágulos sanguíneos e inflamações. 

Sua cliente, uma companhia nos Estados Unidos que a iMerit não pode dar o nome,  no final vai inserir seu trabalho num sistema de IA para que ele aprenda a identificar sozinho as condições médicas. O paciente cujo cólon foi rotulado não sabe necessariamente da existência do vídeo. Pradhan não sabe de onde vieram as imagens. Tampouco a iMerit. 

Namita Pradhan aprendeu sua função durante sete dias em videoconferência com um médico não praticante baseado em Oakland, Califórnia, que auxilia no treinamento de funcionários em muitos escritórios da iMerit. Mas algumas pessoas questionam se médicos experientes e estudantes de medicina não deveriam eles próprios realizar essa rotulagem. 

Este trabalho exige pessoas “com antecedentes médicos e conhecimento relevante de anatomia e patologia”, disse o Dr. George Shih, radiologista na Weil Cornell Medicine  and New York-Presbiterian, e cofundador da startup MD.ai., que auxilia organizações a criarem inteligência artificial para tratamento médico. 

Quando conversamos sobre o trabalho dela, Namita Pradhan qualificou-o como “bem interessante”, mas cansativo. E quanto à natureza gráfica dos vídeos?  “No início foi repugnante, mas depois você se acostuma”, ela respondeu. / TRADUÇÃO TEREZINHA MARTINO

Centros de treinamento de IA lembram o ambiente de trabalho de um call center Foto: Rebecca Conway/The New York Times

 Muitas pessoas de tecnologia dirão que a inteligência artificial (IA) é o futuro do seu setor, e que vem se aperfeiçoando rápido graças a uma técnica  chamada aprendizado de máquina. Mas executivos de tecnologia raramente discutem o processo de trabalho intensivo na sua criação. A IA está aprendendo com os humanos. Um grande número deles. 

Antes de um sistema de IA conseguir aprender, alguém tem de rotular os dados fornecidos a ele. O trabalho é vital para a criação de inteligência artificial como carros autônomos, sistemas de vigilância e tratamento médico automatizado. 

As companhias de tecnologia se mantêm silenciosas sobre este trabalho. E se deparam com preocupações crescentes da parte de defensores da privacidade em relação enormes volumes de dados pessoais que estão armazenando e compartilhando com empresas de fora. 

No início deste ano, consegui uma autorização para olhar por trás da cortina que os magos do Vale do Silício raramente dão acesso. Fiz uma viagem tortuosa pela Índia e parei em uma instituição do outro lado da rua onde fica o Superdome,  no centro de Nova Orleans. Ao todo visitei cinco escritórios, onde as pessoas estão realizando um trabalho repetitivo sem fim, necessário para ensinar os sistemas de IA. Todos esses escritórios são administrados por uma companhia chamada iMerit. 

Ali vemos pesquisadores de intestinos e especialistas em separar uma boa tosse de uma tosse ruim; experts em linguagem e pessoas capazes de identificar cenas de rua. O que é um pedestre? Esta é uma linha amarela dupla ou uma linha branca pontilhada? Um dia um carro robótico precisará saber a diferença. 

O que vi não parecia muito com o futuro – ou pelo menos o futuro automatizado que você imaginaria. Os escritórios são como call centers ou centros de processamento de pagamentos. Um estava num edifício antigo de apartamentos no meio de um bairro de baixa renda em Kolkata, repleto de pedestres, riquixás e vendedores ambulantes. 

Em escritórios como os que visitei em Bhubaneswar e outras cidades na Índia, China, Nepal, Filipinas, África Oriental e Estados Unidos, dezenas de milhares de funcionários estão batendo ponto enquanto ensinam as máquinas. 

Discurso motivacional das grandes empresas de tecnologia também chegou à Índia, onde milhares de pessoas treinam IA Foto: Rebecca Conway/The New York Times

Dezenas de milhares de empregados terceirizados normalmente trabalhando em suas casas também anotam dados por meio de serviços de crowdsourcing como o Amazon Mechanical Turk, que permite que qualquer pessoa distribua tarefas digitais para trabalhadores independentes nos Estados Unidos e em outros países. Esses trabalhadores ganham alguns centavos por cada rotulagem. 

Com sede na China, a iMerit rotula dados para muitos dos grandes nomes nos setores de tecnologia e automobilístico. Ela não os nomeia publicamente, citando acordos de confidencialidade. Mas revelou recentemente que seus mais de dois mil funcionários em nove escritórios em todo o mundo estão contribuindo para um serviço de rotulagem de dados da Amazon chamado SageMaker Ground Truth. Anteriormente, ele listou a Microsoft como cliente. 

Um dia, quem sabe quando, a IA conseguirá esvaziar o mercado de trabalho, mas no momento ela vem gerando empregos de baixo salário. O mercado de rotulagem de dados passou dos US$ 500 milhões em 2018 e chegará a US$ 1,2 bilhão em 2023 de acordo com a empresa de pesquisa Cognilytica. Este tipo de trabalho, segundo o estudo, representa 80% do tempo gasto na criação da tecnologia da IA.

Este é um trabalho que explora os empregados? Depende de onde você vive e no que está trabalhando. Na Índia, é uma entrada para a classe média. Em Nova Orleans, é um trabalho decente. Para uma pessoa que trabalha como terceirizado com freqüência é um beco sem saída. 

Há competências que têm de ser aprendidas – como localizar sinais de uma doença em um vídeo ou num exame médico ou manter a mão firme quando traçar um laço digital em torno da imagem de um carro ou de uma árvore. Em alguns casos, quando a tarefa envolve vídeos médicos, pornografia, ou imagens violentas, o trabalho fica aterrador. 

“Quando você vê essas coisas pela primeira vez, é bem perturbador. Você não quer voltar ao trabalho. E pode não voltar”, disse Kristy Milland, que passou anos fazendo o trabalho de rotulagem de dados na Amazon Mechanical Turk. Ele se tornou um ativista em defesa das pessoas que fazem esse serviço. 

Todos os pesquisadores esperam criar sistemas que possam ensinar a partir de volumes menores de dados. Mas num futuro próximo o trabalho humano é essencial. 

“Este é um mundo em expansão, oculto embaixo da tecnologia”,  afirmou Mary Gray, antropóloga na Microsoft e coautora do livro Ghost Work (Trabalho Fantasma, em tradução livre), que explora o mercado de rotulagem de dados. “É difícil tirar os humanos do sistema”. 

Olho no cólon 

Bhubaneswar é chamada Cidade de Templos. E templos hindus antigos se erguem acima dos mercados à beira da estrada na extremidade sudoeste da cidade. Torres gigantes de pedra que datam do primeiro milênio. No centro da cidade, muitas ruas não são pavimentadas. Vacas e cães selvagens perambulam entre motos, carros e caminhões. 

A cidade, com uma população de 830 mil pessoas, está se tornando um núcleo crescente de trabalho online. A cinco minutos de carro dos templos, numa estrada pavimentada perto do centro da cidade, um prédio branco de quatro andares se esconde atrás de um muro de pedra. Dentro há três salas repletas de mesas enfileiradas, cada uma com sua própria tela de computador widescreen. É ali que Namita Pradhan passa seus dias rotulando vídeos e onde a encontrei. 

Sessão de treinamento no escritório da iMerit, uma empresa de TI de Kolkata, na Índia Foto: Rebecca Conway/The New York Times

No curso do que era um dia típico de oito horas de trabalho, Namita examinou uma dezena de vídeos de colonoscopia, constantemente revertendo o vídeo para olhar mais de perto as estruturas individuais. E com freqüência encontra o que está procurando. Então, faz um laço com uma caixa delimitadora. Ela traçou centenas dessas caixas delimitadoras, rotulando os pólipos e outros sinais de enfermidade, como coágulos sanguíneos e inflamações. 

Sua cliente, uma companhia nos Estados Unidos que a iMerit não pode dar o nome,  no final vai inserir seu trabalho num sistema de IA para que ele aprenda a identificar sozinho as condições médicas. O paciente cujo cólon foi rotulado não sabe necessariamente da existência do vídeo. Pradhan não sabe de onde vieram as imagens. Tampouco a iMerit. 

Namita Pradhan aprendeu sua função durante sete dias em videoconferência com um médico não praticante baseado em Oakland, Califórnia, que auxilia no treinamento de funcionários em muitos escritórios da iMerit. Mas algumas pessoas questionam se médicos experientes e estudantes de medicina não deveriam eles próprios realizar essa rotulagem. 

Este trabalho exige pessoas “com antecedentes médicos e conhecimento relevante de anatomia e patologia”, disse o Dr. George Shih, radiologista na Weil Cornell Medicine  and New York-Presbiterian, e cofundador da startup MD.ai., que auxilia organizações a criarem inteligência artificial para tratamento médico. 

Quando conversamos sobre o trabalho dela, Namita Pradhan qualificou-o como “bem interessante”, mas cansativo. E quanto à natureza gráfica dos vídeos?  “No início foi repugnante, mas depois você se acostuma”, ela respondeu. / TRADUÇÃO TEREZINHA MARTINO

Atualizamos nossa política de cookies

Ao utilizar nossos serviços, você aceita a política de monitoramento de cookies.