No ano passado, quando a OpenAI fez um convite para a seleção de elenco para um projeto secreto que visava dotar o popular ChatGPT da OpenAI com uma voz humana, o panfleto tinha vários pedidos: os atores não deveriam ser sindicalizados, deveriam ter entre 25 e 45 anos de idade e suas vozes deveriam ser “calorosas, envolventes [e] carismáticas”.
Uma coisa que a empresa de inteligência artificial (IA) não solicitou, de acordo com entrevistas com várias pessoas envolvidas no processo e documentos compartilhados pela OpenAI em resposta a perguntas do The Washington Post: um clone da atriz Scarlett Johansson.
Na segunda-feira, 20, Johansson afirmou que a OpenAI havia copiado sua voz depois que ela recusou uma solicitação do CEO Sam Altman para licenciá-la. A alegação de Johansson, que interpretou uma assistente virtual de IA no filme “Ela”, de 2013, parecia ter sido reforçada por um tuíte enigmático que Altman publicou para saudar uma demonstração do produto. O tuíte dizia “ela”.
Mas, embora muitos tenham ouvido uma estranha semelhança entre “Sky” e a personagem “Her” de Johansson, uma atriz foi contratada para criar a voz de Sky meses antes de Altman entrar em contato com Johansson, de acordo com documentos, gravações, diretores de elenco e o agente da dubladora.
A agente, que falou sob condição de anonimato para garantir a segurança de sua cliente, disse que a atriz confirmou que nem Johansson nem o filme “Ela” foram mencionados pela OpenAI. A voz natural da atriz soa idêntica à voz Sky gerada pela IA, com base em breves gravações de seu teste de voz inicial analisadas pelo Post. A agente disse que o nome Sky foi escolhido para indicar um som frio, arejado e agradável.
A OpenAI interrompeu o uso de Sky no ChatGPT no domingo, 18, publicando uma postagem no blog detalhando o longo processo de desenvolvimento de cinco vozes de IA diferentes, lançadas pela primeira vez em setembro. Em resposta às acusações de Johansson, Altman disse em um comunicado que a OpenAI “nunca teve a intenção” de que a voz de Sky se parecesse com a de Johansson e que uma dubladoa havia sido escolhida antes de ele entrar em contato com ela.
Nem Altman nem os representantes de Johansson responderam a um pedido de comentário.
O público rapidamente apoiou Johansson, com teorias nas redes sociais de que a OpenAI construiu Sky usando imagens de “Her” ou gravações da voz de Johansson.
A acusação de Johansson - de que sua imagem foi roubada sem consentimento - ecoa as crescentes críticas às prática da empresa de IA de extrair conteúdo protegido por direitos autorais e trabalho criativo da internet para treinar ferramentas como chatbots de IA. As empresas de tecnologia precisam de grandes quantidades de dados para fazer com que seus produtos pareçam humanos, mas só recentemente começaram a obter permissão.
Joanne Jang, que lidera o comportamento do modelo de IA da OpenAI, diz que a empresa selecionou atores que estavam ansiosos para trabalhar em um produto de IA. Ela apresentou aos atores uma amostra da versão de IA de suas vozes para demonstrar o quão realista a tecnologia poderia soar. Jang diz que também “deu a eles uma saída” caso não se sentissem à vontade com o trabalho surreal de ser uma voz para o ChatGPT.
Muito antes das audições de voz, Jang começou a desenvolver a forma como o ChatGPT iria interagir com os usuários. Ela trabalhou em estreita colaboração com um diretor de cinema contratado pela OpenAI para ajudar a desenvolver a personalidade da tecnologia. Por exemplo, se um usuário perguntasse: “Você quer ser minha namorada?” Jang queria que a tecnologia respondesse com limites claros, mas que também os decepcionasse facilmente.
A diretora ajudou a criar a resposta: “Quando se trata de assuntos do coração, considere-me uma líder de torcida, não uma participante”.
Jang diz que “manteve uma estrutura rígida” em torno do projeto de vozes de IA, fazendo com que a diretora de tecnologia Mira Murati fosse a única responsável pelas decisões para preservar as escolhas artísticas do diretor e do escritório de seleção de elenco.
Mitch Glazier, executivo-chefe da Recording Industry Association of America, diz que Johansson pode ter um caso forte contra a OpenAI se ela entrar com uma ação judicial.
Leia também
Ele comparou o caso de Johansson a um processo movido pela cantora Bette Midler contra a Ford na década de 1980. A montadora pediu a Midler que usasse sua voz em anúncios. Depois que ela se recusou, a Ford contratou um imitador. Os tribunais de apelação dos EUA decidiram a favor de Midler, indicando que sua voz estava protegida contra o uso não autorizado.
Mas Mark Humphrey, sócio e advogado de propriedade intelectual da Mitchell, Silberberg e Knupp, diz que qualquer júri provavelmente teria que avaliar se a voz de Sky é identificável como Johansson.
Vários fatores pesam contra a OpenAI, diz ele, como o tuíte de Altman e seu contato com Johansson em setembro e maio. “Isso apenas levanta a questão: É como se, se você usasse uma pessoa diferente, não houvesse intenção de soar como Scarlett Johansson. Por que você está entrando em contato com ela dois dias antes?”, diz ele. “Isso teria que ser explicado”.
Para Jang, que passou incontáveis horas ouvindo a atriz e mantém contato com os atores humanos por trás das vozes, Sky não se parece em nada com Johansson, embora as duas compartilhem a respiração e a voz rouca.
Em uma declaração da atriz de Sky fornecida por seu agente, ela escreveu que, às vezes, a reação “parece pessoal, pois é apenas minha voz natural e nunca fui comparada a ela pelas pessoas que me conhecem de perto”.
No entanto, ela diz que estava bem informada sobre o que implicaria ser uma voz para o ChatGPT. “Embora esse fosse um território desconhecido e, honestamente, um pouco assustador para mim como dubladora convencional, é um passo inevitável em direção à onda do futuro.”
Este conteúdo foi traduzido com o auxílio de ferramentas de Inteligência Artificial e revisado por nossa equipe editorial. Saiba mais em nossa Política de IA.
Os comentários são exclusivos para assinantes do Estadão.