OpenAI adia lançamento de assistente de voz por problemas de segurança

Empresa de inteligência artificial havia planejado lançar novos recursos de voz para o ChatGPT neste mês

PUBLICIDADE

Por Gerrit De Vynck (The Washington Post )
Atualização:

SÃO FRANCISCO - A OpenAI disse na terça-feira, 27, que atrasaria o lançamento dos recursos de voz e de leitura de emoções para seu chatbot ChatGPT porque precisava de mais tempo para testes de segurança. A empresa exibiu as ferramentas pela primeira vez em uma demonstração no mês passado que provocou entusiasmo nos usuários do ChatGPT - mas também a ameaça de um processo judicial da atriz Scarlett Johansson, que alegou que a empresa copiou sua voz para uma de suas personas de inteligência artificial (IA).

A OpenAI havia planejado originalmente oferecer os novos recursos a alguns assinantes pagantes no final de junho, mas está adiando esse lançamento inicial em um mês, disse a empresa em um comunicado no X. Os recursos estarão disponíveis para todos os usuários pagantes no segundo semestre, disse a empresa, embora tenha acrescentado a ressalva de que “os prazos exatos dependem do cumprimento de nossa alta barra de segurança e confiabilidade”.

A OpenAI havia planejado originalmente oferecer os novos recursos a alguns assinantes pagantes no final de junho Foto: Dado Ruvic/Reuters

PUBLICIDADE

A OpenAI adicionou pela primeira vez a capacidade do ChatGPT de falar em uma das várias vozes sintéticas, ou “personas”, no final do ano passado. A demonstração em maio utilizou uma dessas vozes para mostrar um sistema de IA mais novo e mais capaz, chamado GPT-4o, que permitiu que o chatbot falasse em tons expressivos, respondesse ao tom de voz e às expressões faciais de uma pessoa e tivesse conversas mais complexas. Uma das vozes, que a OpenAI chamou de Sky, lembra a voz de um bot de IA interpretado por Johansson no filme de 2013 “Her”, sobre um homem solitário que se apaixona por sua assistente de IA.

O CEO da OpenAI, Sam Altman, negou que a empresa tenha treinado o bot com a voz de Johansson. O Washington Post informou no mês passado que a empresa contratou um ator diferente para fornecer o áudio de treinamento, de acordo com registros internos e entrevistas com diretores de elenco e com o agente do ator.

À medida que as maiores empresas de tecnologia do mundo e as novatas, como a OpenAI, correm para competir na área de IA generativa, vários projetos se deparam com obstáculos inesperados. No mês passado, o Google reduziu a frequência com que mostra respostas geradas por IA no topo dos resultados de pesquisa, depois que a ferramenta cometeu erros estranhos, como dizer às pessoas para colocarem cola na pizza. Em fevereiro, a empresa de pesquisa retirou um gerador de imagens de IA criticado por criar imagens como a de uma mulher papa. No ano passado, a Microsoft fez alterações em seu próprio chatbot de IA depois que ele às vezes forneceu respostas bizarras e agressivas.

Publicidade

A OpenAI disse na terça-feira que precisava de mais tempo para tornar a nova versão de voz de seu chatbot melhor para perceber e bloquear alguns conteúdos, sem revelar detalhes específicos. Muitas ferramentas de IA têm sido criticadas por inventar informações falsas, divulgar conteúdo racista ou sexista ou apresentar preconceitos em seus resultados. Projetar um chatbot que tente interpretar e imitar emoções aumenta a complexidade de suas interações, abrindo novos caminhos para que as coisas deem errado.

“O Modo de Voz avançado do ChatGPT pode entender e responder com emoções e sinais não verbais, aproximando-nos de conversas naturais e em tempo real com a IA”, disse a OpenAI em seu comunicado. “Nossa missão é trazer essas novas experiências para você de forma cuidadosa.”

Este conteúdo foi traduzido com o auxílio de ferramentas de Inteligência Artificial e revisado por nossa equipe editorial. Saiba mais em nossa Política de IA.

Comentários

Os comentários são exclusivos para assinantes do Estadão.