Sora: o que se sabe até agora sobre a IA da OpenAI que cria vídeos a partir de textos no ChatGPT

Ferramenta utiliza inteligência artificial generativa para criar instantaneamente vídeos curtos baseados em comandos escritos

PUBLICIDADE

Foto do author Redação
Por Redação

O criador do ChatGPT está entrando no mundo dos vídeos gerados por inteligência artificial. Sora é a nova ferramenta da OpenAI que converte textos em vídeos realistas. Esta ferramenta, que a empresa sediada em São Francisco apresentou na quinta-feira, 15, utiliza inteligência artificial generativa para criar instantaneamente vídeos curtos baseados em comandos escritos.

Não é a primeira ferramenta a demonstrar este tipo de tecnologia, mas analistas da indústria destacaram a alta qualidade dos vídeos que Sora gerou até agora, e apontaram que sua introdução representa um grande passo tanto para a OpenAI quanto para o futuro da geração de vídeos a partir de texto. No entanto, como acontece com todas as coisas no campo da inteligência artificial, este tipo de tecnologia também levanta preocupações sobre suas possíveis implicações éticas e sociais. Veja o que você precisa saber:

O que é Sora? Já posso usar?

PUBLICIDADE

Sora é um gerador de vídeos. Usa inteligência artificial para criar vídeos de até 60 segundos em resposta a comandos escritos. O modelo também pode criar vídeos a partir de uma imagem fixa. A IA generativa é um ramo da tecnologia que pode criar algo novo. Alguns exemplos são os chatbots, como o ChatGPT da OpenAI, e os geradores de imagens, como o DALL-E e o Midjourney.

Conseguir que um sistema de IA gere vídeos é mais novo e mais difícil, mas se baseia em parte da mesma tecnologia. Sora ainda não está disponível para o público - a OpenAI está colaborando com artistas e autoridades antes de tornar a nova ferramenta pública - e ainda há muito que não se sabe.

Publicidade

Mas desde o anúncio de quinta-feira, a empresa compartilhou uma série de exemplos de vídeos gerados por Sora para mostrar o que ele pode criar. O CEO da OpenAI, Sam Altman, também recorreu ao X (antigo Twitter) para pedir aos usuários da rede social que enviassem ideias para instruções. Mais tarde, ele compartilhou vídeos realistas que respondiam a sugestões como “dois golden retrievers fazendo um podcast no topo de uma montanha” e “uma competição de bicicletas no oceano com diferentes animais como atletas que montam bicicletas com uma câmera de drone”.

Há outras ferramentas de IA para gerar vídeos?

Sora da OpenAI não é a primeira ferramenta do seu tipo. Google, Meta e Runway ML são outras empresas que apresentaram tecnologias similares. No entanto, os analistas da indústria destacaram a qualidade e a impressionante duração dos vídeos de Sora compartilhados até agora.

Fred Havemeyer, diretor de pesquisa sobre IA e software nos Estados Unidos para a Macquarie, observou que o lançamento de Sora representa um grande avanço para o setor. “Você não só pode gerar vídeos mais longos, até 60 segundos, mas também os vídeos que são criados têm um aspecto mais normal e parecem respeitar mais a física e o mundo real”, explicou Havemeyer.

“Não vemos tantos vídeos de ‘vale inquietante’ (desconforto causado por representações que não são suficientemente realistas) ou fragmentos nos vídeos que são... pouco naturais.” Embora tenha havido um “tremendo progresso” nos vídeos gerados por IA no último ano - incluindo o lançamento do Stable Video Diffusion em novembro do ano passado - o analista sênior da Forrester, Rowan Curran, disse que esse tipo de vídeos exigiu mais “correções” para que os personagens e as cenas fossem coerentes.

Publicidade

A coerência e a duração dos vídeos de Sora, no entanto, representam “novas oportunidades para que os criativos incorporem elementos de vídeo gerados por IA a conteúdos mais tradicionais, e agora até para gerar vídeos narrativos completos a partir de um ou alguns poucos comandos”, disse Curran à Associated Press.

Print de vídeo gerado pela Sora, compartilhado no perfil oficial no X do CEO da OpenAI, Sam Altman Foto: Reprodução X.com/@sama

Quais são os possíveis riscos?

Embora as capacidades de Sora tenham impressionado desde seu lançamento na quinta-feira, também persistem preocupações sobre as implicações éticas e sociais dos usos da ferramenta. Havemeyer citou como exemplo os riscos substanciais para o ciclo eleitoral de 2024. Ter uma forma “potencialmente mágica” de gerar vídeos que pareçam e soem realistas levanta uma série de problemas dentro e fora da política, como a possibilidade de fraudes, propaganda e desinformação, acrescentou.

“As externalidades negativas da IA generativa serão um tema crítico de debate em 2024″, afirmou Havemeyer. “É uma questão substancial que todas as empresas e todas as pessoas terão que enfrentar este ano”. As empresas de tecnologia continuam tomando as decisões quando se trata de governar a IA e seus riscos, enquanto os governos de todo o mundo trabalham para se atualizar.

Em dezembro, a União Europeia chegou a um acordo sobre as primeiras regras abrangentes de IA do mundo, mas a lei não entrará em vigor até dois anos após sua aprovação final. Na quinta-feira, a OpenAI declarou que tomaria importantes medidas de segurança antes de generalizar o uso de Sora. “Estamos trabalhando com ‘equipes vermelhas’ - especialistas em áreas como desinformação, conteúdo que incita ao ódio e preconceitos - que testarão o modelo”, explicou a empresa.

Publicidade

CONTiNUA APÓS PUBLICIDADE

“Também estamos construindo ferramentas para ajudar a detectar conteúdo enganoso, como um classificador que pode indicar quando um vídeo foi gerado por Sora”. A vice-presidente de Assuntos Globais da OpenAI, Anna Makanju, reiterou isso ao falar na sexta-feira na Conferência de Segurança de Munique, onde a OpenAI e outras 19 empresas de tecnologia se comprometeram a colaborar voluntariamente para combater os deepfakes eleitorais gerados por IA.

Ela observou que a empresa lançaria Sora “de maneira bastante cautelosa”. Ao mesmo tempo, a OpenAI revelou pouca informação sobre como Sora foi criado. O relatório técnico da empresa não revela quais imagens e fontes de vídeo foram usadas para treinar Sora, e a empresa ainda não respondeu a um pedido de comentário feito na sexta-feira.

O lançamento de Sora também ocorre em um contexto de ações judiciais contra a OpenAI e seu parceiro comercial Microsoft por parte de alguns escritores e do The New York Times pelo uso de obras protegidas por direitos autorais para treinar o ChatGPT. A OpenAI paga uma quantia não divulgada à AP pela licença de seu arquivo de notícias em texto./ApEsp

Comentários

Os comentários são exclusivos para assinantes do Estadão.