Google anuncia ‘pacotão’ de serviços em IA com gerador de imagens e dublador de vídeo

Ainda de olho em conquistar território no setor de inteligência artificial (IA), o Google anunciou nesta quarta-feira, 10, durante o evento Google I/O, um pacote de novidades que usam a tecnologia para tarefas do ecossistema da empresa como o Google Docs, Planilhas, Apresentações e Gmail. Um dos principais anúncios foi a evolução de um modelo de linguagem, o PaLM 2, que pode processar centenas de idiomas e até exames médicos por meio de um software.

O PaLM 2 é uma evolução do chamado Pathways Language Model, um tipo de algoritmo de processamento que une diversas linguagens para gerar conteúdo. O presidente do Google, Sundar Pichai afirmou no evento que a nova ferramenta está equipada com mais de 100 linguagens e vai funcionar em 25 produtos diferentes da empresa.

“Apresentaremos o PaLM 2, nosso modelo de linguagem de próxima geração com recursos aprimorados de multilíngue, raciocínio e codificação. O PaLM 2 é mais rápido e mais eficiente do que os modelos anteriores, ao mesmo tempo em que é mais capaz”, afirmou a empresa.

Outra ferramenta ligada ao PaLM 2 é o PaLM-Med, que consegue sintetizar informações a partir de imagens médicas, como exames de raio-x e ressonâncias. A partir do processamento gráfico, será possível interpretar possíveis diagnósticos fornecidos pelo exame.

De acordo com a empresa, a tecnologia também foi aprimorada para entender linguagens e expressões que podem aparecer de forma diferentes em processos de tradução, como gírias e outras particularidades de dialetos regionais.

Pichai abriu a conferência falando sobre IA Foto: Josh Edelson/AFP

Texto e imagens

O desenvolvimento do PaLM 2 e de outros modelos de linguagem são um motor para outros produtos da empresa que podem utilizar o recurso — e, talvez, ser o diferencial da companhia na hora de competir com outras IAs que já existem no mercado.

O Google retém, por exemplo, grande parte de seus usuários pela sua “conta universal” que começa pelo e-mail Gmail e passa pelo Google Drive e Google Docs, principalmente. Nessas ferramentas, a inclusão da IA pode trazer para empresa algo que as rivais ainda não puderam consolidar: a integração total da tecnologia em produtos que já são utilizados pelo público.

Pensando nisso, a empresa apresentou uma ferramenta chamada “Help me write”, que já havia sido anunciada pelo Google em março, e será a principal vertente de IA da empresa dentro das ferramentas de construção de texto.

No Gmail e no Google Docs, será possível acionar um comando para que a IA comece a escrever sobre determinado assunto, padronize o conteúdo ou mesmo produza um modelo específico de texto, como currículos ou tópicos.

As planilhas da empresa, utilizadas também no Google Workspace, ganham uma função parecida. O recurso foi batizado de “Help me organize”. Ao clicar no botão, basta escrever um comando na nova aba aberta e selecionar “Create”. Assim como o Google Apresentações terá o botão “Help me visualize”, que permite gerar imagens baseadas nos comandos escritos pelo usuário.

“Os comandos são uma maneira poderosa de se comunicar com a IA, mas pode ser assustador saber por onde começar. E se a IA pudesse proativamente oferecer comandos - e mudar com base no que você está trabalhando?”, pontuou Aparna Pappu, vice-presidente do Google Workspace, na apresentação do conjunto de ferramentas.

O recurso estará disponível para usuários até o final do ano.

Bard

O chatbot inteligente do Google também vai ganhar novidades. A empresa anunciou a chegada de ferramentas ao Bard, robô de conversação da companhia, a capacidade de processar e entender imagens. Em uma integração com o Google Lens, ferramenta de identificação de imagens da companhia, o chatbot vai poder sugerir conteúdos em textos como legendas e comentários

Além disso, a busca pelo Bard também poderá ser personalizada para fornecer resultados em diferentes formatos. Será possível, por exemplo, pedir para o chatbot responder a comandos com as informações organizadas em tabelas. Com integração com outras ferramentas do Google, o usuário poderá exportar as informações para uma planilha ou um documento dos serviços da empresa.

Por enquanto, além do inglês, o Bard vai ganhar versões em coreano e japonês a partir desta semana, com suporte para 40 outros idiomas em breve. O Google também anunciou que o recurso deve chegar em mais de 180 países.

Uma camada de segurança também foi adicionada no chatbot para restringir respostas de conteúdos sensíveis ou desinformação. A empresa explicou que a intenção é evitar que usuários induzam a IA a produzir conteúdos falsos. No exemplo da companhia, ao pedir para o Bard fornecer argumentos que provem que a chegada do homem à Lua foi falsa, o usuário foi informado, por meio de uma série de tópicos, que seu comando não estava correto — e, portanto, não seria atendido.

Google Street View captura imagem de homem colocando saco em carro - e ajuda a resolver um crime

Jeff Bezos se prepara para diminuir a diferença na corrida espacial com Elon Musk

Pilares da IA dão sinais de esgotamento e colocam em xeque o futuro da tecnologia

O lançamento, em fevereiro deste ano, ocorreu em meio ao pico de acessos no ChatGPT, da OpenAI, em busca de retomar a concorrência em IA no setor conversacional. O Bard é alimentado pelo LaMDA (Language Model for Dialogue Applications), chatbot do Google que fez barulho no ano passado quando um engenheiro da companhia afirmou que o sistema tinha desenvolvido consciência, algo refutado tanto pela empresa quanto por especialistas.

Pesquisa

Para as pesquisas no buscador, a IA deve ser implementada para potencializar os resultados de forma mais personalizada para as perguntas dos usuários — o recurso foi chamado de “Search Generative Experience”. A barra de buscas permanece a mesma, mas será possível obter resultados em formato de tópicos e comentários “prontos”, diferente das imagens e links de redirecionamento que são mostrados atualmente no site.

Ao selecionar o botão “Ask a follow up”, a aba vai liberar uma barra de texto para conversar com a IA por um chat e personalizar ainda mais os resultados, semelhante ao que acontece no Bing, buscador equipado com o GPT-4, da OpenAI — e operado pela rival do Google, Microsoft.

O “Search Generative Experience” estará disponível no Google Labs nas próximas semanas. Aos usuários dos Estados Unidos, é possível entrar na lista de espera para testar as novidades a partir desta quarta.

Tradutor

No campo dos testes, o Google mostrou uma espécie de protótipo da ferramenta “Universal Translate”. O software é um algoritmo de dublagem automático que pode, rapidamente, identificar o idioma falado e traduzir para uma outra língua em forma de dublagem.

James Manyika apresentou os primeiros testes com a ferramenta de "dublagem" automática do Google Foto: Josh Edelson/AFP

A intenção é tornar processos de tradução mais fáceis para produções audiovisuais. A ferramenta é capaz de identificar o som da voz, sotaques e línguas e criar um arquivo de áudio com o mesmo conteúdo, mas falado em outro idioma.

A partir disso, o arquivo de áudio — gerado com uma voz semelhante à do Google tradutor — é incorporado e sincronizado automaticamente com o vídeo original, terminando o processo de “dublagem” da produção.

De acordo com a empresa, a ferramenta é uma “tensão entre ousadia e segurança”. Isso porque a técnica pode ser utilizada para produzir as chamadas deep fakes, vídeos editados por IA que espalham desinformação. Em desenvolvimento, a IA precisa ainda ser certificada para que possa ser usada com segurança, e nos testes vai ser utilizada apenas por parceiros selecionados pela empresa.

“Este é um enorme avanço para a compreensão do aprendizado”, disse James Manyika, chefe do departamento de tecnologia e sociedade do Google. “Mas há uma tensão inerente aqui: parte da mesma tecnologia pode ser mal utilizada por pessoas mal-intencionadas. Em breve, estaremos integrando inovações em marca d’água em nossos modelos generativos mais recentes para também ajudar no desafio da desinformação”.

Tudo Sobre

Comentários

Os comentários são exclusivos para assinantes do Estadão.

Assine o Estadão Já sou assinante

Google anuncia ‘pacotão’ de serviços em IA com gerador de imagens e dublador de vídeo

Novidades foram apresentadas no Google I/O, principal evento da empresa no ano

Texto e imagens

Bard

Pesquisa

Tradutor

Últimas: Empresas

Google Street View captura imagem de homem colocando saco em carro - e ajuda a resolver um crime

Jeff Bezos se prepara para diminuir a diferença na corrida espacial com Elon Musk

ChatGPT no WhatsApp, ‘super IA’ e Sora: veja toda a surra de anúncios da OpenAI em dezembro

Nova IA da OpenAI dá sinais de superinteligência e empresa convoca testes de segurança

ChatGPT agora está mais integrado com outros apps; veja como funciona

Mais lidas

Google Street View captura imagem de homem colocando saco em carro - e ajuda a resolver um crime

Jeff Bezos se prepara para diminuir a diferença na corrida espacial com Elon Musk

Pilares da IA dão sinais de esgotamento e colocam em xeque o futuro da tecnologia

Testamos a Sora, IA da OpenAI que gera filmes curtos, e ela decepciona; veja vídeo

Limpou banheiros, foi garçom, hoje é bilionário: veja curiosidades sobre Jensen Huang, CEO da Nvidia

Mais conteúdo sobre este tema

Texto e imagens

Bard

Pesquisa

Tradutor

Últimas: Empresas

Google Street View captura imagem de homem colocando saco em carro - e ajuda a resolver um crime

Jeff Bezos se prepara para diminuir a diferença na corrida espacial com Elon Musk

ChatGPT no WhatsApp, ‘super IA’ e Sora: veja toda a surra de anúncios da OpenAI em dezembro

Nova IA da OpenAI dá sinais de superinteligência e empresa convoca testes de segurança

ChatGPT agora está mais integrado com outros apps; veja como funciona

Mais lidas

Google Street View captura imagem de homem colocando saco em carro - e ajuda a resolver um crime

Jeff Bezos se prepara para diminuir a diferença na corrida espacial com Elon Musk

Pilares da IA dão sinais de esgotamento e colocam em xeque o futuro da tecnologia

Testamos a Sora, IA da OpenAI que gera filmes curtos, e ela decepciona; veja vídeo

Limpou banheiros, foi garçom, hoje é bilionário: veja curiosidades sobre Jensen Huang, CEO da Nvidia