Google anuncia ‘pacotão’ de serviços em IA com gerador de imagens e dublador de vídeo

Novidades foram apresentadas no Google I/O, principal evento da empresa no ano

PUBLICIDADE

Foto do author Bruna Arimathea
Atualização:

Ainda de olho em conquistar território no setor de inteligência artificial (IA), o Google anunciou nesta quarta-feira, 10, durante o evento Google I/O, um pacote de novidades que usam a tecnologia para tarefas do ecossistema da empresa como o Google Docs, Planilhas, Apresentações e Gmail. Um dos principais anúncios foi a evolução de um modelo de linguagem, o PaLM 2, que pode processar centenas de idiomas e até exames médicos por meio de um software.

PUBLICIDADE

O PaLM 2 é uma evolução do chamado Pathways Language Model, um tipo de algoritmo de processamento que une diversas linguagens para gerar conteúdo. O presidente do Google, Sundar Pichai afirmou no evento que a nova ferramenta está equipada com mais de 100 linguagens e vai funcionar em 25 produtos diferentes da empresa.

“Apresentaremos o PaLM 2, nosso modelo de linguagem de próxima geração com recursos aprimorados de multilíngue, raciocínio e codificação. O PaLM 2 é mais rápido e mais eficiente do que os modelos anteriores, ao mesmo tempo em que é mais capaz”, afirmou a empresa.

Outra ferramenta ligada ao PaLM 2 é o PaLM-Med, que consegue sintetizar informações a partir de imagens médicas, como exames de raio-x e ressonâncias. A partir do processamento gráfico, será possível interpretar possíveis diagnósticos fornecidos pelo exame.

De acordo com a empresa, a tecnologia também foi aprimorada para entender linguagens e expressões que podem aparecer de forma diferentes em processos de tradução, como gírias e outras particularidades de dialetos regionais.

Pichai abriu a conferência falando sobre IA Foto: Josh Edelson/AFP

Texto e imagens

O desenvolvimento do PaLM 2 e de outros modelos de linguagem são um motor para outros produtos da empresa que podem utilizar o recurso — e, talvez, ser o diferencial da companhia na hora de competir com outras IAs que já existem no mercado.

O Google retém, por exemplo, grande parte de seus usuários pela sua “conta universal” que começa pelo e-mail Gmail e passa pelo Google Drive e Google Docs, principalmente. Nessas ferramentas, a inclusão da IA pode trazer para empresa algo que as rivais ainda não puderam consolidar: a integração total da tecnologia em produtos que já são utilizados pelo público.

Publicidade

Pensando nisso, a empresa apresentou uma ferramenta chamada “Help me write”, que já havia sido anunciada pelo Google em março, e será a principal vertente de IA da empresa dentro das ferramentas de construção de texto.

No Gmail e no Google Docs, será possível acionar um comando para que a IA comece a escrever sobre determinado assunto, padronize o conteúdo ou mesmo produza um modelo específico de texto, como currículos ou tópicos.

As planilhas da empresa, utilizadas também no Google Workspace, ganham uma função parecida. O recurso foi batizado de “Help me organize”. Ao clicar no botão, basta escrever um comando na nova aba aberta e selecionar “Create”. Assim como o Google Apresentações terá o botão “Help me visualize”, que permite gerar imagens baseadas nos comandos escritos pelo usuário.

“Os comandos são uma maneira poderosa de se comunicar com a IA, mas pode ser assustador saber por onde começar. E se a IA pudesse proativamente oferecer comandos - e mudar com base no que você está trabalhando?”, pontuou Aparna Pappu, vice-presidente do Google Workspace, na apresentação do conjunto de ferramentas.

O recurso estará disponível para usuários até o final do ano.

Bard

O chatbot inteligente do Google também vai ganhar novidades. A empresa anunciou a chegada de ferramentas ao Bard, robô de conversação da companhia, a capacidade de processar e entender imagens. Em uma integração com o Google Lens, ferramenta de identificação de imagens da companhia, o chatbot vai poder sugerir conteúdos em textos como legendas e comentários

Sissie Hsiao, vice-presidente do Google Assistant apresentou as novidades do Bard Foto: Josh Edelson/AFP

Além disso, a busca pelo Bard também poderá ser personalizada para fornecer resultados em diferentes formatos. Será possível, por exemplo, pedir para o chatbot responder a comandos com as informações organizadas em tabelas. Com integração com outras ferramentas do Google, o usuário poderá exportar as informações para uma planilha ou um documento dos serviços da empresa.

Publicidade

Por enquanto, além do inglês, o Bard vai ganhar versões em coreano e japonês a partir desta semana, com suporte para 40 outros idiomas em breve. O Google também anunciou que o recurso deve chegar em mais de 180 países.

Uma camada de segurança também foi adicionada no chatbot para restringir respostas de conteúdos sensíveis ou desinformação. A empresa explicou que a intenção é evitar que usuários induzam a IA a produzir conteúdos falsos. No exemplo da companhia, ao pedir para o Bard fornecer argumentos que provem que a chegada do homem à Lua foi falsa, o usuário foi informado, por meio de uma série de tópicos, que seu comando não estava correto — e, portanto, não seria atendido.

O lançamento, em fevereiro deste ano, ocorreu em meio ao pico de acessos no ChatGPT, da OpenAI, em busca de retomar a concorrência em IA no setor conversacional. O Bard é alimentado pelo LaMDA (Language Model for Dialogue Applications), chatbot do Google que fez barulho no ano passado quando um engenheiro da companhia afirmou que o sistema tinha desenvolvido consciência, algo refutado tanto pela empresa quanto por especialistas.

Pesquisa

Para as pesquisas no buscador, a IA deve ser implementada para potencializar os resultados de forma mais personalizada para as perguntas dos usuários — o recurso foi chamado de “Search Generative Experience”. A barra de buscas permanece a mesma, mas será possível obter resultados em formato de tópicos e comentários “prontos”, diferente das imagens e links de redirecionamento que são mostrados atualmente no site.

Ao selecionar o botão “Ask a follow up”, a aba vai liberar uma barra de texto para conversar com a IA por um chat e personalizar ainda mais os resultados, semelhante ao que acontece no Bing, buscador equipado com o GPT-4, da OpenAI — e operado pela rival do Google, Microsoft.

O “Search Generative Experience” estará disponível no Google Labs nas próximas semanas. Aos usuários dos Estados Unidos, é possível entrar na lista de espera para testar as novidades a partir desta quarta.

Tradutor

No campo dos testes, o Google mostrou uma espécie de protótipo da ferramenta “Universal Translate”. O software é um algoritmo de dublagem automático que pode, rapidamente, identificar o idioma falado e traduzir para uma outra língua em forma de dublagem.

Publicidade

James Manyika apresentou os primeiros testes com a ferramenta de "dublagem" automática do Google  Foto: Josh Edelson/AFP

A intenção é tornar processos de tradução mais fáceis para produções audiovisuais. A ferramenta é capaz de identificar o som da voz, sotaques e línguas e criar um arquivo de áudio com o mesmo conteúdo, mas falado em outro idioma.

A partir disso, o arquivo de áudio — gerado com uma voz semelhante à do Google tradutor — é incorporado e sincronizado automaticamente com o vídeo original, terminando o processo de “dublagem” da produção.

De acordo com a empresa, a ferramenta é uma “tensão entre ousadia e segurança”. Isso porque a técnica pode ser utilizada para produzir as chamadas deep fakes, vídeos editados por IA que espalham desinformação. Em desenvolvimento, a IA precisa ainda ser certificada para que possa ser usada com segurança, e nos testes vai ser utilizada apenas por parceiros selecionados pela empresa.

“Este é um enorme avanço para a compreensão do aprendizado”, disse James Manyika, chefe do departamento de tecnologia e sociedade do Google. “Mas há uma tensão inerente aqui: parte da mesma tecnologia pode ser mal utilizada por pessoas mal-intencionadas. Em breve, estaremos integrando inovações em marca d’água em nossos modelos generativos mais recentes para também ajudar no desafio da desinformação”.

Comentários

Os comentários são exclusivos para assinantes do Estadão.