Sistema de inteligência artificial avança na análise de imagens em movimento


Identificação de cenas em movimento pode tornar realidade tecnologias em desenvolvimento, como robôs domésticos e carros autônomos

Por Matheus Mans
Com o avanço do reconhecimento de imagens, robôs ganharão visão tridimensional apurada e terão capacidade de conviver com os humanos Foto: REUTERS/Michael Buholzer

No futuro não tão distante, você tira uma soneca no carro enquanto o sistema de inteligência artificial comanda a direção. Ao chegar em casa, nada de chaves: a fechadura reconhece seu rosto e libera a entrada, enquanto o robô se prepara para servir café. Soa distante, mas são tecnologias que devem estar disponíveis nos próximos anos. Isso tudo será possível graças aos avanços dos sistemas de inteligência artificial na tarefa de reconhecer imagens, uma das principais fronteiras que pesquisadores e grandes empresas de tecnologia estão tentando superar ao investir muito tempo e dinheiro.

Os sistemas de inteligência artificial especializados na análise e compreensão de imagens funcionam como outros algoritmos do gênero, como de texto e programação. Basta inserir toneladas de conteúdo para o sistema reconhecer padrões e repetições – no caso de imagens, fotos de vários assuntos. Isso permite que o sistema de inteligência artificial compreenda melhor do que a imagem trata e realize atividades como organizar coleções e facilitar buscas por fotografias.

continua após a publicidade

“Esses sistemas são alimentados com imagens para reconhecer objetos, pessoas e ambientes em diversas situações”, explica Claudio Jung, especialista em reconhecimento de imagens e professor de ciência da computação da Universidade Federal do Rio Grande do Sul. “Essa tecnologia começou a avançar em 2010 e não parou mais.”

Já é possível ver diversas aplicações práticas dos sistemas de inteligência artificial especializados em imagens. Um dos exemplos é o aplicativo de gestão de fotos do Google, que permite organizar imagens de acordo com as pessoas que aparecem nelas, com o ambiente onde foram tiradas e, até mesmo, cria animações e vídeos com conteúdos armazenados no smartphone.

“Reconhecimento de fotos avançou tanto que estamos em taxas de quase 100% de acerto na identificação”, diz o professor do Instituto de Ciências Matemáticas e de Computação da Universidade de São Paulo em São Carlos Fernando Osório. “Alguns sistemas já são superiores à capacidade do ser humano.”

continua após a publicidade

Passos. Apesar dos grandes avanços em relação ao reconhecimento de imagens estáticas, ainda há muito a ser feito em relação aos sistemas que analisam vídeos e cenas em três dimensões. “A técnica é a mesma para analisar fotos, mas é preciso uma velocidade muito maior”, diz o especialista da IBM no sistema de inteligência cognitiva Watson, Guilherme Novaes. “Precisamos alimentar o sistema com imagens tridimensionais e ensinar as máquinas a entenderem profundidade.”

Já existem sistemas que fazem análises de vídeos, por exemplo, que conseguem compreender cenas de um programa de TV. No entanto, as análises são limitadas. Segundo especialistas consultados pelo Estado, o avanço desses sistemas vai ditar o ritmo da inovação no mundo e determinar quais tecnologias se tornarão realidade.

“Quando o reconhecimento de imagens tridimensionais avançar, várias tecnologias darão saltos significativos”, diz Osório. “Robôs poderão substituir tarefas simples, pois vão passar a enxergar com profundidade. Carros autônomos terão sistemas mais apurados e o reconhecimento facial será usado em larga escala. Veremos coisas que o olho humano não tem capacidade de enxergar.”

continua após a publicidade

Os sistemas de inteligência artificial também são a grande esperança de sites e aplicativos que permitem compartilhamento de fotos e vídeos, muitas vezes ao vivo. Nos últimos meses, redes como Facebook e Instagram têm enfrentado dificuldades para frear conteúdos, como vídeos que mostram assassinatos e abuso sexual. Esses conteúdos são geralmente retirados usando uma combinação de algoritmos, ainda imprecisos, e curadoria de pessoas.

Nos próximos anos, com o salto na inteligência artificial, os sistemas serão capazes de identificar os elementos de uma imagem e entender o contexto da situação. Isso vai acelerar a retirada de conteúdos impróprios do ar. “Com o avanço da tecnologia, a rede social poderá acionar rapidamente entidades responsáveis e evitar que o crime ocorra”, afirma Jung, da UFRGS.

Instituições de proteção aos dados, porém, ressaltam que é preciso tomar cuidado. “Ao retirar o vídeo do ar, a rede social estará censurando conteúdo”, avalia o diretor executivo do Instituto de Tecnologia e Sociedade do Rio de Janeiro (ITS-Rio), Fabro Steibel. 

continua após a publicidade

Auge. Para especialistas, os sistemas de inteligência artificial estão próximos a dar esse salto. “Daqui a três anos, a imagem vai ser parte da nossa vida”, afirma Novaes, da IBM. “Será normal fotografar um sofá em uma loja, enquanto o sistema avalia se aquele móvel tem a ver com a decoração da casa.”

Jung, da UFRGS, não arrisca indicar uma data para a maturidade da tecnologia, mas aposta que sistemas como esse vão determinar o futuro. “A inteligência artificial vai quebrar mais paradigmas quando compreender imagens, pois todas as profissões que usam a visão para alguma coisa serão afetadas”, diz. “Se pudesse voltar no tempo, me especializaria em criar esse tipo de sistemas.”

Com o avanço do reconhecimento de imagens, robôs ganharão visão tridimensional apurada e terão capacidade de conviver com os humanos Foto: REUTERS/Michael Buholzer

No futuro não tão distante, você tira uma soneca no carro enquanto o sistema de inteligência artificial comanda a direção. Ao chegar em casa, nada de chaves: a fechadura reconhece seu rosto e libera a entrada, enquanto o robô se prepara para servir café. Soa distante, mas são tecnologias que devem estar disponíveis nos próximos anos. Isso tudo será possível graças aos avanços dos sistemas de inteligência artificial na tarefa de reconhecer imagens, uma das principais fronteiras que pesquisadores e grandes empresas de tecnologia estão tentando superar ao investir muito tempo e dinheiro.

Os sistemas de inteligência artificial especializados na análise e compreensão de imagens funcionam como outros algoritmos do gênero, como de texto e programação. Basta inserir toneladas de conteúdo para o sistema reconhecer padrões e repetições – no caso de imagens, fotos de vários assuntos. Isso permite que o sistema de inteligência artificial compreenda melhor do que a imagem trata e realize atividades como organizar coleções e facilitar buscas por fotografias.

“Esses sistemas são alimentados com imagens para reconhecer objetos, pessoas e ambientes em diversas situações”, explica Claudio Jung, especialista em reconhecimento de imagens e professor de ciência da computação da Universidade Federal do Rio Grande do Sul. “Essa tecnologia começou a avançar em 2010 e não parou mais.”

Já é possível ver diversas aplicações práticas dos sistemas de inteligência artificial especializados em imagens. Um dos exemplos é o aplicativo de gestão de fotos do Google, que permite organizar imagens de acordo com as pessoas que aparecem nelas, com o ambiente onde foram tiradas e, até mesmo, cria animações e vídeos com conteúdos armazenados no smartphone.

“Reconhecimento de fotos avançou tanto que estamos em taxas de quase 100% de acerto na identificação”, diz o professor do Instituto de Ciências Matemáticas e de Computação da Universidade de São Paulo em São Carlos Fernando Osório. “Alguns sistemas já são superiores à capacidade do ser humano.”

Passos. Apesar dos grandes avanços em relação ao reconhecimento de imagens estáticas, ainda há muito a ser feito em relação aos sistemas que analisam vídeos e cenas em três dimensões. “A técnica é a mesma para analisar fotos, mas é preciso uma velocidade muito maior”, diz o especialista da IBM no sistema de inteligência cognitiva Watson, Guilherme Novaes. “Precisamos alimentar o sistema com imagens tridimensionais e ensinar as máquinas a entenderem profundidade.”

Já existem sistemas que fazem análises de vídeos, por exemplo, que conseguem compreender cenas de um programa de TV. No entanto, as análises são limitadas. Segundo especialistas consultados pelo Estado, o avanço desses sistemas vai ditar o ritmo da inovação no mundo e determinar quais tecnologias se tornarão realidade.

“Quando o reconhecimento de imagens tridimensionais avançar, várias tecnologias darão saltos significativos”, diz Osório. “Robôs poderão substituir tarefas simples, pois vão passar a enxergar com profundidade. Carros autônomos terão sistemas mais apurados e o reconhecimento facial será usado em larga escala. Veremos coisas que o olho humano não tem capacidade de enxergar.”

Os sistemas de inteligência artificial também são a grande esperança de sites e aplicativos que permitem compartilhamento de fotos e vídeos, muitas vezes ao vivo. Nos últimos meses, redes como Facebook e Instagram têm enfrentado dificuldades para frear conteúdos, como vídeos que mostram assassinatos e abuso sexual. Esses conteúdos são geralmente retirados usando uma combinação de algoritmos, ainda imprecisos, e curadoria de pessoas.

Nos próximos anos, com o salto na inteligência artificial, os sistemas serão capazes de identificar os elementos de uma imagem e entender o contexto da situação. Isso vai acelerar a retirada de conteúdos impróprios do ar. “Com o avanço da tecnologia, a rede social poderá acionar rapidamente entidades responsáveis e evitar que o crime ocorra”, afirma Jung, da UFRGS.

Instituições de proteção aos dados, porém, ressaltam que é preciso tomar cuidado. “Ao retirar o vídeo do ar, a rede social estará censurando conteúdo”, avalia o diretor executivo do Instituto de Tecnologia e Sociedade do Rio de Janeiro (ITS-Rio), Fabro Steibel. 

Auge. Para especialistas, os sistemas de inteligência artificial estão próximos a dar esse salto. “Daqui a três anos, a imagem vai ser parte da nossa vida”, afirma Novaes, da IBM. “Será normal fotografar um sofá em uma loja, enquanto o sistema avalia se aquele móvel tem a ver com a decoração da casa.”

Jung, da UFRGS, não arrisca indicar uma data para a maturidade da tecnologia, mas aposta que sistemas como esse vão determinar o futuro. “A inteligência artificial vai quebrar mais paradigmas quando compreender imagens, pois todas as profissões que usam a visão para alguma coisa serão afetadas”, diz. “Se pudesse voltar no tempo, me especializaria em criar esse tipo de sistemas.”

Com o avanço do reconhecimento de imagens, robôs ganharão visão tridimensional apurada e terão capacidade de conviver com os humanos Foto: REUTERS/Michael Buholzer

No futuro não tão distante, você tira uma soneca no carro enquanto o sistema de inteligência artificial comanda a direção. Ao chegar em casa, nada de chaves: a fechadura reconhece seu rosto e libera a entrada, enquanto o robô se prepara para servir café. Soa distante, mas são tecnologias que devem estar disponíveis nos próximos anos. Isso tudo será possível graças aos avanços dos sistemas de inteligência artificial na tarefa de reconhecer imagens, uma das principais fronteiras que pesquisadores e grandes empresas de tecnologia estão tentando superar ao investir muito tempo e dinheiro.

Os sistemas de inteligência artificial especializados na análise e compreensão de imagens funcionam como outros algoritmos do gênero, como de texto e programação. Basta inserir toneladas de conteúdo para o sistema reconhecer padrões e repetições – no caso de imagens, fotos de vários assuntos. Isso permite que o sistema de inteligência artificial compreenda melhor do que a imagem trata e realize atividades como organizar coleções e facilitar buscas por fotografias.

“Esses sistemas são alimentados com imagens para reconhecer objetos, pessoas e ambientes em diversas situações”, explica Claudio Jung, especialista em reconhecimento de imagens e professor de ciência da computação da Universidade Federal do Rio Grande do Sul. “Essa tecnologia começou a avançar em 2010 e não parou mais.”

Já é possível ver diversas aplicações práticas dos sistemas de inteligência artificial especializados em imagens. Um dos exemplos é o aplicativo de gestão de fotos do Google, que permite organizar imagens de acordo com as pessoas que aparecem nelas, com o ambiente onde foram tiradas e, até mesmo, cria animações e vídeos com conteúdos armazenados no smartphone.

“Reconhecimento de fotos avançou tanto que estamos em taxas de quase 100% de acerto na identificação”, diz o professor do Instituto de Ciências Matemáticas e de Computação da Universidade de São Paulo em São Carlos Fernando Osório. “Alguns sistemas já são superiores à capacidade do ser humano.”

Passos. Apesar dos grandes avanços em relação ao reconhecimento de imagens estáticas, ainda há muito a ser feito em relação aos sistemas que analisam vídeos e cenas em três dimensões. “A técnica é a mesma para analisar fotos, mas é preciso uma velocidade muito maior”, diz o especialista da IBM no sistema de inteligência cognitiva Watson, Guilherme Novaes. “Precisamos alimentar o sistema com imagens tridimensionais e ensinar as máquinas a entenderem profundidade.”

Já existem sistemas que fazem análises de vídeos, por exemplo, que conseguem compreender cenas de um programa de TV. No entanto, as análises são limitadas. Segundo especialistas consultados pelo Estado, o avanço desses sistemas vai ditar o ritmo da inovação no mundo e determinar quais tecnologias se tornarão realidade.

“Quando o reconhecimento de imagens tridimensionais avançar, várias tecnologias darão saltos significativos”, diz Osório. “Robôs poderão substituir tarefas simples, pois vão passar a enxergar com profundidade. Carros autônomos terão sistemas mais apurados e o reconhecimento facial será usado em larga escala. Veremos coisas que o olho humano não tem capacidade de enxergar.”

Os sistemas de inteligência artificial também são a grande esperança de sites e aplicativos que permitem compartilhamento de fotos e vídeos, muitas vezes ao vivo. Nos últimos meses, redes como Facebook e Instagram têm enfrentado dificuldades para frear conteúdos, como vídeos que mostram assassinatos e abuso sexual. Esses conteúdos são geralmente retirados usando uma combinação de algoritmos, ainda imprecisos, e curadoria de pessoas.

Nos próximos anos, com o salto na inteligência artificial, os sistemas serão capazes de identificar os elementos de uma imagem e entender o contexto da situação. Isso vai acelerar a retirada de conteúdos impróprios do ar. “Com o avanço da tecnologia, a rede social poderá acionar rapidamente entidades responsáveis e evitar que o crime ocorra”, afirma Jung, da UFRGS.

Instituições de proteção aos dados, porém, ressaltam que é preciso tomar cuidado. “Ao retirar o vídeo do ar, a rede social estará censurando conteúdo”, avalia o diretor executivo do Instituto de Tecnologia e Sociedade do Rio de Janeiro (ITS-Rio), Fabro Steibel. 

Auge. Para especialistas, os sistemas de inteligência artificial estão próximos a dar esse salto. “Daqui a três anos, a imagem vai ser parte da nossa vida”, afirma Novaes, da IBM. “Será normal fotografar um sofá em uma loja, enquanto o sistema avalia se aquele móvel tem a ver com a decoração da casa.”

Jung, da UFRGS, não arrisca indicar uma data para a maturidade da tecnologia, mas aposta que sistemas como esse vão determinar o futuro. “A inteligência artificial vai quebrar mais paradigmas quando compreender imagens, pois todas as profissões que usam a visão para alguma coisa serão afetadas”, diz. “Se pudesse voltar no tempo, me especializaria em criar esse tipo de sistemas.”

Atualizamos nossa política de cookies

Ao utilizar nossos serviços, você aceita a política de monitoramento de cookies.