Três tecnologias que vão transformar a forma como serão criadas e consumidas as imagens no futuro

É um caminho sem volta: as ferramentas de inteligência artificial estão cada vez mais presentes em nosso cotidiano. O que antes era restrito aos filmes e livros de ficção científica, hoje está acessível à palma de nossa mão. Por meio de comandos simples, é possível criar personagens, cenas e verdadeiros universos com o auxílio da tecnologia. A imagem de capa desse post, por exemplo, foi gerada por inteligência artificial.

Para quem lida com fotografia ou vídeo, não é diferente. Pelo contrário: é possível encontrar hoje em nossa área cada vez mais recursos, capazes de produzir imagens do zero, criar animações com locução e outros recursos técnicos, elaborar ambientes, fazer ajustes etc.

Neste artigo, separamos três ferramentas já disponíveis ou em desenvolvimento que podem ser utilizadas para a manipulação de vídeos e imagens. Algumas ainda estão em fase experimental, mas não é difícil imaginar que em curto prazo tudo se aprimore – servindo as mentes criativas com as melhores soluções digitais.

Afinal, se não é possível vencer a inteligência artificial, que façamos bom uso daquilo que ela pode nos oferecer.

3D MoMa

https://blogs.nvidia.com/blog/2022/06/21/inverse-rendering-3d-research-cvpr/

Sistema de inteligência artificial da empresa decodifica medidas, ângulos e componentes dos objetos

Apresentado em meados do ano passado, o 3D MoMa da NVIDIA cria objetos virtuais tridimensionais a partir de fotos ou vídeos. Ou seja, é possível gerar itens 3D a partir de imagens 2D.

A “leitura” das imagens bidimensionais é feita pelo sistema de inteligência artificial da empresa, que rapidamente decodifica as medidas, ângulos e componentes do objeto, criando um modelo em três dimensões passível de ser editado, ampliado, reduzido e importado por outros aplicativos.

Como exemplo, a empresa criou uma banda de jazz composta por uma série de instrumentos. Ela também exemplificou todo processo em um vídeo, que mostra como o 3D de cada item foi feito, de que maneira é possível editá-lo, como foi criada a movimentação das peças, entre outros recursos.

Esse tipo de tecnologia é essencial para o Metaverso, pois as empresas vão precisar de versões digitais de todos os seus produtos em 3D para serem visualizados no ambiente virtual.

A aplicação em e-commerces também é uma oportunidade, já que várias plataformas já permitem a visualização interativa dos produtos, desde sejam fornecidas imagens de todos os ângulos dos itens, ou um arquivo de objeto 3D.

Make-A-Video

https://makeavideo.studio/

Make-A-Video utiliza inteligência artificial para “traduzir” em vídeo o que foi elaborado em texto

Criado pela Meta, a mesma empresa que detém o Facebook, o Instagram, o WhatsApp e o futuro Metaverso, o Make-A-Video permite que o usuário crie vídeos curtos no formato GIF a partir de poucas palavras ou linhas de texto.

O sistema utiliza inteligência artificial para “traduzir” em vídeo o que foi elaborado em texto. Na prática, basta digitar um texto curto descritivo que, em poucos segundos, é gerada uma animação em vídeo com as características citadas.

No site da iniciativa, é possível conferir como todo processo é feito e ter acesso a alguns exemplos de como os textos são traduzidos e transformados em imagens – todas elas com “jeitão” de meme.

É simples imaginar que em pouco tempo a ferramenta pode evoluir a ponto de ser simples inserir produtos em cenas, ou criar conteúdo complexo sem muitas dificuldades.

O Make-A-Video abre o leque para que a criatividade prevaleça, tornando o acesso possível mesmo para usuários sem conhecimento técnico para produção de imagens.
Recentemente a OpenAI, empresa de inteligência artificial criadora do ChatGPT (gerador de textos) e do Dall-E (gerador de imagens), também anunciou que está trabalhando em um gerador de vídeos nos mesmos moldes.

Creative Reality Studio

https://www.d-id.com/speaking-portrait/

Ferramenta de IA permite que se crie uma avatar humano hiper-realístico a partir de predefinições

Desenvolvido pela D-ID, essa ferramenta de inteligência artificial permite que se crie um avatar humano hiper-realístico com características pré-definidas ou a partir do upload de uma foto, capaz de pronunciar frases e concatená-las em um discurso. 

Assim como no app da Meta, o roteiro é descrito por texto. Em segundos, uma pessoa digital é criada e está pronta para “falar”, em mais de 100 línguas diferentes.

Além de animar imagens realistas, o software também trabalha com desenhos, ilustrações e fotografias manipuladas. O produto final é um vídeo e o limite é a criatividade do usuário, que pode utilizar a criação como um apresentador virtual, por exemplo.

O resultado é impressionante e faz considerar que, em breve, marcas poderão trabalhar modelos digitais ideais para cada ação, que apresentem produtos e interajam com clientes.

Criatividade e visão de negócio

É preciso destacar um ponto importante: fazer uso da inteligência artificial não é justificativa para abrir mão da criatividade, do raciocínio lógico e do uso funcional que se quer alcançar com determinada ferramenta.

Sem se respeitar essas exigências, corre-se o risco de se criar uma imagem vazia, sem contexto ou utilidade prática. Ela será apenas mais uma na infinidade de outras mais criadas e disponibilizadas a todo segundo na internet.

Por trás do computador, deve sempre haver uma cabeça pensante e um coração pulsante.

Contato

Aqui em nosso blog você encontra outras dicas e soluções para quem lida com o dia a dia das fotos comerciais. Ficou alguma dúvida ou deseja saber mais sobre a Snapcomm? Entre em contato.