Siga nas redes
Só para assinantesAssine UOL
Reportagem

Google cria gerador de vídeos realistas com IA e promete chegada ao YouTube

A geração de vídeos realistas por inteligência artificial generativa a partir de comandos de textos não é mais exclusividade da Sora, da OpenAI, e de um punhado de companhias pequenas.

O Google entrou na jogada com o Veo nesta terça-feira (14). Para reforçar o lance, colocou a ferramenta na mão de criadores famosos, como o cinco vezes ganhador do Grammy Donald Glover, e prometeu levar o serviço ao YouTube, onde uma quantidade enorme de criadores poderá usá-la.

Divulgado durante o Google I/O, conferência em que a Big Tech mostra mudança sem seus produtos, o Veo é capaz de produzir vídeos:

  • com mais de um minuto;
  • com resolução de 1080p;
  • e compreender comandos como "timelapse" ou "imagens aéreas de uma paisagem";
  • que mostrem criar animais, pessoas e objetos se movendo de forma realista.

Antes do Google I/O, a coluna viu vídeos gerados por IA, que mostravam:

  • o timelapse de uma paisagem noturna e nevada em que uma aurora boreal cobria parte do céu;
  • um cachorro tomando banho em uma banheira com o focinho ensaboado de espuma, que caía conforme ele se mexia;
  • uma vizinhança tipicamente norte-americana, com casas de duas águas e gramados bem cortados com árvores;
  • uma corrida de carros que começa em uma cidade futurista cheia de cores e termina na rua de uma cidade dos dias atuais;
Diferentemente do Sora, que só chegará no decorrer do ano, o Veo já foi liberado. Mas apenas para criadores selecionados e dentro do VideoFX, uma ferramenta do Searc Labs, a iniciativa do Google para criar e testar novas experiências para a ferramenta de busca.
Quando foi anunciado, o Sora surpreendeu pelo grau de realismo de suas produções.
Segundo o Google, o Veo combina a capacidade de elaborar arquiteturas e elaborar imagens que respeitem leis de escala graças a modelos de IA desenvolvidos pela DeepMind e por empresas terceiras, como a Lumiere.
Continua após a publicidade

Outro modelo do Google já produzia vídeos curtos. Em abril deste ano, Imagen 2 ganhou a habilidade de fazer o mesmo que seus rivais Dall-E e Midjourney.

A ferramenta, lançada ainda em dezembro de 2022, ganha uma nova versão, a Imagem 3. O avanço de agora é produzir imagens ainda mais parecidas com a realidade a partir da compreensão de linguagem informal.

A Imagen 3 também foi liberada para criadores elecionados. Há uma lista de espera tanto para a Imagen 3 e para a Veo.

*o jornalista viajou a convite do Google

Reportagem

Texto que relata acontecimentos, baseado em fatos e dados observados ou verificados diretamente pelo jornalista ou obtidos pelo acesso a fontes jornalísticas reconhecidas e confiáveis.

Deixe seu comentário

Só para assinantes