Recentemente, a Google surpreendeu o mundo tecnológico com o anúncio do VideoPoet, uma ferramenta de inteligência artificial (IA) revolucionária capaz de transformar textos em vídeos animados. Esta novidade marca um avanço significativo no campo da inteligência artificial, desafiando as limitações de modelos anteriores focados apenas em textos ou imagens.
O VideoPoet, muito diferente de outras ferramentas conhecidas como o Midjourney e o DALL-E 3, não se limita a criar apenas imagens estáticas. Este modelo experimental da Google consegue gerar conteúdo de vídeo a partir de prompts de texto. Por exemplo, se descreveres uma cena fictícia como “Um gato robô a comer esparguete”, o VideoPoet pode criar um vídeo correspondente em segundos.
Esta capacidade de edição e criação de vídeos surge como um grande avanço, especialmente ao considerar a habilidade do VideoPoet em gerar cenas com movimento significativo, ultrapassando os modelos anteriores que se limitavam a movimentos subtis.
O funcionamento por trás da magia
A magia do VideoPoet reside na sua base técnica. Ao contrário de outros modelos que geram imagens a partir de ruído aleatório, o VideoPoet utiliza um modelo de linguagem avançado. Este modelo não apenas prevê palavras e frases, mas também segmentos de vídeo e áudio, expandindo significativamente o intuito da geração de conteúdo IA.
Para alcançar esta capacidade, o VideoPoet passou por um processo de pré-treino intensivo. A Google utilizou mais de mil milhões de pares de imagens e textos e 270 milhões de amostras de vídeo públicas para treinar o modelo, permitindo que ele preveja tokens de vídeo com a mesma eficácia que tokens de texto em modelos de linguagem tradicionais.
Diferenciação no mercado de IA
Enquanto outras empresas, como a Meta com o seu projeto Make-A-Video, também exploraram a criação de vídeos IA, o VideoPoet destaca-se pela sua habilidade em lidar com movimentos mais complexos e criar vídeos mais longos. Apesar de estar limitado a vídeos iniciais de dois segundos, ele consegue manter o contexto durante até dez segundos — um feito impressionante considerando as rápidas mudanças que podem ocorrer numa cena.
Google mantém o VideoPoet fora do alcance dos utilizadores
Apesar de todo o potencial demonstrado pelo VideoPoet, a Google ainda não anunciou uma data para o lançamento público desta ferramenta. Dado o custo computacional associado à geração de imagens e vídeos IA, é possível que, inicialmente, o acesso ao VideoPoet seja limitado ou sujeito a uma subscrição, seguindo o exemplo de outras ferramentas IA no mercado.
Enquanto aguardamos mais informações da Google sobre a disponibilidade do VideoPoet, este desenvolvimento representa um salto significativo no campo da inteligência artificial, prometendo abrir novas possibilidades na criação de conteúdo digital.
Outros artigos interessantes: