Nova IA chinesa transforma fotos em vídeos e está aberta para qualquer um usar

Tecnologia

A Alibaba, empresa por trás do AliExpress e outras plataformas, apresentou a atualização “Wan2.2-S2V” do seu modelo de IA para transformar foto, texto e áudio em vídeo nesta quarta-feira (27). A ferramenta conta com um canal de testes gratuito e possui código aberto para qualquer desenvolvedor executá-la em seus dispositivos.

O lançamento é voltado para a plataforma de IA generativa da empresa chinesa, conhecida como Wan. Seu funcionamento é similar ao Veo 3 e Sora, alternativas do Google e OpenAI para editar conteúdo audiovisual com a tecnologia.

Em linhas gerais, o Wan permite que o usuário envie um áudio e foto junto a um comando de texto para transformar o conjunto em uma animação. Com o Wan2.2-S2V, a companhia reforça as capacidades do recurso, a fim de entregar edições melhores e mais eficientes.


Entre no Canal do WhatsApp do Canaltech e fique por dentro das últimas notícias sobre tecnologia, lançamentos, dicas e tutoriais incríveis.

A nova versão suporta vídeos de 480p e 720p, e é voltado para a “transformação” de áudios em vídeos.

O app Wan oferece outras opções de edição, como o mecanismo para transformar texto em conteúdo audiovisual.

Quais são os diferenciais do Wan2.2?

Segundo a companhia, a família Wan2.2 foca em quatro inovações, a começar pela arquitetura Mixture-of-Experts (MoE), que aumenta a capacidade do modelo sem disparar o uso de recursos computacionais para entregar os resultados. Além disso, o padrão de qualidade das entregas recebeu uma forte atenção:

“O Wan2.2 incorpora dados estéticos meticulosamente selecionados, completos com rótulos detalhados para iluminação, composição, contraste, tom de cor e muito mais. Isso permite uma geração de estilo cinematográfico mais precisa e controlável, facilitando a criação de vídeos com preferências estéticas personalizáveis”, afirma.

A geração atual possui ainda a capacidade para trabalhar com demandas mais complexas, graças ao treinamento com uma base de dados mais extensa, e mecanismos de compressão eficientes para garantir imagens mais definição sem necessariamente depender de recursos avançados para rodar.

Wan oferece uma série de opções para editar e criar vídeos com IA (Imagem: Captura de tela/Bruno De Blasi/Canaltech)
Wan oferece uma série de opções para editar e criar vídeos com IA (Imagem: Captura de tela/Bruno De Blasi/Canaltech)

Modelo aberto

Assim como outras soluções da companhia, como os modelos do chatbot Qwen, o Wan2.2 está disponível para qualquer pessoa usar.

No caso do app Wan, disponível em versão web (wan.video), os usuários contam com um plano gratuito para edições limitadas. Para aumentar o limite e obter créditos, é preciso optar por um pacote pago, que pode custar até US$ 26 por mês (cerca de R$ 140 em conversão direta).

Desenvolvedores e entusiastas, por sua vez, podem acessar o código da IA através dos repositórios hospedados no Hugging Face (huggingface.co) ou pelo GitHub (github.com) gratuitamente.

Confira outras matérias do Canaltech:

VÍDEO: Google PERDEU para a Apple na grande atualização do Android 16? Mudará a UI de TODOS os celulares? 

Leia a matéria no Canaltech.