A Alibaba, empresa por trás do AliExpress e outras plataformas, apresentou a atualização “Wan2.2-S2V” do seu modelo de IA para transformar foto, texto e áudio em vídeo nesta quarta-feira (27). A ferramenta conta com um canal de testes gratuito e possui código aberto para qualquer desenvolvedor executá-la em seus dispositivos.
O lançamento é voltado para a plataforma de IA generativa da empresa chinesa, conhecida como Wan. Seu funcionamento é similar ao Veo 3 e Sora, alternativas do Google e OpenAI para editar conteúdo audiovisual com a tecnologia.
Em linhas gerais, o Wan permite que o usuário envie um áudio e foto junto a um comando de texto para transformar o conjunto em uma animação. Com o Wan2.2-S2V, a companhia reforça as capacidades do recurso, a fim de entregar edições melhores e mais eficientes.
–
Entre no Canal do WhatsApp do Canaltech e fique por dentro das últimas notícias sobre tecnologia, lançamentos, dicas e tutoriais incríveis.
–
A nova versão suporta vídeos de 480p e 720p, e é voltado para a “transformação” de áudios em vídeos.
O app Wan oferece outras opções de edição, como o mecanismo para transformar texto em conteúdo audiovisual.
Quais são os diferenciais do Wan2.2?
Segundo a companhia, a família Wan2.2 foca em quatro inovações, a começar pela arquitetura Mixture-of-Experts (MoE), que aumenta a capacidade do modelo sem disparar o uso de recursos computacionais para entregar os resultados. Além disso, o padrão de qualidade das entregas recebeu uma forte atenção:
“O Wan2.2 incorpora dados estéticos meticulosamente selecionados, completos com rótulos detalhados para iluminação, composição, contraste, tom de cor e muito mais. Isso permite uma geração de estilo cinematográfico mais precisa e controlável, facilitando a criação de vídeos com preferências estéticas personalizáveis”, afirma.
A geração atual possui ainda a capacidade para trabalhar com demandas mais complexas, graças ao treinamento com uma base de dados mais extensa, e mecanismos de compressão eficientes para garantir imagens mais definição sem necessariamente depender de recursos avançados para rodar.

Modelo aberto
Assim como outras soluções da companhia, como os modelos do chatbot Qwen, o Wan2.2 está disponível para qualquer pessoa usar.
No caso do app Wan, disponível em versão web (wan.video), os usuários contam com um plano gratuito para edições limitadas. Para aumentar o limite e obter créditos, é preciso optar por um pacote pago, que pode custar até US$ 26 por mês (cerca de R$ 140 em conversão direta).
Desenvolvedores e entusiastas, por sua vez, podem acessar o código da IA através dos repositórios hospedados no Hugging Face (huggingface.co) ou pelo GitHub (github.com) gratuitamente.
Confira outras matérias do Canaltech:
- DeepSeek, Qwen e mais: conheça 5 IAs chinesas
- Qual é a melhor IA em português? Teste avalia conhecimentos do Brasil
- Rival chinês do ChatGPT, DeepSeek lança IA ‘turbinada’ com resposta mais rápida
VÍDEO: Google PERDEU para a Apple na grande atualização do Android 16? Mudará a UI de TODOS os celulares?
Leia a matéria no Canaltech.