māchine

China’s Wan gooit olie op het vuur in de AI-videorace

Ook China doet met Wan mee in de race. Het model van Alibaba’s Tongyi Lab schuift met elke nieuwe versie de lat hoger. Waar eerdere tools vooral losse beelden leverden, laat Wan stilstaande foto’s bewegen, complete scènes ontstaan en zelfs de regie over camerahoeken en lichtvoering over aan de gebruiker. Wat ooit een nichetool leek, ontwikkelt zich razendsnel tot een van de belangrijkste spelers in de nieuwe generatie videomodellen.

Van Tongyi Lab naar de wereld

Wan komt uit de koker van Tongyi Lab, het AI-onderzoekscentrum van Alibaba. Dit lab is onderdeel van Alibaba Cloud en richt zich volledig op generatieve modellen. Hun naam werd bekend met Tongyi Qianwen, een Chinees alternatief voor ChatGPT, maar de focus ligt breder: taal, beeld, audio en nu ook video. Dankzij de enorme infrastructuur van Alibaba kan Tongyi Lab modellen trainen die niet alleen academisch interessant zijn, maar ook direct inzetbaar voor makers en bedrijven.

Wat Wan kan

Wan 2.5 bouwt voort op de basis van 2.2, maar levert nog meer detail, langere videoclips en stabielere bewegingen. Het model kan niet alleen een stilstaande foto laten bewegen alsof het een videofragment is, maar ook meerdere scènes achter elkaar genereren met consistente karakters en omgevingen. Het begrijpt licht, camerahoeken en lensstijlen beter dan ooit, waardoor het resultaat dichter in de buurt komt van professionele filmproductie. Makers gebruiken het inmiddels om avatars te laten bewegen, oude foto’s tot leven te wekken en zelfs korte verhalen in videovorm te vertellen.

https://www.youtube.com/shorts/-DquI3QqAuA?feature=share

Zelf proberen

Je uploadt een foto van jezelf, kiest een referentievideo waarin iemand glimlacht of zijn hoofd draait, en binnen een minuut knik jij terug naar de camera. Het voelt bizar — alsof je even met jezelf praat. Met extra tekst kun je de sfeer, belichting en camerabewegingen aansturen, alsof je regisseur bent van je eigen mini-clip. De drempel om te experimenteren is extreem laag, en dat is precies wat deze technologie zo krachtig maakt.

Wat Wan onderscheidt van Veo en Sora

In vergelijking met Google’s Veo en OpenAI’s Sora neemt Wan een andere positie in. Veo schittert op filmfestivals, Sora duikt op in reclamebureaus — maar Wan rolt de technologie de straat op. Waar OpenAI en Google nog voorzichtig blijven met toegang, laat Alibaba makers gewoon losgaan.

Wan draait relatief licht, is deels open beschikbaar en combineert tekst, beeld en beweging op een manier die sneller en toegankelijker voelt. Waar Veo en Sora vooral pronken met high-end resultaten die moeilijk bereikbaar zijn voor gewone makers, lijkt Wan gericht op een bredere groep gebruikers die experimenteren of snel content willen produceren.

De keerzijde van realisme

Wat deze technologie spectaculair maakt, maakt haar ook riskant. Dezelfde animaties die creativiteit stimuleren, kunnen net zo makkelijk worden ingezet om mensen dingen te laten doen of zeggen die nooit zijn gebeurd. Deepfakes, oplichting, nepnieuws, Wan 2.5 laat zien dat realisme geen doel meer is, maar een gegeven.