māchine

Midjourney bouwt aan een nieuwe realiteit, plaatjes waren pas het begin

Wat als je niet alleen een plaatje kon maken, maar een wereld kon oproepen waarin alles leeft, reageert en zich aanpast aan jou? Midjourney werkt aan technologie die dat mogelijk maakt en het gaat sneller dan je denkt.

Midjourney ken je waarschijnlijk wel. Het was de eerste AI image generator die echt indruk maakte met zijn artistieke stijl, rijke details en dramatische belichting. Waar veel andere modellen rauwe technische output gaven, voelde Midjourney bijna als een digitale kunstenaar.

Het bedrijf werd opgericht in 2022 door David Holz, een voormalige medeoprichter van Leap Motion. Dat bedrijf werd bekend met technologie voor hand- en vingertracking zonder controllers. Met een klein apparaatje kon je digitale objecten besturen met gebaren, wat het populair maakte in de wereld van virtual reality.

En juist die focus op VR blijkt nu een voorbode te zijn van waar Midjourney uiteindelijk naartoe wil. Sinds de oprichting is het platform uitgegroeid tot een van de meest gebruikte generatieve AI tools ter wereld en hun ambitie gaat veel verder dan het genereren van plaatjes.

Wat Midjourney van plan is, klinkt als iets uit The Matrix. Niet alleen plaatjes genereren, maar complete virtuele werelden die reageren op jouw input. Een plek waarin je kunt rondlopen, objecten kunt aanraken en karakters ontmoet die terugpraten. Niet bedacht door een team van game developers, maar gegenereerd door AI op basis van een paar regels door jou ingevoerde tekst.

Dus misschien wordt je binnenkort elke ochtend wakker in een wereld in een Romeins rijk met vliegende dino's. Of een sci-fi versie van The Office waarin jij met Dwight Schrute dikke bieten gaat rooien op Mars. Of een eindeloos droomlandschap dat meebeweegt met je humeur. Je kunt een virtuele galerie maken, naar een concert gaan van een artiest die in het echt niet bestaat. Alles wat je bedenkt, bestaat op het moment dat jij het wil. De mogelijkheden zijn eindeloos en ze worden gegenereerd terwijl jij erdoorheen loopt. Denk daar maar eens over na.

Hoe werkt een AI wereld technisch gezien?

Om virtuele werelden te kunnen genereren die reageren op jouw input, werkt Midjourney aan vier belangrijke bouwstenen: beelden (hun bestaande kracht), beweging (zoals de nieuwe Image to Video functie), ruimtelijkheid (3D modellen waarmee je kunt navigeren) en snelheid (alles moet in realtime draaien). De komende twaalf maanden worden deze onderdelen los van elkaar ontwikkeld, getest en uitgebracht. Daarna wil Midjourney ze samenvoegen tot één systeem. Dat kan in eerste instantie duur zijn, maar volgens het team wordt het sneller dan je denkt voor iedereen toegankelijk.

Want de techniek om dit mogelijk te maken bestaat deels al. Een goed voorbeeld is de recente Zorah demo van NVIDIA, waarin een indrukwekkende virtuele wereld wordt getoond met realtime neural rendering. Dat komt erop neer dat de wereld nog gebouwd is in een traditionele game engine (zoals Unreal), maar met een AI-laag erbovenop. AI voorspelt bijvoorbeeld hoe licht zich zou moeten gedragen, waar reflecties horen te verschijnen en hoe materialen reageren op beweging of camerahoeken.

https://www.youtube.com/watch?v=ZtTtUyqGs-o

Een hybride vorm, deels handgemaakt, deels realtime gegenereerd door AI, wordt dus nu al toegepast in games. Midjourney wil een stap verder gaan. Zij willen een systeem waarbij de hele wereld, van omgevingen tot objecten, van personages tot interactie, volledig gegenereerd wordt.

Overigens is Midjourney niet de enige met deze ambitie. Ook Runway werkt aan een "multimodale wereldsimulator" die beelden, video, audio en interactie samenbrengt.

Wat dit allemaal te betekenen heeft

De impact hiervan lijkt voor de hand liggend. AI gegenereerde werelden kunnen gameontwikkeling drastisch versnellen, film en animatieproductie fundamenteel veranderen en creatie toegankelijk maken voor mensen zonder technische kennis.

Maar er zijn ook risico’s. Experts waarschuwen voor het verlies van creatieve banen, ethische problemen rond copyright en de verspreiding van deepfakes. Volgens Wired voelen sommige 3D artists zich nu al gedegradeerd tot "opruimploeg" van AI output.

En wat gebeurt er met ons als we op elk moment kunnen ontsnappen naar een wereld die precies is zoals wij het willen? Als we verdriet, verveling of onzekerheid kunnen vervangen door een zelfgemaakte fantasie, wat doet dat dan met onze motivatie, ons zelfbeeld of onze relaties in de echte wereld? De grens tussen escapisme en zelfregie vervaagt en het wordt belangrijker dan ooit om na te denken over wie er aan het stuur zit in deze nieuwe werkelijkheid. Klinkt toch aardig als een dystopie.

Toch zijn er ook positieve geluiden. Als AI tools zoals deze goed worden ingezet, met de mens in de hoofdrol, kunnen ze juist meer mensen toegang geven tot creatie dan ooit tevoren en bovendien kan het ook therapeutisch worden ingezet.

Uit een review van negen wetenschappelijke studies blijkt dat Virtual Reality veelbelovend is als aanvullende therapie bij stress, angst en depressie. In zeven van de negen studies werd stress verminderd en ook stemmingsverbetering, ontspanning en betere slaap kwamen naar voren.

Nu ff serieus: hoe ver zijn we nog van deze techniek verwijderd?

Kijk je nuchter naar de huidige stand van zaken, dan lijkt het onwaarschijnlijk dat we binnen één jaar al echt volledig gegenereerde, interactieve AI-werelden hebben zoals Midjourney ze schetst. De losse bouwstenen bestaan: beeldgeneratie ontwikkelt zich razendsnel, en 3D-navigatie met AI-hulp is volop in ontwikkeling. Maar het samenvoegen van al deze componenten tot één naadloos, realtime werkend systeem is technisch extreem complex en vergt enorme rekenkracht, infrastructuur en optimalisatie.

Een volwaardige wereldsimulator komt dus niet morgen en ook niet over jaar (zoals Midjourney zelf zegt) maar mogelijk wel binnen vijf tot tien jaar in zicht. En dan nog zullen de eerste versies beperkt zijn, maar het fundament wordt gelegd. Net als bij de opkomst van het internet of smartphones geldt: de eerste versies zijn rommelig, maar als het eenmaal werkt, verandert het alles. What a time to be alive.