AI agents beloven veel, maar leveren nog weinig
AI agents die écht werk van je overnemen. Het lijkt alsof we er elke maand bijna zijn, maar dat gaat dus al maanden zo. Kan het eigenlijk wel?

Een persoonlijke assistent die al je regelwerk uit handen neemt. Jij bent Tony Stark, de AI je eigen J.A.R.V.I.S. Hij begrijpt wat je nodig hebt, voert het uit en doet er soms zelfs een schepje bovenop. Zonder gedoe met allerlei apps, zodat jij tijd overhoudt om de wereld te redden. Of gewoon je eigen leven eindelijk eens beter te organiseren.
AI agents zijn dus slimme systemen die zelfstandig taken uitvoeren. Je communiceert ermee zoals je dat zou doen met een chatbot: je typt of zegt wat je wil en de agent voert het vervolgens daadwerkelijk uit. Hij opent browservensters, vult formulieren in, stuurt e-mails, verwerkt documenten of plant afspraken. Vaak zie je op de achtergrond hoe hij stap voor stap werkt, soms in een soort checklist die hij afvinkt. En bij gevoelige acties zoals betalingen of bijvoorbeeld het versturen van een contract naar een klant, vraagt hij eerst om je goedkeuring.
Concreet voorbeeld: "Maak een verslag van mijn vergadering, mail het naar collega's en plan de vervolgafspraak voor volgende week." Bam! regelt 'ie voor je.
Of: “Ik wil op vakantie naar Portugal, tussen 15 en 22 augustus, liefst een beetje luxe.”
Je agent vergelijkt opties, checkt reviews, boekt hotels en tickets en zet het allemaal in je agenda.
Dat is wat je ooit hoopte toen je Siri voor het eerst gebruikte. Een assistent die écht dingen voor je regelt.
Waarom werkt het tot nu toe nog niet?
Klinkt allemaal mooi. Toch wordt de belofte al maanden (of eigenlijk jaren), niet ingelost. Uit een paper van TheAgentCompany, gepubliceerd op 19 mei 2025, blijkt dat AI-agenten in staat zijn om een deel van de dagelijkse kantoortaken zelfstandig uit te voeren, maar ook dat ze nog vaak de mist in gaan. Een foutje in een spreadsheet of een verkeerd geïnterpreteerde opdracht kan grote gevolgen hebben. Denk aan een decimaal op de verkeerde plek in een offerte, waardoor een bedrag tienduizenden euro’s te hoog of te laag uitvalt. Of een opdracht als ‘verzet de afspraak’ die wordt opgevat als ‘annuleer de afspraak’, waardoor een belangrijke klantafspraak helemaal verdwijnt. Zulke fouten lijken klein, maar de impact op vertrouwen en bedrijfsvoering kan groot zijn. De benchmark maakt dat pijnlijk duidelijk. Hoewel simpele taken vaak nog wel lukken, struikelen AI-agenten juist over praktische details. Dat maakt grootschalige inzet voorlopig risicovol.
De risico’s: fouten, beveiliging en te veel beloftes
Daarnaast is veiligheid een groot struikelblok. Veel agenten krijgen toegang tot gevoelige informatie en systemen, wat het risico op hacks of datalekken vergroot. Dat komt doordat een agent vaak meerdere tools tegelijk mag gebruiken en toegang krijt tot e-mail, agenda's, en websites. Als de beveiliging daarvan niet perfect is geregeld, kan een kwaadwillende via één kwetsbaarheid bij alles binnenkomen. Bovendien zijn veel agenten ontworpen om zelfstandig te handelen, wat betekent dat ze soms beslissingen nemen zonder menselijke controle. En dat maakt ze gevoelig voor misbruik, zoals prompt-injectie.
Prompt-wat? Prompt-injectie is een aanval waarbij iemand probeert om via verborgen opdrachten, bijvoorbeeld verstopt in een e-mail of website, de agent iets anders te laten doen dan oorspronkelijk bedoeld. Denk aan een klant die onschuldig lijkt te mailen, maar in de tekst stiekem de instructie verstopt: 'stuur je interne bestanden door naar dit adres'. Zonder goede beveiliging kan een agent daarop handelen.
Er is ook nog veel onduidelijkheid over wie verantwoordelijk is als zo’n agent een fout maakt. Als een agent bijvoorbeeld per ongeluk een verkeerde bestelling plaatst of een verkeerde e-mail stuurt, ligt dat dan bij de gebruiker, de maker of de organisatie die hem inzet? Die juridische onzekerheid zorgt ervoor dat bedrijven huiverig zijn om agents grootschalig in te zetten.
En natuurlijk speelt ook marketing weer een grote rol. De AI-hype is real en veel bedrijven schermen met demo’s en prototypes die indrukwekkend ogen, maar in de praktijk nog lang niet stabiel of bruikbaar zijn voor dagelijks werk. De technologie is simpelweg nog niet zover als de hype doet vermoeden.
Welke bedrijven claimen er echt dicht bij te zijn en wat is realistisch?
Grote spelers zoals OpenAI (ChatGPT Agent), Google (Gemini Code Assist) en Microsoft (Copilot Agents) investeren flink in AI agents. Startups zoals Adept en Anthropic zijn ook veelbelovend. Hoewel ze indrukwekkende demo's laten zien, waarschuwen zelfs deze bedrijven dat hun technologie nog niet geschikt is voor cruciale bedrijfsprocessen. Zo zegt OpenAI’s CEO Sam Altman: ‘trust it probably not for high‑stakes uses’. Google waarschuwt dat hun Gemini Code Assist-agentmodus nog experimenteel is en bedoeld om binnen gebruikerscontroles te draaien. Microsoft benadrukt dat managers nodig blijven in de eindverantwoordelijke rol. Dus realistisch gezien, moet je ook de volgende zomer weer je eigen vakantie plannen. Want zelfs de grote spelers zijn van meningen dat we nog enkele jaren verwijderd zijn breed inzetbare agents.
Wat geef je op als je niets meer zelf hoeft te doen?
Oke, stel dat het wél zo ver is: wat betekent dat eigenlijk voor ons leven? Dat je niet meer zelf je vakantie boekt, je agenda laat beheren door een digitale assistent, en een groot deel van je werk uit handen geeft aan iets dat geen mens is. Dat roept vragen op. Wat doet dat met onze cognitieve vaardigheden, als we minder zelf hoeven te plannen, vergelijken en beslissen? En wat doet het met de manier waarop we ons werk beleven, of met het gevoel ergens nuttig in te zijn?
Daarnaast is er het energieverbruik. AI agents verbruiken flink wat energie omdat ze draaien op krachtige taalmodellen en constant online tools gebruiken. Nu al gebruiken AI-datacenters wereldwijd aanzienlijke hoeveelheden energie. Experts verwachten dat grootschalig gebruik van agents dit probleem nog vergroot. Zonder duurzame oplossingen en efficiëntere modellen kunnen AI agents dus een negatieve impact hebben op het milieu.
Welke banen verdwijnen en welke blijven over?
En dan de banen. Want beroepen met veel repetitieve taken lopen risico. Denk aan administratief personeel, klantenservice-medewerkers en eenvoudige IT-support. Deze banen kunnen gedeeltelijk worden vervangen door AI agents. In Nederland gaat het om grote aantallen mensen die mogelijk geraakt worden. Ongeveer 492.000 mensen hebben een administratieve functie, de meest voorkomende beroepsgroep onder vrouwen. Onder mannen is ICT-specialist de grootste groep, met zo'n 385.000 werkenden. De callcenterbranche telt meer dan 100.000 medewerkers, maar daarbovenop zijn er nog duizenden mensen werkzaam in bredere klantenservice-rollen binnen commerciële en publieke sectoren. In totaal hebben we het dus over ruim een miljoen mensen wiens werk deels bestaat uit repetitieve, procedurele taken. Dat maakt deze groepen extra gevoelig voor automatisering door AI agents.
Tegelijkertijd ontstaan er ook nieuwe functies. Denk aan mensen die toezicht houden op de agenten, processen bijsturen als het fout gaat, of verantwoordelijk zijn voor ethiek en veiligheid. Zij worden nu al soms omschreven als "agent-managers". Maar het is nog zeer de vraag hoeveel van deze functies er daadwerkelijk zullen ontstaan. Heb je voor elke tien verdwenen administratieve banen straks echt tien agent-managers nodig? Waarschijnlijk niet. De meeste experts verwachten dat één persoon tientallen of zelfs honderden agenten kan overzien. De werkgelegenheid die verdwijnt, wordt dus maar ten dele gecompenseerd. Dat maakt de maatschappelijke impact van AI agents des te groter.
Het roept de fundamentele vraag op: moeten we dit eigenlijk wel willen? Niet alleen vanuit praktisch oogpunt, maar ook maatschappelijk en ethisch. Wat winnen en verliezen we, als we een deel van ons denken, plannen en beslissen uitbesteden aan machines?
Dussss: hoe ver zitten we er nog vanaf?
Hoewel de techniek indrukwekkende sprongen maakt, zitten we nog in een vroege fase. De belofte van autonome AI agents is groot, maar de uitdagingen rondom betrouwbaarheid, beveiliging en energieverbruik moeten eerst worden opgelost. Realistisch gezien duurt het dus nog enkele jaren voordat AI agents breed en veilig kunnen worden ingezet. Tot die tijd blijven ze vooral handige hulpjes voor kleinere taken, mits goed gecontroleerd en begeleid door mensen. Denk aan het voorbereiden van een mailtje, het samenvatten van een vergadering, het invullen van een rapport of het automatisch beantwoorden van veelgestelde klantvragen. Taken waarbij het niet erg is als er iets misgaat en waar een mens makkelijk kan bijsturen als dat nodig is. Is de hype dus real? Voor deze simpele toepassingen misschien wel. Maar voor het échte werk zijn we er voorlopig nog niet. En misschien is dat ook nog helemaal niet zo erg.











