Definitie
Vorm van machine learning die werkt met meerlagige neurale netwerken. Sterke aanjager van de doorbraken in beeld, spraak en taal sinds 2012.
Vorm van machine learning die werkt met meerlagige neurale netwerken. Sterke aanjager van de doorbraken in beeld, spraak en taal sinds 2012.
Deep learning is een tak van machine learning die werkt met neurale netwerken met meerdere verborgen lagen, vandaar "deep". De doorbraak kwam in 2012 toen het neurale netwerk AlexNet de ImageNet-competitie won met een verpletterend grote marge. Dat trok onderzoekers en bedrijven massaal naar de techniek, geholpen door de gelijktijdige opmars van krachtige GPUs.
Wat deep learning anders maakt dan traditionele machine learning is dat het model zelf de relevante features uit de ruwe data leert. Bij oude methodes moest een mens eerst bepalen welke kenmerken belangrijk waren (vorm van een neus, frequentie van een woord) en die als input geven. Een deep learning model krijgt de pixels of de tekens en bouwt zijn eigen interne representaties op.
In 2026 is deep learning de motor onder vrijwel alle hoog-profile AI: spraakherkenning, beeldherkenning, taalverwerking, AlphaFold voor eiwitstructuur, zelfrijdende auto's, medische beeldanalyse. De architecturen verschillen per domein (CNN voor beeld, transformer voor tekst, diffusion voor generatieve beelden), maar het onderliggende paradigma is hetzelfde.
Deep learning is een specifieke vorm van machine learning. Het gebruikt diepe neurale netwerken die hun eigen features leren uit ruwe data. Klassieke machine learning werkt vaak met simpelere modellen (lineaire regressie, decision trees) waarbij een mens nog steeds bepaalt welke kenmerken belangrijk zijn.
Drie ontwikkelingen kwamen rond 2012 samen. Er kwam veel meer gelabelde data beschikbaar (ImageNet). GPUs werden krachtig en betaalbaar genoeg om grote netwerken te trainen. En onderzoekers ontdekten technieken die het mogelijk maakten om diepe netwerken stabiel te trainen, waar eerdere pogingen vastliepen.
Convolutional neural networks (CNN) voor beeld, recurrent neural networks (RNN, LSTM) voor sequenties, transformer voor tekst en multimodaal, generative adversarial networks (GAN) en diffusion models voor generatieve taken, graph neural networks voor netwerkstructuren. Elk type past bij een specifiek soort data en taak.
Traditioneel ja, maar dat is aan het schuiven. Transfer learning maakt het mogelijk om een groot voorgetraind model te gebruiken en met relatief weinig data fine-tunen voor een specifieke taak. Voor specialistische taken kun je tegenwoordig vaak uit de voeten met honderden tot duizenden voorbeelden, in plaats van miljoenen.