Definitie
Het opzettelijk aanvallen of misleiden van een AI-systeem om kwetsbaarheden bloot te leggen. Standaardpraktijk voordat frontier-modellen worden uitgebracht.
Het opzettelijk aanvallen of misleiden van een AI-systeem om kwetsbaarheden bloot te leggen. Standaardpraktijk voordat frontier-modellen worden uitgebracht.