Definitie
Trainingsmethode van Anthropic waarbij een model wordt getraind aan de hand van een set principes (een 'grondwet') in plaats van uitsluitend menselijke beoordelingen.
Trainingsmethode van Anthropic waarbij een model wordt getraind aan de hand van een set principes (een 'grondwet') in plaats van uitsluitend menselijke beoordelingen.