Definitie
Trainingsmethode waarbij menselijke beoordelaars antwoorden rangschikken en het model die voorkeuren leert imiteren. Maakte ChatGPT in 2022 voor het eerst breed bruikbaar.
Trainingsmethode waarbij menselijke beoordelaars antwoorden rangschikken en het model die voorkeuren leert imiteren. Maakte ChatGPT in 2022 voor het eerst breed bruikbaar.