Leksikon
Reinforcement learning
Reinforcement learning lader en AI lære gennem belønning og straf, som man træner et dyr. Forstå paradigmet bag alt fra spil-AI til moderne sprogmodeller.
Hvad er reinforcement learning?
Reinforcement learning (RL) er en gren af machine learning, hvor en AI lærer ved at prøve sig frem og få belønning eller straf — meget som man træner et dyr. Den får ikke facit; den opdager selv, hvilke handlinger der fører til det bedste resultat, ved at gentage opgaven tusindvis af gange.
Hvor man møder det
RL slog først igennem med AI, der lærte at spille spil bedre end mennesker. I dag er det også en central ingrediens i moderne sprogmodeller — det er fx kernen i RLHF, hvor menneskelig feedback bliver til belønningssignalet, der former modellens adfærd.
Hvad det er godt til
RL skinner, hvor der ikke findes et enkelt facit, men hvor man kan måle, om et resultat er godt: styring, optimering, spil, robotter. Det er kraftfuldt, men også svært at sætte rigtigt op — derfor bruges det mest, hvor de simplere metoder kommer til kort.
Flere opslag i leksikonet
Se hele leksikonet →Relaterede ydelser
Skal det her omsættes til noget, der virker hos jer? Så er det typisk her, vi kommer ind.
Fra begreb til løsning
Skal et af begreberne her omsættes til noget der rent faktisk virker i din virksomhed, så tag en uforpligtende snak med os.