Leksikon

Leksikon

Reinforcement learning

Reinforcement learning lader en AI lære gennem belønning og straf, som man træner et dyr. Forstå paradigmet bag alt fra spil-AI til moderne sprogmodeller.

Hvad er reinforcement learning?

Reinforcement learning (RL) er en gren af machine learning, hvor en AI lærer ved at prøve sig frem og få belønning eller straf — meget som man træner et dyr. Den får ikke facit; den opdager selv, hvilke handlinger der fører til det bedste resultat, ved at gentage opgaven tusindvis af gange.

Hvor man møder det

RL slog først igennem med AI, der lærte at spille spil bedre end mennesker. I dag er det også en central ingrediens i moderne sprogmodeller — det er fx kernen i RLHF, hvor menneskelig feedback bliver til belønningssignalet, der former modellens adfærd.

Hvad det er godt til

RL skinner, hvor der ikke findes et enkelt facit, men hvor man kan måle, om et resultat er godt: styring, optimering, spil, robotter. Det er kraftfuldt, men også svært at sætte rigtigt op — derfor bruges det mest, hvor de simplere metoder kommer til kort.

Næste skridt

Fra begreb til løsning

Skal et af begreberne her omsættes til noget der rent faktisk virker i din virksomhed, så tag en uforpligtende snak med os.