Reinforcement learning

Reinforcement learning lader en AI lære gennem belønning og straf, som man træner et dyr. Forstå paradigmet bag alt fra spil-AI til moderne sprogmodeller.

Hvad er reinforcement learning?

Reinforcement learning (RL) er en gren af machine learning, hvor en AI lærer ved at prøve sig frem og få belønning eller straf - meget som man træner et dyr. Den får ikke facit; den opdager selv, hvilke handlinger der fører til det bedste resultat, ved at gentage opgaven tusindvis af gange.

Hvor man møder det

RL slog først igennem med AI, der lærte at spille spil bedre end mennesker. I dag er det også en central ingrediens i moderne sprogmodeller - det er fx kernen i RLHF, hvor menneskelig feedback bliver til belønningssignalet, der former modellens adfærd.

Hvad det er godt til

RL skinner, hvor der ikke findes et enkelt facit, men hvor man kan måle, om et resultat er godt: styring, optimering, spil, robotter. Det er kraftfuldt, men også svært at sætte rigtigt op - derfor bruges det mest, hvor de simplere metoder kommer til kort.

Flere opslag i leksikonet

Se hele leksikonet →

Agentiske workflows AGI - Artificial General Intelligence AI safety og alignment AI-agenter AI-etik og bias AI-hallucination AI-kodeassistenter Benchmarks og evals Chain-of-thought Claude (Anthropic)Computer vision Context engineering Context window Deep learning med kunstig intelligens

Relaterede ydelser

Skal det her omsættes til noget, der virker hos jer? Så er det typisk her, vi kommer ind.

AI i jeres software

AI-funktioner indbygget der hvor de skaber værdi.

Se løsningen

AI-rådgivning & enablement

Effektiv brug af AI - i hele virksomheden.

Se løsningen

Næste skridt

Fra begreb til løsning

Skal et af begreberne her omsættes til noget der rent faktisk virker i din virksomhed, så tag en uforpligtende snak med os.

Book et møde Se vores løsninger