AI safety og alignment

AI safety handler om at bygge AI, der opfører sig som intenderet. Forstå feltet bag tryg AI - og hvorfor det også er et praktisk hensyn, ikke kun et filosofisk.

Hvad er AI safety og alignment?

AI safety er forskningsfeltet, der arbejder på at gøre AI-systemer sikre, robuste og forudsigelige. Alignment er en kernedel af det: udfordringen med at sikre, at en AI's mål og adfærd stemmer overens med, hvad mennesker faktisk ønsker. En meget kraftfuld model, der løser den forkerte opgave effektivt, er ikke en hjælp.

Det store og det nære

På den store skala handler det om langsigtede spørgsmål: hvordan sikrer vi, at stadig mere kapable systemer forbliver under kontrol? På den nære, praktiske skala handler det om noget meget håndgribeligt: at en model ikke finder på, ikke kan narres, og holder sig inden for de grænser, man har sat med guardrails.

Hvorfor det også angår dig

Når du bygger en AI-løsning til kunder eller medarbejdere, laver du i praksis dit eget lille stykke alignment: hvad må modellen, hvornår skal et menneske ind over, og hvordan undgår vi skadelige svar. Det er ikke kun de store laboratoriers ansvar - det er en del af at bygge AI, man tør sætte i drift.

Flere opslag i leksikonet

Se hele leksikonet →

Agentiske workflows AGI - Artificial General Intelligence AI-agenter AI-etik og bias AI-hallucination AI-kodeassistenter Benchmarks og evals Chain-of-thought Claude (Anthropic)Computer vision Context engineering Context window Deep learning med kunstig intelligens DeepSeek

Relaterede ydelser

Skal det her omsættes til noget, der virker hos jer? Så er det typisk her, vi kommer ind.

AI i jeres software

AI-funktioner indbygget der hvor de skaber værdi.

Se løsningen

AI-rådgivning & enablement

Effektiv brug af AI - i hele virksomheden.

Se løsningen

Næste skridt

Fra begreb til løsning

Skal et af begreberne her omsættes til noget der rent faktisk virker i din virksomhed, så tag en uforpligtende snak med os.

Book et møde Se vores løsninger