Leksikon

Leksikon

AI safety og alignment

AI safety handler om at bygge AI, der opfører sig som intenderet. Forstå feltet bag tryg AI — og hvorfor det også er et praktisk hensyn, ikke kun et filosofisk.

Hvad er AI safety og alignment?

AI safety er forskningsfeltet, der arbejder på at gøre AI-systemer sikre, robuste og forudsigelige. Alignment er en kernedel af det: udfordringen med at sikre, at en AI's mål og adfærd stemmer overens med, hvad mennesker faktisk ønsker. En meget kraftfuld model, der løser den forkerte opgave effektivt, er ikke en hjælp.

Det store og det nære

På den store skala handler det om langsigtede spørgsmål: hvordan sikrer vi, at stadig mere kapable systemer forbliver under kontrol? På den nære, praktiske skala handler det om noget meget håndgribeligt: at en model ikke finder på, ikke kan narres, og holder sig inden for de grænser, man har sat med guardrails.

Hvorfor det også angår dig

Når du bygger en AI-løsning til kunder eller medarbejdere, laver du i praksis dit eget lille stykke alignment: hvad må modellen, hvornår skal et menneske ind over, og hvordan undgår vi skadelige svar. Det er ikke kun de store laboratoriers ansvar — det er en del af at bygge AI, man tør sætte i drift.

Næste skridt

Fra begreb til løsning

Skal et af begreberne her omsættes til noget der rent faktisk virker i din virksomhed, så tag en uforpligtende snak med os.