Leksikon

Leksikon

Transformer-modeller

Transformeren er arkitekturen bag moderne sprogmodeller som GPT og Claude. Forstå gennembruddet, der gjorde nutidens AI muligt — forklaret enkelt.

Hvad er en transformer?

Transformeren er den opbygning — arkitektur — der ligger under stort set al moderne AI, som arbejder med sprog. Den blev introduceret i 2017 og er grunden til, at en sprogmodel som GPT eller Claude overhovedet findes. Du skal ikke kende matematikken. Men det hjælper at vide, hvad gennembruddet handlede om.

Hvad den gjorde anderledes

Tidligere AI læste tekst ord for ord, i rækkefølge, og tabte tråden i lange sætninger. Transformeren kan se på hele teksten på én gang og selv vægte, hvilke ord der hænger sammen — en mekanisme kaldet "attention". Det gav to ting: den forstår sammenhæng bedre, og den kan trænes på langt mere data, langt hurtigere.

Hvorfor det betyder noget for dig

Du bruger aldrig en transformer direkte. Men det er den, der gør, at AI i dag kan svare i fuldt sprog, holde tråden gennem en lang tekst og arbejde med tokens på en måde, der føles sammenhængende. Kort sagt: motoren under de værktøjer, du faktisk bruger.

Ikke endnu et buzzword. Men det tekniske gennembrud, hele den nuværende AI-bølge står på.

Næste skridt

Fra begreb til løsning

Skal et af begreberne her omsættes til noget der rent faktisk virker i din virksomhed, så tag en uforpligtende snak med os.