Transformer-modeller

Transformeren er arkitekturen bag moderne sprogmodeller som GPT og Claude. Forstå gennembruddet, der gjorde nutidens AI muligt - forklaret enkelt.

Hvad er en transformer?

Transformeren er den opbygning - arkitektur - der ligger under stort set al moderne AI, som arbejder med sprog. Den blev introduceret i 2017 og er grunden til, at en sprogmodel som GPT eller Claude overhovedet findes. Du skal ikke kende matematikken. Men det hjælper at vide, hvad gennembruddet handlede om.

Hvad den gjorde anderledes

Tidligere AI læste tekst ord for ord, i rækkefølge, og tabte tråden i lange sætninger. Transformeren kan se på hele teksten på én gang og selv vægte, hvilke ord der hænger sammen - en mekanisme kaldet "attention". Det gav to ting: den forstår sammenhæng bedre, og den kan trænes på langt mere data, langt hurtigere.

Hvorfor det betyder noget for dig

Du bruger aldrig en transformer direkte. Men det er den, der gør, at AI i dag kan svare i fuldt sprog, holde tråden gennem en lang tekst og arbejde med tokens på en måde, der føles sammenhængende. Kort sagt: motoren under de værktøjer, du faktisk bruger.

Ikke endnu et buzzword. Men det tekniske gennembrud, hele den nuværende AI-bølge står på.

Flere opslag i leksikonet

Se hele leksikonet →

Agentiske workflows AGI - Artificial General Intelligence AI safety og alignment AI-agenter AI-etik og bias AI-hallucination AI-kodeassistenter Benchmarks og evals Chain-of-thought Claude (Anthropic)Computer vision Context engineering Context window Deep learning med kunstig intelligens

Relaterede ydelser

Skal det her omsættes til noget, der virker hos jer? Så er det typisk her, vi kommer ind.

AI i jeres software

AI-funktioner indbygget der hvor de skaber værdi.

Se løsningen

AI-rådgivning & enablement

Effektiv brug af AI - i hele virksomheden.

Se løsningen

Næste skridt

Fra begreb til løsning

Skal et af begreberne her omsættes til noget der rent faktisk virker i din virksomhed, så tag en uforpligtende snak med os.

Book et møde Se vores løsninger