Red teaming

Red teaming er at angribe sin egen AI for at finde svaghederne, før andre gør. Forstå metoden, der gør AI-løsninger robuste nok til virkeligheden.

Hvad er red teaming?

Red teaming er at sætte folk til bevidst at angribe sit eget system for at finde svaghederne, før de rigtige modstandere gør. Begrebet kommer fra sikkerhedsverdenen - beslægtet med en penetrationstest - og bruges nu intenst på AI-modeller.

Hvad man leder efter i AI

Når man red-teamer en AI, prøver man at få den til at gøre det, den ikke må: omgå guardrails, afsløre følsomme data, give skadelige svar eller lade sig narre med kreative formuleringer. Alt det, man finder, bliver til forbedringer.

Hvorfor det betyder noget for dig

Hvis du bygger en kundevendt AI, vil nogen før eller siden prøve at presse den ud over kanten - af nysgerrighed eller ondskab. Det er bedre, at det er dig, der finder hullerne først. En kort, struktureret red team-øvelse, før en AI-løsning går live, fanger de pinlige fejl, mens de stadig er billige at rette.

Flere opslag i leksikonet

Se hele leksikonet →

Agentiske workflows AGI - Artificial General Intelligence AI safety og alignment AI-agenter AI-etik og bias AI-hallucination AI-kodeassistenter Benchmarks og evals Chain-of-thought Claude (Anthropic)Computer vision Context engineering Context window Deep learning med kunstig intelligens

Relaterede ydelser

Skal det her omsættes til noget, der virker hos jer? Så er det typisk her, vi kommer ind.

AI i jeres software

AI-funktioner indbygget der hvor de skaber værdi.

Se løsningen

AI-rådgivning & enablement

Effektiv brug af AI - i hele virksomheden.

Se løsningen

Næste skridt

Fra begreb til løsning

Skal et af begreberne her omsættes til noget der rent faktisk virker i din virksomhed, så tag en uforpligtende snak med os.

Book et møde Se vores løsninger