Leksikon

Leksikon

Syntetisk data

Syntetisk data er kunstigt genereret data brugt til at træne og teste AI. Forstå hvornår det løser problemer med mangel på data og med privatliv.

Hvad er syntetisk data?

Syntetisk data er data, der er kunstigt genereret frem for indsamlet fra virkeligheden. Det kan være AI-genererede eksempler, simulerede transaktioner eller opdigtede kundeprofiler — skabt til at træne, teste eller demonstrere et system uden at bruge ægte data.

Hvilke problemer det løser

Mangel på data: har du for få rigtige eksempler til at træne en model, kan syntetisk data fylde hullerne ud.

Privatliv: i stedet for at teste på ægte kundeoplysninger — med alt hvad det indebærer af GDPR — kan du bruge realistiske, men opdigtede data.

Sjældne tilfælde: du kan fremstille netop de svære situationer, der næsten aldrig forekommer i de ægte data, men som systemet skal kunne håndtere.

Det skal du være opmærksom på

Syntetisk data er kun så godt som det, der genererer det. Afspejler det ikke virkeligheden, lærer modellen de forkerte mønstre. Brugt med omtanke er det et stærkt værktøj — særligt til test og til at beskytte rigtige personoplysninger.

Næste skridt

Fra begreb til løsning

Skal et af begreberne her omsættes til noget der rent faktisk virker i din virksomhed, så tag en uforpligtende snak med os.