Leksikon
Data lake
Et data lake gemmer alle slags rå data i stor skala til senere brug. Forstå forskellen på en data lake og et data warehouse — og hvornår man bruger hvad.
Hvad er et data lake?
Et data lake er et stort lager, der gemmer alle slags data i deres rå form — struktureret som tabeller, men også ustruktureret som tekst, billeder, logfiler og sensordata. Pointen er at gemme alt nu, billigt, og finde ud af, hvad man vil bruge det til, senere.
Lake vs. warehouse
Det er let at forveksle med et data warehouse, men de løser forskellige behov:
- Data warehouse: struktureret, ryddet data, klar til analyse og rapporter. Som et velorganiseret bibliotek.
- Data lake: rå, blandet data i stor skala, gemt til fremtidig brug — fx til at træne AI-modeller. Som et stort arkiv, der venter på at blive brugt.
Mange virksomheder bruger begge dele, og de to tilgange smelter i stigende grad sammen til en hybrid ("lakehouse").
Hvornår det er relevant
Et data lake giver mening, når du har — eller forventer at få — store mængder forskelligartet data, og endnu ikke ved præcis, hvad det hele skal bruges til. Til et lille, veldefineret behov er det overkill. Men for en datatung forretning er det fundamentet, AI og avanceret analyse senere bygges på.
Flere opslag i leksikonet
Se hele leksikonet →Relaterede ydelser
Skal det her omsættes til noget, der virker hos jer? Så er det typisk her, vi kommer ind.
Fra begreb til løsning
Skal et af begreberne her omsættes til noget der rent faktisk virker i din virksomhed, så tag en uforpligtende snak med os.