Sisällysluettelo:
Määritelmä - mitä Data Lake tarkoittaa?
Tietojärvi on massiivinen, helposti saatavilla oleva, keskitetty arkisto, joka sisältää suuria määriä jäsenneltyä ja jäsentämätöntä tietoa.Techopedia selittää Data Lake
Datajärvi -arkkitehtuuri on kauppa-kaikki -lähestymistapa isoihin tietoihin. Tietoja ei luokitella, kun niitä säilytetään arkistossa, koska datan arvo ei ole alussa selvä. Seurauksena tietojen valmistelu on poistettu. Tietojärvi on siten vähemmän rakenteellinen verrattuna tavanomaiseen tietovarastoon. Kun tietoja käytetään, ne luokitellaan, järjestetään tai analysoidaan vasta sitten.
Hadoop, avoimen lähdekoodin kehys suurten tietojen käsittelyyn ja analysointiin, voidaan käyttää seulomaan arkistossa olevan tiedon läpi.
