Sisällysluettelo:
- Määritelmä - Mitä Hadoopin hajautettu tiedostojärjestelmä (HDFS) tarkoittaa?
- Techopedia selittää Hadoopin hajautetun tiedostojärjestelmän (HDFS)
Määritelmä - Mitä Hadoopin hajautettu tiedostojärjestelmä (HDFS) tarkoittaa?
Hadoopin hajautettu tiedostojärjestelmä (HDFS) on hajautettu tiedostojärjestelmä, joka toimii vakio- tai huippuluokan laitteistoilla. Apache Hadoopin kehittämä HDFS toimii kuin tavallinen hajautettu tiedostojärjestelmä, mutta tarjoaa paremman tiedonsiirtonopeuden ja pääsyn MapReduce-algoritmin kautta, korkean vikasietoisuuden ja suurten tietojoukkojen alkuperäisen tuen.
Techopedia selittää Hadoopin hajautetun tiedostojärjestelmän (HDFS)
HDFS tallentaa suuren määrän dataa, joka on sijoitettu useille koneille, tyypillisesti satoihin ja tuhansiin samanaikaisesti kytkettyihin solmuihin, ja tarjoaa datan luotettavuuden replikoimalla jokainen data-esiintymä kolmena eri kopiona - kaksi yhdessä ryhmässä ja yksi toisessa. Nämä kopiot voidaan korvata vian sattuessa.
HDFS-arkkitehtuuri koostuu klustereista, joita kutakin käytetään yhden erillisen koneeseen asennetun NameNode-ohjelmistotyökalun avulla, jotta voidaan seurata ja hallita klusterin tiedostojärjestelmää ja käyttäjän pääsymekanismia. Muut koneet asentavat yhden DataNode-esiintymän klusterin tallennuksen hallitsemiseksi.
Koska HDFS on kirjoitettu Java-kielellä, sillä on natiivi tuki Java-sovellusohjelmointirajapinnoille (API) sovellusten integrointia ja saavutettavuutta varten. Sitä voidaan käyttää myös tavanomaisten selainten kautta.
