Sisällysluettelo:
Määritelmä - mitä Hadoop Ecosystem tarkoittaa?
Hadoop-ekosysteemi viittaa Apache Hadoop -ohjelmistokirjaston eri komponentteihin sekä Apache Software Foundation -säätiön tarjoamiin lisälaitteisiin ja työkaluihin tämän tyyppisille ohjelmistoprojekteille sekä niiden yhdessä työskenteleville tavoille.
Hadoop on Java-pohjainen kehys, joka on erittäin suosittu suurten tietosarjojen käsittelyyn ja analysointiin.
Techopedia selittää Hadoop Ecosystem
Sekä Hadoop-ydinpaketti että sen lisälaitteet ovat enimmäkseen avoimen lähdekoodin projekteja, jotka on lisensoinut Apache. Hadoop-ekosysteemin idea käsittää Hadoop-ydinjoukon eri osien, kuten MapReduce, kehys, jolla käsitellään suuria määriä tietoja, ja Hadoop Distributed File System (HDFS), kehittyneen tiedostojenkäsittelyjärjestelmän. Siellä on myös lanka, Hadoop-resurssienhallinta.
Näiden Hadoopin ydinosien lisäksi Apache on toimittanut myös muunlaisia lisävarusteita tai täydentäviä työkaluja kehittäjille. Näihin kuuluvat Apache Hive, tietoanalyysityökalu; Apache Spark, yleinen moottori suurten tietojen käsittelyyn; Apache Pig, tiedonsiirtokieli; HBase, tietokantatyökalu; ja myös Ambarl, jota voidaan pitää Hadoop-ekosysteemien ylläpitäjänä, koska se auttaa hallitsemaan näiden erilaisten Apache-resurssien käyttöä yhdessä. Kun Hadoopista on tullut tosiasiallinen tiedonkeruun standardi ja siitä on tullut yleistä monissa organisaatioissa, johtajat ja kehitysjohtajat oppivat kaiken Hadoopin ekosysteemistä ja siitä, millaiset asiat osallistuvat Hadoopin yleiseen asennukseen.
