Sisällysluettelo:
Suurtietoa, tarttuvaa nimeä rakenteellisen, jäsentämättömän tai osittain jäsentyneen tiedon suurille määrille, on tunnetusti vaikea kaapata, tallentaa, hallita, jakaa, analysoida ja visualisoida, ainakin käyttämällä perinteisiä tietokanta- ja ohjelmistosovelluksia. Siksi isoilla tietotekniikoilla on mahdollisuus hallita ja käsitellä valtavia tietomääriä tehokkaasti ja toimivasti. Ja Apache Hadoop tarjoaa puitteet ja niihin liittyvät tekniikat suurten tietojoukkojen käsittelemiseksi tietokoneiden klusterien välillä hajautetulla tavalla. Joten jotta ymmärrät tosiasiallisesti suuria tietoja, sinun on ymmärrettävä vähän Hadoopista. Tässä tarkastellaan tärkeimpiä termejä, jotka kuulet Hadoopin suhteen - ja mitä ne tarkoittavat.
Verkkoseminaari: Big Iron, tavata Big Data: Mainframe-tietojen vapauttaminen Hadoop & Sparkin avulla Rekisteröidy täällä |
Mutta ensin katsaus kuinka Hadoop toimii
Ennen kuin siirryt Hadoop-ekosysteemiin, sinun on ymmärrettävä kaksi perustavanlaatuista asiaa selvästi. Ensimmäinen tapa on, kuinka tiedosto tallennetaan Hadoopiin; toinen on kuinka tallennetut tiedot käsitellään. Kaikki Hadoop-tekniikat toimivat pääasiassa näillä kahdella alueella ja tekevät siitä käyttäjäystävällisemmän. (Hanki perusteet Hadoopin toiminnasta artikkelissa Kuinka Hadoop auttaa ratkaisemaan suurten tietojen ongelma.)
Nyt ehdot.