Sisällysluettelo:
Apache Hadoop on jo pitkään ollut perustana suurille datasovelluksille, ja sitä pidetään perustietoalustana kaikille isoihin tietoihin liittyville tarjouksille. Muistitietokanta ja laskenta ovat kuitenkin kasvussa nopeamman suorituskyvyn ja nopeiden tulosten vuoksi. Apache Spark on uusi kehys, joka käyttää muistin ominaisuuksia nopeaan käsittelyyn (melkein 100 kertaa nopeampi kuin Hadoop). Joten Spark-tuotetta käytetään yhä enemmän suurten tietojen maailmassa ja pääasiassa nopeampaan käsittelyyn.
Verkkoseminaari: Ehdotuksen voima: Kuinka dataluettelo antaa analyytikoille mahdollisuuden Rekisteröidy täällä |
Mikä on Apache Spark?
Apache Spark on avoimen lähdekoodin kehys käsittelemään valtavia tietomääriä (suuria tietoja) nopeudella ja yksinkertaisuudella. Se soveltuu isoihin tietoihin perustuviin analytiikkasovelluksiin. Kipinää voidaan käyttää Hadoop-ympäristössä, itsenäisenä tai pilvessä. Se kehitettiin Kalifornian yliopistossa ja tarjottiin myöhemmin Apache Software Foundation -säätiölle. Siksi se kuuluu avoimen lähdekoodin yhteisöön ja voi olla erittäin kustannustehokas, mikä antaa amatööri-kehittäjille mahdollisuuden työskennellä helposti. (Lisätietoja Hadoopin avoimesta lähteestä on artikkelissa Mikä on avoimen lähdekoodin vaikutus Apache Hadoopin ekosysteemiin?)
Sparkin päätarkoitus on, että se tarjoaa kehittäjille sovelluskehyksen, joka toimii keskitetyn tietorakenteen ympärillä. Spark on myös erittäin tehokas ja sillä on luontainen kyky käsitellä nopeasti suuria määriä dataa nopeasti lyhyessä ajassa, mikä tarjoaa erittäin hyvän suorituskyvyn. Tämä tekee siitä paljon nopeamman kuin sen, jonka sanotaan olevan sen lähin kilpailija, Hadoop.