Sisällysluettelo:
Määritelmä - mitä Big Data tarkoittaa?
Big data tarkoittaa prosessia, jota käytetään, kun perinteiset tiedon louhinta- ja käsittelytekniikat eivät pysty paljastamaan perustietojen oivalluksia ja merkitystä. Relagoimattomia tai aikaherkkiä tai yksinkertaisesti erittäin suuria tietoja ei voida käsitellä relaatiotietokantamoottorien avulla. Tämäntyyppinen data vaatii erilaisen käsittelytavan, jota kutsutaan big dataksi, joka käyttää massiivista rinnakkaisuutta helposti saatavilla oleviin laitteisiin.
Techopedia selittää Big Data
Yksinkertaisesti, iso tieto heijastaa muuttuvaa maailmaa, jossa elämme. Mitä enemmän asiat muuttuvat, sitä enemmän muutokset otetaan talteen ja kirjataan tietoiksi. Otetaan sää esimerkki. Sääennustajalle ympäri maailmaa kerättyjen tietojen määrä paikallisista olosuhteista on huomattava. Loogisesti olisi järkevää, että paikalliset ympäristöt sanelevat alueelliset vaikutukset ja alueelliset vaikutukset sanelevat globaalit vaikutukset, mutta se voi olla päinvastoin. Tämä säätieto heijastaa tavalla tai toisella isodatan ominaisuuksia, joissa tarvitaan reaaliaikaista käsittelyä suurelle tietomäärälle ja missä suuri määrä syötteitä voidaan tuottaa koneella, henkilökohtaisilla havainnoilla tai ulkopuolisten voimien, kuten aurinkopisteiden, avulla.
Tämän tyyppinen tietojen käsittely käsittelee sitä, miksi isoista tiedoista on tullut niin tärkeitä:
- Suurin osa nyt kerätystä tiedosta on jäsentämätöntä ja vaatii erilaista varastointia ja käsittelyä kuin perinteisissä relaatiotietokannoissa.
- Käytettävissä oleva laskentateho on taivaalla rakettimista, mikä tarkoittaa, että isojen tietojen käsittelyyn on enemmän mahdollisuuksia.
- Internet on demokratisoinut dataa, kasvattaa jatkuvasti käytettävissä olevaa tietoa tuottaen samalla enemmän ja enemmän raakatietoja.
Raaka-aineistollaan ei ole arvoa. Tiedot on käsiteltävä ollakseen arvokkaita. Tässä on kuitenkin isodatan luontainen ongelma. Kannattaako tietojen käsitteleminen alkuperäisestä objektimuodosta käyttökelpoiseksi oivallukseksi siitä tekemisen valtavia pääomakustannuksia? Vai onko tuntemattomien arvojen tietoja liian paljon, jotta voidaan perustella niiden käsitteleminen isoilla tietotyökaluilla? Suurin osa meistä on sitä mieltä, että kyvyllä ennustaa sää olisi arvokasta, kysymys on, voisiko tämä arvo ylittää kustannukset, jotka aiheutuvat kaikkien reaaliaikaisten tietojen purkamisesta säätiedotteeseen, johon voidaan luottaa.