Sisällysluettelo:
Kun aloitin tämän artikkelin, aion luetteloida erityyppisiä suuria tietoalustoja. Mutta sen jälkeen, kun kolme päivää oli yritetty korjata kaikki suuret tietotarjoukset - relaatiot vs. ei-relaatiot, SQL vs. NoSQL ja tietokanta vs. kehys - jonkinlaiseen järjestyksessä, päätin välttää tämän sotkun.
Lisäämään loukkaantumista loukkaantumiseen toivoin esitellä henkilölle, joka loi termin "big data" osana artikkelia. Mutta en voi edes tehdä sitä. Ei ole sovittua vastausta. Itse asiassa siellä on täydellinen tutkimusprojekti, joka tutkii kuka alun perin teki suuria tietoja. Sen sijaan aion tarkastella joitain keskeisiä tapoja, joilla iso dataa käytetään. Se on paljon tärkeämpää. Ja se on mielenkiintoisempaa ja yllättävämpää kuin luuletkaan.
Miten se tapahtui
Perinteistä tiedon louhintaa käyttävät analyytikot ovat manipuloineet tietoja vuosien ajan. Näiden samojen analyytikkojen on nyt vaikea selviytyä yritysten, yksityisten organisaatioiden ja valtion virastojen tallentaman tiedon määrästä ja monimuotoisuudesta.