K:
Mitkä näkökohdat ovat tärkeimpiä päätettäessä, mitkä suuret dataratkaisut otetaan käyttöön?
V:Jokaisen yrityksen ja organisaation on harkittava omia tarpeitaan ja resurssejaan selvitettäessä, mitkä asiat ovat tärkeimmät suurten tietojen toteutuksessa. On kuitenkin olemassa useita periaatteita, joita pidetään yleensä kriittisinä tällaisen tekniikan omaksumisen kannalta.
Verkkoseminaari: Big Iron, tavata Big Data: Mainframe-tietojen vapauttaminen Hadoop & Sparkin avulla Rekisteröidy täällä |
Yksi suurimmista kysymyksistä on toteutus ja siitä aiheutuvat häiriöt. Suurten tietojärjestelmien käyttäjien on aina verrattava aikomustaan käyttämiinsä. Monissa tapauksissa häiriöt ovat ratkaiseva tekijä sen suhteen, lisäävätkö suuret tietolähteet tuottavuutta ja voittoja vai lähettävätkö yritykset kaatuvan, koska niiden toteuttamiseen liittyy ylitsepääsemättömiä esteitä. Myyjätuella (tai sen puuttumisella) on paljon tekemistä tämän kanssa, mutta yritysten on myös tarkasteltava tekniikoiden oppimiskäyrää, kuinka paljon ne muuttavat vanhojen järjestelmien toimintaa ja yleensä sitä, ovatko muutokset jotain yritys pystyy käsittelemään.
Toinen tärkeä kysymys on, mitkä tiedot ovat arvokkaimpia yritykselle tai organisaatiolle. Tutkimalla eri tietojoukkojen arvoa suuret dataa toteuttavat aikovat asettaa hankkeensa laajuuden. Ilman tällaisia ohjeita suuret dataprojektit voivat paistua ja hukkua yrityksessä. Asiantuntijat suosittelevat keskittymistä erityisiin tietojoukkoihin, jotka tuottavat eniten lisäarvoa, juuttumatta heittäessään laajempaa verkkoa.
Seurauksena on strukturoidun ja jäsentämättömän tiedon käyttö. Yrityksen johtajat voivat tarkastella vaikeustasoa saada erilaiset bitit dataa suureen tietokontekstiin, kuten datakeskukseen. Esimerkiksi jo formatoidut tietojoukot voidaan helposti hajottaa, mutta jotkut muut tiedot voivat tarvita laajoja manipulointeja, jotta ne saadaan hyödylliseen muotoon, ja se ei ehkä ole sen arvoista.
Hyväksyjien on myös tutkittava edistynyttä suurten tietojen käsittelyä. Suuret tietojärjestelmät määritellään sellaisiksi, joita on vaikea käsitellä perus- ja yksinkertaisten laitteisto- ja ohjelmistoinfrastruktuurien kanssa. Tämä tarkoittaa, että omaksuttajilla on oltava riittävä kyky ja resurssit käytettävissä löytääkseen tapoja käyttää suuria tietojoukkoja, jotka eivät aiheuta verkon ruuhkia tai muuten luo pullonkauloja toiminnassa.