Sisällysluettelo:
- Ota kaikki liiketoiminta-alueet mukaan big data -aloitteeseen
- Arvioi kaikki infrastruktuurimallit suurten tietojen toteutusta varten
- Harkitse perinteisiä tietolähteitä isojen tietojen suunnittelussa
- Harkitse johdonmukaista tietojoukkoa
- Levitä tietoja
- Älä koskaan luota yhteen ainoaan big data -analyysimenetelmään
- Älä aloita suurta big data -aloitetta ennen kuin olet valmis
- Älä käytä tietoja erikseen
- Älä sivuuta tietoturvaa
- Älä unohda isojen tietojen analysoinnin suorituskykyä koskevaa osaa
Suuret tiedot sisältävät paljon lupauksia kaikenlaisille toimialoille. Jos tätä suurta dataa hyödynnetään tehokkaasti ja vaikuttavasti, sillä voi olla merkittävä vaikutus päätöksentekoon ja analytiikkaan. Mutta isojen tietojen hyöty voidaan saavuttaa vain, jos niitä hallitaan jäsennellyllä tavalla. Suurtietojen parhaat käytännöt ovat vähitellen vakiinnuttamassa, mutta täytäntöönpanossa on jo joitain selviä tekemisiä ja kieltäytymisiä.
Seuraava ohje perustuu käytännön kokemukseen ja tosielämän hankkeista kerättyyn tietoon. Tässä ovat tärkeimmät tekemäni ja kiellettävät suuret tietoni.
Ota kaikki liiketoiminta-alueet mukaan big data -aloitteeseen
Big data -aloite ei ole erillinen ja itsenäinen toiminta, ja kaikkien liiketoimintayksiköiden osallistuminen on välttämätöntä todellisen arvon ja näkemyksen saamiseksi. Suuret tiedot voivat auttaa organisaatioita hyödyntämään suuria tietomääriä ja saada käsityksen asiakaskäyttäytymisestä, tapahtumista, suuntauksista, ennusteista jne. Tämä ei ole mahdollista datan tilannekuvan avulla, joka vain kaappaa kokonaisen osan suurista tiedoista käsiteltyjen tietojen kokonaismäärästä. Tämän seurauksena yritykset keskittyvät yhä enemmän kaiken tyyppisiin tietoihin, jotka tulevat kaikista mahdollisista keinoista / liiketoimintayksiköistä ymmärtääksesi oikean mallin.Arvioi kaikki infrastruktuurimallit suurten tietojen toteutusta varten
Tietomäärä ja sen hallinta ovat tärkeitä huolenaiheita kaikille big data -aloitteille. Koska iso data käsittelee datan petabyyttejä, ainoa ratkaisu sen hallintaan on käyttää tietokeskuksia. Samanaikaisesti kustannuskomponentti on otettava huomioon ennen minkä tahansa varastotilan valitsemista ja viimeistelyä. Pilvipalvelut ovat usein paras valinta, mutta eri pilviympäristöjen palvelut on arvioitava sopivan määrittämiseksi. Koska tallennus on yksi tärkeimmistä komponenteista kaikissa suurten tietojen toteutuksessa, se on tekijä, jota tulisi arvioida erittäin huolellisesti jokaisessa suuria tietoja koskevassa aloitteessa. (Hanki uusi näkökulma nykypäivän Big Data Challenge -sarjoihin erilaisuudesta, ei volyymista tai nopeudesta.)Harkitse perinteisiä tietolähteitä isojen tietojen suunnittelussa
Suuria tietoja on eri lähteistä, ja myös lähteiden määrä kasvaa päivä päivältä. Tätä valtavaa tietomäärää käytetään syötteenä isoon tietojenkäsittelyyn. Joidenkin yritysten mielestä perinteisistä tietolähteistä ei ole hyötyä. Tämä ei ole totta, koska tämä perinteinen tieto on kriittinen osa minkä tahansa suuren datajutun menestystä. Perinteinen tieto sisältää arvokasta tietoa, joten sitä tulisi käyttää yhdessä muiden suurten tietolähteiden kanssa. Suuret tiedot voivat saada todellisen arvon vain, jos kaikki tietolähteet (perinteiset ja muut kuin perinteiset) otetaan huomioon. (Lisätietoja kohdasta Ota tämä, iso data! Miksi pienet tiedot voivat pakata isomman iskun.)Harkitse johdonmukaista tietojoukkoa
Suuressa tietoympäristössä tiedot tulevat eri lähteistä. Tietomuoto, rakenne ja tyypit vaihtelevat lähteestä toiseen. Tärkeintä on, että tietoja ei puhdisteta, kun kyse on iso dataympäristöstäsi. Joten ennen kuin luotat saapuviin tietoihin, sinun on tarkistettava johdonmukaisuus toistamalla havaintoja ja analysoimalla. Kun tietojen yhdenmukaisuus on vahvistettu, sitä voidaan pitää yhtenäisenä metatietojoukkona. Johdonmukaisen metatietojoukon löytäminen tarkastelemalla mallia huolellisesti on olennainen tehtävä kaikissa suurten tietojen suunnittelussa.Levitä tietoja
Tietomäärä on suuri huolenaihe, kun tarkastellaan käsittelyympäristöä. Koska iso data käsittelee suuria tietomääriä, käsittely yhdellä palvelimella ei ole mahdollista. Ratkaisu on Hadoop-ympäristö, joka on hajautettu laskentaympäristö, joka toimii hyödykelaitteistoilla. Se antaa voiman nopeampaan käsittelyyn useissa solmuissa. (Lisätietoja 7: stä Hadoopista tiedettävää asiaa.)Älä koskaan luota yhteen ainoaan big data -analyysimenetelmään
Markkinoilla on saatavana erilaisia tekniikoita suuren datan käsittelemiseksi. Kaikkien suurten tietotekniikoiden perusta on Apache Hadoop ja MapReduce. Siksi on tärkeää arvioida oikea tekniikka oikeaan tarkoitukseen. Jotkut tärkeistä analyysimenetelmistä ovat ennustava analytiikka, reseptilääkeanalytiikka, tekstianalyysit, virtadatanalytiikka jne. Asianmukaisen menetelmän / lähestymistavan valinta on tärkeää halutun tavoitteen saavuttamiseksi. On parasta välttää luottamista yhteen lähestymistapaan, mutta tutkia erilaisia lähestymistapoja ja valita täydellinen ratkaisu ratkaisuusi.Älä aloita suurta big data -aloitetta ennen kuin olet valmis
Kaikille big data -aloitteille on aina suositeltavaa aloittaa pienillä askeleilla. Joten aloita kokeiluhankkeilla asiantuntemuksen saamiseksi ja siirry sitten varsinaiseen toteutukseen. Suurtietojen potentiaali on erittäin vaikuttava, mutta todellinen arvo voidaan saavuttaa vasta, kun vähentämme virheitämme ja saamme lisää asiantuntemusta.Älä käytä tietoja erikseen
Suuret tietolähteet ovat hajallaan ympäri ja ne kasvavat päivä päivältä. On tärkeää integroida kaikki nämä tiedot oikean analyysituloksen saamiseksi. Markkinoilla on käytettävissä erilaisia työkaluja tietojen integrointiin, mutta ne tulisi arvioida oikein ennen käyttöä. Suurten tietojen integrointi on monimutkainen tehtävä, koska eri lähteistä peräisin olevan tiedon muoto on erilaista, mutta sitä tarvitaan hyvin hyvän analyyttisen tuloksen saamiseksi.Älä sivuuta tietoturvaa
Tietoturva on tärkeä näkökohta suurten tietojen suunnittelussa. Aluksi (ennen minkään käsittelyn suorittamista) tiedot ovat petatavuissa, joten suojausta ei ole toteutettu tiukasti. Mutta jonkin käsittelyn jälkeen saat osajoukon tietoja, jotka tarjoavat jonkinlaisen käsityksen. Tietoturvasta tulee tässä vaiheessa välttämätöntä. Mitä enemmän tietoja käsitellään ja hienosäädetään, sitä arvokkaampana niistä tulee organisaatiolle. Tämä hienosäädetty tulostetieto on immateriaalioikeutta ja se on turvattava. Tietoturva on toteutettava osana suuren datan elinkaarta.Älä unohda isojen tietojen analysoinnin suorituskykyä koskevaa osaa
Big data -analytiikan tuotos on hyödyllinen vain silloin, kun se antaa hyvän suorituskyvyn. Big data tarjoaa enemmän näkemyksiä perustuen valtavan määrän tietojen käsittelyyn nopeammin. Siksi on välttämätöntä hallita sitä tehokkaasti ja toimivasti. Jos suurten tietojen suorituskykyä ei hallita huolellisesti, se aiheuttaa ongelmia ja tekee koko työstä turhaa.
Keskusteluissamme olemme keskittyneet suurten tietojen aloitteiden tekemiseen ja kieltämiseen. Suuret tiedot ovat nouseva alue ja toteutuksen yhteydessä monet yritykset ovat vielä suunnitteluvaiheessa. On tärkeää ymmärtää isojen tietojen parhaat käytännöt riskien ja virheiden minimoimiseksi. Keskustelupisteet on johdettu live-projektikokemuksista, joten se antaa joitain ohjeita isodatastrategian onnistumiseksi.