Koti Trends 6 Suuret myytit suurten tietojen hallinnasta

6 Suuret myytit suurten tietojen hallinnasta

Sisällysluettelo:

Anonim

Forrester Research julkaisi jo toukokuussa 2014 kaksi raporttia, joissa tehtiin tiettyjä johtopäätöksiä suurten tietojen ympäröivästä hypestä. Tutkimusyritys kartoitti yli 250 markkinointi- ja yrityskehitysjohtajaa. Raportin kirjoittajien mukaan suurten tietojen retoriikka on kaikkien aikojen huippua, ja teknologian myyjät mainostavat tuotteita, joiden väitteet näyttävät olevan uskomattomia.


Gartner on samaa mieltä Forrester Researchin kanssa; huomattava hype ympäröi suurta dataa. Syyskuun 2014 raportissa Gartner esittelee viisi suurinta datamytiä, ja Gartner-analyytikot tarjoavat mielipiteensä siitä, mitä iso data ja sen manipulointi ymmärretään väärin. Mitkä ovat big datan suurimpia myyttejä? Katsotaan.

Myytti: Jokainen on edessämme isojen tietojen hyväksymisessä.

Gartnerin mukaan kiinnostus isoihin tietoihin on kaikkien aikojen korkein. Tästä huolimatta vähällä 13 prosentilla kyselyyn käyneistä on toimivia järjestelmiä. Syy: useimpien yritysten ei ole vielä selvitetty, kuinka arvon kaataminen suurista tietovarastoista saadaan. Täällä Gartnerin kysely on optimistisempi kuin Forresterin raportti, jonka mukaan vain 9 prosenttia kyselyyn osallistujista ilmoitti aikovansa ottaa suurten tietojen tekniikat käyttöön seuraavan vuoden aikana. (Suurella datalla on paljon tarjottavaa. Lisätietoja viidestä todellisen maailman ongelmasta, jota Big Data voi ratkaista.)

Myytti: Meillä on niin paljon tietoa; meidän ei tarvitse huolehtia jokaisesta pienestä datavirheestä.

Gartner on huolissaan siitä, mitä meillä ihmisillä on aarteesta: "Meitä on niin paljon, sillä vähän pahalla ei ole väliä." Gednerin varapuheenjohtaja ja arvostettu analyytikko Ted Friedman uskoo, että tämä on väärä tapa tarkastella tilannetta.


"Tosiasiassa, vaikka jokaisella yksittäisellä puutteella on paljon pienempi vaikutus koko tietojoukkoon kuin sillä, kun dataa oli vähemmän, virheitä on enemmän kuin ennen, koska tietoja on enemmän", Friedman sanoi. "Siksi heikkolaatuisen tiedon kokonaisvaikutus koko aineistoon on sama."


Friedman lisää uuden syyn huolestumiseen. Suurten tietojen keruu sisältää usein tietoja yrityksen ulkopuolelta, jonka rakenne ja alkuperä ovat siksi tuntemattomat. Tämä lisää virheiden mahdollisuutta.

Myytti: Iso tietotekniikka poistaa tiedon integroinnin tarpeen.

On olemassa kaksi avaintietoanalyysistrategiaa, joita voidaan soveltaa isoihin tietoihin: "schema on write" tai "schema read". Viime aikoihin asti kirjoitusmalli oli ainoa käytetty menetelmä. Luettu kaavio on nykyinen villitys tietokannan hallinnassa. Toisin kuin kirjoittamisessa käytettävä skeema, joka vaatii jäsennellyn muodon, tiedot ladataan luettavissa oleviin tietokantoihin raakamuodossaan. Sitten kehittäjät - käyttämällä rakenteettomia tietokantaalustoja, kuten Hadoop, taivuttavat erilaiset tiedot käyttökelpoiseen muotoon. Luetulla ohjelmalla on selviä etuja, mutta kuten Gartner mainitsee, tietojen integroinnin on tapahduttava jossain vaiheessa.

Myytti: Tietovaraston käyttäminen edistyneeseen analytiikkaan on turhaa.

Ajan kuluttaminen tietovaraston luomiseen tuntuu turhalta monille tiedonhallinnalle, etenkin kun vastakaapatut tiedot eroavat tietovarastoissa olevista. Gartner varoittaa kuitenkin jälleen, että edistyksellinen data-analytiikka käyttää tietovarastoja ja uutta tietoa, mikä tarkoittaa, että tietointegraattorien on:

  • Tarkenna uusia tietotyyppejä, jotta ne sopivat analysoitavaksi
  • Päätä, mitkä tiedot ovat merkityksellisiä, ja tarvittava tiedon laatu
  • Määritä, kuinka tiedot yhdistetään
  • Ymmärrä, että tietojen tarkentaminen voi tapahtua muissa paikoissa kuin tietovarasto

Myytti: Tietojärvet korvaavat tietovarastot.

Tietojärvet ovat erilaisten tietojen varastot, toisin kuin tietovarastot, joissa tiedot ovat jäsennellyssä muodossa. Datajärven luominen vie vähän etukäteen vaivaa (tietoja ei tarvitse muotoilla) tietovarastoihin verrattuna, minkä vuoksi tietojärvet ovat kiinnostavia.


Gartner painottaa, että datan omaaminen ei ole mielekästä - on helppoa manipuloida kaapattuja tietoja tietoon perustuvan päätöksenteon kannalta. Lisäksi (hieman todistamattomien) tietojärvien käyttö päätöksenteon helpottamiseksi on ongelmallista.


"Tietovarastoilla on jo valmiuksia tukea monenlaisia ​​käyttäjiä koko organisaatiossa", sanoi Gartnerin tutkimusjohtaja Nick Heudecker. "Tietohallinnon johtajien ei tarvitse odottaa, että tietojärvet jäävät kiinni." (Lisätietoja isojen tietojen hyväksymisestä seitsemässä asiossa, jotka sinun on tiedettävä isoista tiedoista ennen hyväksymistä.)

Big Data toimii - uudet tietojenkäsittelymenetelmät eivät välttämättä ole

Syy, jonka mukaan Gartner sanoi "suurimmat datamytit" eikä "suuriadatamyytejä", käy selväksi raportin lukemisen jälkeen. Gartner ei ole tyhjä isoista tiedoista. Gartner on pahoillani niille, jotka kokevat uusimpien isojen tietojen käsittelymenetelmien olevan valmiita "parhaaseen aikaan".

6 Suuret myytit suurten tietojen hallinnasta