K:
Mitkä ovat avainkysymykset, jotka on otettava huomioon isojen tietojen tallennusstrategiassa?
V:Yksi suurimmista ongelmista, jota isojen tietojen tallennuksessa ei oteta huomioon, on pääsy sitä tarvitseville ryhmille. Tietoja säilytetään säännöllisesti ilman dokumentaatiota paikoissa, joihin on vaikea päästä käsiksi tai joissa asianomaiset ryhmät eivät tiedä sitä, että niitä on ollenkaan. Viime kädessä suurten tietojen varastoinnissa tulisi noudattaa ensimmäistä avointa strategiaa, jossa joukkueille tiedotetaan sen olemassaolosta, mistä tiedot koostuvat ja miten sitä voidaan käyttää niin, että joukkueet voivat käyttää sitä ohjelmistoon tarvittaessa.
Toinen mielestäni kriittinen ongelma on tallennettavan tiedon laatu. Tiedot on tallennettava korkealaatuisimmassa muodossa, jota se voi olla olemassa lopullisessa tallennuspaikassaan. Heikkolaatuisen datan säilyttäminen tietojärvessä on yleensä hienoa, mutta jatkuessaan tietoputkilinjassa jokaisen vaiheen tulisi parantaa datan laatua siten, että se tallennetaan korkealaatuisimpaan muotoon järjestelmässä, kuten tietovarasto tai analyyttitietokanta. Tämä parantaa niiden järjestelmien laatua, jotka kuluttavat datan lepopaikan.