Sisällysluettelo:
Kliininen genomiikka on kiehtova aihe, jossa ihmiset työskentelevät huipputeknologian avulla nopeiden ja tarkkojen tulosten käsittelemiseksi. Markkinoilla on saatavana paljon genomisekvenssejä, ja ne tuottavat sekvenssitietojen petabyyttejä, ja sekvensoinnin lisääntyminen tuottaa dataa eksabyyttejä lähitulevaisuudessa. Täällä Hadoop on täydellinen alusta monimutkaisen genomiikan työnkulun käsittelemiseen. Hadoop voi tallentaa ja lajitella valtavia määriä tietoa ja voi myös tehdä tarkoituksenmukaisia analyysejä. (Saadaksesi kuvan siitä, kuinka paljon tietoa tämä todella tarkoittaa, lue Ymmärtäminen bitteistä, tavuista ja niiden kerrannaisista.)
Genomiikan nykyaika ja tulevaisuus
Nykyään genomikartoitus on saavuttanut kehityksen huipun. Monet genomiikkateollisuuteen liittyvät ihmiset ovat täynnä uteliaisuutta, ja kun uusia mahdollisuuksia esiintyy, parempi tekniikka on tunnin tarve. Genomisekvensointi on erittäin toistuva ja resurssimainen tehtävä. Pelkästään vuonna 2013 tuotettiin noin 15 petatavua dataa, ja vain 2000 sekvensseriä. Tämä leuan pudottava määrä sisälsi 300 kt sekvensoitua ihmisen genomitietoa. Tällä tiedontuotantonopeudella voidaan arvioida, että vuoteen 2018 mennessä tuotetaan noin yksi eksabyytti tietoa. Tämä johtuu sekvenssien kasvusta, jotka tuottavat yhä enemmän dataa ajoa kohden. Toinen syy on erittäin tehokkaiden ja edullisten genomisekvensointikoneiden tulo markkinoille. Vuodesta 2008 näiden koneiden hinta on laskenut tasaisesti. Tämä johtuu voimakkaista seuraavan sukupolven koneista, jotka ovat hieroneet markkinoita.
Genomikartoitusalan tarpeet
Ihmisen genomista kerätyn datan käsittelemiseen käytetään kompleksisia algoritmeja. Sitten nämä tiedot on tallennettava. Sitä voidaan tarkistaa tulevaisuudessa vertailuun alkuperäisiin tietoihin. 100 Gt: n datan käsittely ja tallennus ei ole liian vaikeaa, varsinkin kun teet sen sekvenssikeskuksissa käytettävien tehokkaiden koneiden kanssa. Tutkimukset osoittavat, että tämä tietomäärä voidaan käsitellä vain noin 1 000 suorittimen tunnissa, joten se on erittäin helppoa. Tällä teknisen kehityksen nopeudella on selvää, että genomiteollisuus prosessoi pian tuhansia gigatavuja muutamassa sekunnissa.
