Koti Audio Kuinka sql on hadoop auttaa suurianalyysissä?

Kuinka sql on hadoop auttaa suurianalyysissä?

Sisällysluettelo:

Anonim

Hadoopin SQL on ryhmä analyyttisiä sovellustyökaluja, jotka yhdistävät SQL-tyylisen kyselyn ja tietojen käsittelyn viimeisimpiin Hadoop-tietokehyselementteihin. SQL: n esiintyminen Hadoopissa on tärkeä kehitys isojen tietojenkäsittelyn kannalta, koska se antaa laajemmille ihmisryhmille mahdollisuuden työskennellä menestyksekkäästi Hadoopin tietojenkäsittelykehyksen kanssa suorittamalla SQL-kyselyitä Hadoopin käsittelemien valtavien suurten tietojen määrille. Hadoop-kehys ei selvästikään ollut aikaisemmin niin tavoitettavissa ihmisille, etenkin sen kyselyominaisuuksien suhteen. Kehityksen perusteella töissä on ollut useita työkaluja, jotka lupaavat parantaa yritysten tuottavuutta, kun on kyse suurten tietojen käsittelystä ja analysoinnista laadulla ja nopeudella. Työkalun oppimiseen ei myöskään tarvitse investoida paljon, kuten perinteisen SQL-tietämyksen pitäisi tehdä.

Määritelmä SQL Hadoop

Hadoopin SQL on sovellusryhmä, jonka avulla voit suorittaa SQL-tyylisiä kyselyjä Hadoopin tietojenkäsittelykehyksen ylläpitämässä isoissa tiedoissa. Tiedonhaku, haku ja analysointi on selvästi helpottunut lisäämällä SQL Hadoopiin. Koska SQL oli alun perin suunniteltu relaatiotietokantoihin, sitä oli muokattava Hadoop 1 -mallin, joka käsittää MapReduce ja Hadoop Distributed File System (HDFS), ja Hadoop 2 -mallin, jolla ei ole MapReduce- ja HDFS-järjestelmiä.

Yksi varhaisimmista pyrkimyksistä yhdistää SQL Hadoopiin johti Hive-tietovaraston luomiseen HiveQL-ohjelmiston kanssa, joka pystyi kääntämään SQL-tyyliset kyselyt MapReduce-töiksi. Sen jälkeen kehitettiin useita sovelluksia, jotka voisivat tehdä samanlaisia ​​töitä. Myöhempien työkalujen joukossa ovat Drill, BigSQL, HAWQ, Impala, Hadapt, Stinger, H-SQL, Splice Machine, Presto, PolyBase, Spark, JethroData, Shark (Hive on Spark) ja Tez (Hive on Tez).

Kuinka sql on hadoop auttaa suurianalyysissä?