Tekijä Techopedia Staff, 22. kesäkuuta 2016
Takeaway: Isäntä Rebecca Jozwiak keskustelee tietoluetteloiden eduista Dez Blanchfieldin, Robin Bloorin ja David Crawfordin kanssa.
Sinun on ilmoittautunut tapahtumaan nähdäksesi videon. Rekisteröidy nähdäksesi videon.
Rebecca Jozwiak: Hyvät naiset ja herrat, hei ja tervetuloa vuoden 2016 kuumaan teknologiaan. Tänään meillä on ”Ehdotuksen voima: Kuinka tietokatalogi antaa analyytikoille mahdollisuuden.” Olen isäntäsi Rebecca Jozwiak, täyttäen tavallisen isäntämme Ericin. Kavanagh tänään, kun hän matkustaa maailmaa, joten kiitos liittymisestämme. Tämä vuosi on kuuma, se ei ole vain kuuma Texasissa, missä olen, mutta se on kuuma kaikkialla. Kaikkien uusien tekniikoiden räjähdys tulee ulos. Meillä on Internet, tiedon suoratoisto, pilvien omaksuminen, Hadoop jatkaa kypsymistään ja omaksumistaan. Meillä on automaatio, koneoppiminen, ja kaikki nämä asiat tietysti korostavat tietoja. Ja yrityksistä tulee yhä enemmän datan ohjaamia päivä. Ja tietysti sen tarkoitus on johtaa tietoon ja löytöihin ja, tiedätte, tehdä parempia päätöksiä. Mutta jotta datasta saadaan parhaiten hyötyä, siihen on oltava helppo päästä. Jos pidät sen lukittuna tai haudattuna tai muutaman yrityksen aivoissa, se ei auta paljoa hyötyä koko yritykselle.
Ja ajattelin tavallaan tietojen luettelointia ja ajattelin tietenkin kirjastoja, missä kauan sitten sinne menit, jos tarvitsit löytää jotain, jos tarvitsit tutkia aihetta tai etsiä joitain tietoja, menit kirjastoon, ja tietysti menit korttiluetteloon tai siellä työskennellyt harhainen nainen. Mutta hauskaa oli myös vaeltaa ympäriinsä, jos vain halusit katsoa, ja varmasti saatat löytää vain jotain siistiä, saatat löytää mielenkiintoisia tosiasioita, joita et tiennyt, mutta jos todella tarvitsit löytää jotain, ja tiesit mitä etsit, tarvitsit korttiluetteloa, ja tietysti yrityksen vastine on tietoluettelo, joka voi auttaa valaista kaikkia tietoja käyttäjillemme rikastuttamaan, löytämään, jakamaan, kuluttamaan ja todella auttamaan ihmiset pääsevät tietoihin nopeammin ja helpommin.
Joten tänään meillä on oma datatieteilijämme Dez Blanchfield, ja meillä on tohtori Robin Bloor, oma pääanalyytikkomme, meillä on David Crawford Alationista, joka aikoo puhua hänen yrityksensä tietokatalogista, mutta ensin aiomme johtaa Dezin kanssa. Dez, välitän pallon sinulle ja lattia on sinun.
Dez Blanchfield: Kiitos, kiitos siitä, että minulla on tänään. Tämä on asia, josta olen erittäin kiinnostunut, koska melkein jokaisessa organisaatiossa, jonka kanssa törmännyt päivittäisessä työssäni, löydäen täsmälleen saman aiheen, josta puhuimme hyvin lyhyesti esittelyä edeltävässä juhlissa, ja se on se, että Useimmissa organisaatioissa, jotka ovat toimineet liike-elämässä yli muutaman vuoden, on lukuisia tietoja haudattuja organisaation ympärille, erilaisia muotoja, ja itse asiassa minulla on asiakkaita, joilla on tietojoukkoja, jotka palaavat Lotus Notesiin, tietokantoihin, jotka ovat edelleen käytössä joissakin tapauksissa pseudo-internetoituneina, ja he kaikki joutuvat vastaamaan tähän haasteeseen löytääkseen todellisen sijaintinsa siitä, missä heidän tietonsa ovat ja miten päästä siihen tietoon, kuka antaa pääsyn siihen, milloin antaa pääsyn niihin ja kuinka ja miten luettelo ja kuinka saada se paikkaan, jossa kaikki voivat: A) olla tietoinen siitä, mitä siellä on ja mitä siinä on, ja B) miten päästä siihen käyttöön ja käyttää sitä. Ja yksi suurimmista haasteista on tietysti sen löytäminen, toinen iso haaste on tietää, mitä siellä on ja kuinka päästä siihen.
Ehkäpä tiedän, että minulla on kymmeniä tietokantoja, mutta en oikeastaan tiedä mitä siellä on tai kuinka selvittää mitä siellä on, ja niin aina, kun löydämme nyt esityksen esitiedoista, olet taipuvainen kävellä ympäri toimistoa ja kysyä kysymyksiä ja huutaa kuutiomaisten seinien läpi ja yrittää selvittää. Usein kokemukseni on, että saatat jopa löytää vaeltavasi vastaanotosta, vastaanotosta ja kysyä, tietääkö kukaan aiot mennä puhumaan. Melko usein, se ei ole aina IT-ihmisiä, koska he eivät ole tietoisia tietojoukosta, koska joku on juuri luonut sen, ja se voi olla jotain yksinkertaista - melko usein löydämme jonkinlaisen projektin, joka seisoo IT-ympäristössä ja projektipäällikkö on käyttänyt laskentataulukoita kaikista asioista, ja se on saanut valtavan määrän arvokasta tietoa omaisuuden, kontekstin ja nimien ympärille. Ellet tiedä sitä hanketta ja tunnet sitä henkilöä, et vain löydä sitä tietoa. Sitä ei vain ole saatavana, ja sinun täytyy hankkia alkuperäinen tiedosto.
On lause, jota on lyöty tietojen suhteen, enkä välttämättä ole sitä samaa mieltä, mutta mielestäni se on söpö pieni heittäjä ja se on, että tietty määrä ihmisiä ajattelee, että data on uusi öljy, ja olen varmasti, että aiomme käsitellä tätä myös jostakin näkökulmasta, myöhemmin tänään. Mutta olen huomannut, että olen varmasti osa tätä muutosta, että yrityksiä edustavat organisaatiot, jotka ovat oppineet arvostamaan tietojaan, ovat saaneet merkittävän edun kilpailijoihinsa nähden.
IBM julkaisi mielenkiintoisen paperin, noin viisi tai kuusi vuotta sitten, ja he kartoittivat noin 4 000 yritystä täällä Australiassa. He ottivat kaikki tiedot, kaikki suoritustiedot, kaikki rahoitustiedot ja kokosivat kiehuvaan astiaan ja sitten lähetti sen Australian kauppakorkeakoululle, ja he todella aloittivat täällä yhteisen suuntauksen, ja se oli, että tekniikkaa hyödyntäneet yritykset saavuttivat aina sellaisen kilpailuedun vertailukumppaneihinsa ja sinänsä kilpailijoihinsa nähden, että heidän kilpailijansa melkein koskaan eivät saa kiinni, ja uskon se on hyvin tilanne nyt tietojen kanssa, jotka olemme nähneet, mitä ihmiset kutsuvat digitaalimuutokseksi, jossa organisaatiot, jotka ovat selvästi tajunnut kuinka löytää saamansa tiedot, saattaa nämä tiedot saataville ja asettaa ne saataville erittäin helpoissa kulutuskuluissa Muodosta organisaatiolle välttämättä aina tietämättä miksi organisaatio tarvitsee sitä, ja saa huomattavaa etua kilpailijoihin nähden.
Minulla on pari esimerkkiä tästä diasta, jotka voit nähdä. Yksi rivini on, että laajamittainen häiriö melkein kaikilla toimialoilla, mielestäni, perustuu tietoihin, ja jos nykyisillä suuntauksilla on jotain mennä eteenpäin, mielestäni olemme vain todella saaneet aloitettiin, koska kun pitkät tuotemerkit herättävät vihdoin mitä tämä tarkoittaa ja osallistuvat peliin, he tulevat peliin tukkukaupassa. Kun eräänlaiset suuret vähittäiskauppiaat, joilla on paljon vuoria, alkavat soveltaa historiallista analyysiä tietoihin, jos he jopa tietävät sen olevan olemassa, jotkut online-pelaajista saavat vähän herätyksen.
Mutta useimpien näiden merkkien kanssa tarkoitan, että meillä on Uber, jotka ovat maailman suurin taksiyhtiö. Heillä ei ole takseja, joten mikä tekee heistä taikuutta, mitä heidän tietojaan on? Airbnb, suurin majoituspalvelujen tarjoaja, meillä on maailman suurin puhelinyhtiö WeChat, mutta heillä ei ole todellista infrastruktuuria eikä puhelimia eikä puhelinlinjoja. Alibaba, planeetan suurin jälleenmyyjä, mutta he eivät omista mitään mainosjakaumaa. Facebook, sanan suurin mediayhtiö. Mielestäni viimeisimmässä lukemassa heillä oli nyt 1, 4 miljardia aktiivista tiedon käyttäjää, mikä on mielestäni ajatteleva numero. Se ei ole missään lähellä - luulen, että joku väitti, että neljäsosa planeetasta on todella siellä päivittäin, ja silti tässä on sisällöntuottaja, joka ei itse luo sisältöä, kaikki heidän tarjoamansa tiedot eivät ole heidän luomiaan, se on luotu niiden tilaajien toimesta, ja me kaikki tiedämme tämän mallin.
SocietyOne, josta olet ehkä kuullut, se on paikallinen tuotemerkki, mielestäni parissa maassa se on pankki, joka tosiasiallisesti vertaa vertaisverkon kautta, joten toisin sanoen sillä ei ole rahaa. Ainoa se on, että se hallinnoi tapahtumia ja tiedot istuvat sen alla. Netflix, olemme kaikki hyvin, hyvin perehtyneitä siihen. Täällä on mielenkiintoinen linja-auto. Kun Netflixiä voitiin laillisesti käyttää Australiassa, kun se virallisesti ilmoitettiin, sinun ei tarvinnut käyttää VPN: tä päästäkseen siihen, monet ihmiset ympäri maailmaa yleensä - jos et pääse siihen lähialueellasi. - Kun Netfix avattiin Australiassa, se lisäsi Internet-linkkidemme kansainvälistä kaistanleveyttä 40 prosentilla, joten melkein kaksinkertaistui Australian Internetin käyttö yön yli, vain yhdellä sovelluksella, yhdellä pilvi-isännöidyllä sovelluksella, joka ei tee muuta kuin pelaa dataa. Se on vain mielenkiintoista tilastoa.
Ja tietenkin, me kaikki olemme tuttuja Applelle ja Googlelle, mutta nämä ovat maailman suurimmat ohjelmistoyritykset, mutta he eivät itse kirjoita sovelluksia. Mikä on johdonmukaista kaikkien näiden organisaatioiden kanssa? No, se on tietoa, ja he eivät päässeet sinne, koska he eivät tienneet missä heidän tietonsa olivat, eivätkä he osaa luetteloida sitä.
Nyt havaitsemme, että on olemassa tämä kokonaan uusi omaisuusluokka, jota kutsutaan dataksi, ja yritykset heräävät sitä. Mutta heillä ei aina ole työkaluja, taitotietoa ja miksi kaiken tämän tiedon kartoittamiseen, kaikkien tietojen luettelointiin ja asettamiseen saataville, mutta olemme havainneet, että yritykset, joilla ei juuri ole fyysistä omaisuutta, ovat saaneet korkean markkina-arvon kirjaa aika tämän uuden tietovarastoluokan kautta. Kuten olen sanonut, jotkut vanhat pelaajat herättävät nyt tätä ja tuovat sen varmasti esiin.
Olen suuri fani siitä, että otan kansanmiehiä vähän matkalta, joten kahdeksantoista sata, kahdeksantoista sata, ja sinun tulee olla enemmän kuin tuntea tämä Yhdysvaltain markkinoilla, kävi ilmi, että suorittaalaskenta Joka vuosi tai niin, luulen, että he suorittivat ne kymmenen vuoden välein siinä vaiheessa, mutta jos aiot suorittaa väestölaskennan vuosittain, tietojen analysointi voi kestää jopa kahdeksan tai yhdeksän vuotta. Kävi ilmi, että kyseinen tietojoukko jätettiin sitten laatikoihin paikoin paperiin, ja melkein kukaan ei löytänyt sitä. He vain jatkoivat näiden raporttien levittämistä, mutta tosiasiallisia tietoja oli erittäin vaikea saada, meillä on samanlainen tilanne toisen maailman merkityksellisen hetken kanssa, 1940-luvun lopulla, toisen maailmansodan kanssa, ja tämä asia on Bletchley Park Bombe kirjoitti BOMBE, ja se oli massiivinen, numeroita murskaava analyyttinen työkalu, joka meni pienten tietojoukkojen läpi ja löytäisi niistä signaaleja, ja jota voitaisiin käyttää murtamaan koodeja Enigman kautta.
Tämä asia taas oli pohjimmiltaan laite, joka oli suunniteltu, ei paljon luetteloimiseksi, vaan tietojen merkitsemiseksi ja kartoittamiseksi, ja sen avulla on mahdollista ottaa kuvioita ja löytää niitä tietojoukkojen sisäpuolelta, tässä tapauksessa murtaa koodeja, löytää avaimia ja lauseita ja löytää ne säännöllisesti tietojoukkoissa, ja siten olemme käyneet läpi tämän matkan löytää asioita tiedoista ja johtaa tietojen luettelointiin.
Ja sitten nämä asiat tulivat, nämä massiiviset edulliset telineet, aivan hyllyltä. Ja teimme joitain erittäin mielenkiintoisia asioita, ja yksi niistä, mitä teimme heidän kanssaan, on rakennettu erittäin edullisia klustereita, jotka voisivat aloittaa planeetan indeksoinnin, ja erittäin kuuluisasti nämä suuret tuotemerkit, jotka ovat tulleet ja menneet, mutta luultavasti Googlen yleisin koti tuotemerkki, josta olemme kaikki kuulleet - siitä on tullut todellinen verbi, ja tiedät, että onnistut, kun brändistäsi tulee verbi. Mutta mitä Google opetti meille ymmärtämättä sitä, mahdollisesti yritysmaailmassa, on se, että he pystyivät indeksoimaan koko planeetan tietylle tasolle ja luetteloimaan ympäri maailmaa olevat tiedot ja asettamaan sen saataville erittäin helposti, kätevä muoto pienessä pienimuotoisessa yhden rivin kaavassa, verkkosivu, jossa ei ole mitään, ja kirjoitat kyselyn, se menee ja löytää sen, koska he olivat jo indeksoineet planeetan, indeksoineet sen ja tehneet sen helposti saataville.
Ja mitä huomasimme, oli: ”No niin kiinni, emme tee tätä organisaatioissa - miksi niin? Miksi meillä on organisaatio, joka pystyy kartoittamaan koko planeetan ja indeksoimaan sen, indeksoimaan ja indeksoimaan sen ja asettaa sen saataville, voimme etsiä sitä ja napsauttaa sitten mennä -painiketta ja löytää sen, miten me tulemme et ole tehnyt niin sisäisesti? ”Joten ympäri maailmaa on nyt paljon näitä pieniä konehyllyjä, jotka tekevät niin intranetille ja löytävät asioita, mutta ne ovat todellakin vain tarttumassa ajatukseen mennä perinteisen verkon ulkopuolelle. sivua tai tiedostopalvelinta.
Sen sijaan, että kirjoittaisimme tämän seuraavan sukupolven tietokatalogin monella tapaa, tietojen käytön löytäminen post-it-muistiinpanojen ja vesijäähdyttimien kautta käytävien keskustelujen avulla ei ole oikeasti enää sopiva menetelmä tietojen löytämiseen ja luettelointiin, ja itse asiassa en usko, että koskaan todella oli. Emme voi enää johtaa koko haastetta ihmisille, jotka vain lähettävät muistiinpanoja, lähettävät muistiinpanoja ja keskustelevat siitä. Olemme hyvin ja todella alueen ulkopuolella, jolla tämä seuraavan sukupolven lähestymistapa tietojen luettelointiin on tullut ja mennyt. Meidän on saatava aseemme sen ympärille. Jos tämä olisi helppo kysymys, olisimme jo ratkaisseet sen monin tavoin aikaisemmin, mutta mielestäni se ei ole helppo asia, datan indeksointi ja soittaminen on vain yksi osa sitä, tiedämme mitä tiedoissa on ja rakentamalla metatiedot havaitsemiemme ympärille ja asettamalla ne sitten saataville helposti, kulutuskelpoisessa muodossa, etenkin itsepalvelulle ja analytiikalle. Se on edelleen ratkaistava ongelma, mutta palapelin monet osat viidessä vuodessa ovat hyvin ja todella ratkaistuja ja saatavissa.
Kuten tiedämme, ihmisten tietojen luettelointi on epäonnistumisen resepti, koska inhimilliset virheet ovat yksi suurimmista painajaisista, joita käsittelemme tietojenkäsittelyssä, ja puhun säännöllisesti tästä aiheesta, jossa mielestäni ihmisten paperilomakkeiden täyttäminen on todennäköisesti suurin painajainen käsittelemme isoa dataa ja analytiikkaa, jotta joudumme jatkuvasti korjaamaan tekemänsä asiat, jopa yksinkertaisiin asioihin, kuten päivämääriin ja kenttiin, ihmisten asettaessa sen väärään muotoon.
Mutta kuten olen sanonut, olemme nähneet Internet-hakukoneiden indeksoivan maailmaa joka päivä, joten ajattelemme nyt ajatusta, että se voidaan tehdä yritystietosarjoille löytöprosessissa, ja työkalut ja järjestelmät ovat nyt helposti saatavilla, kun aiot oppia tänään. Joten temppu, mielestäni todellakin, on oikeiden työkalujen valinta, parhaimmat työkalut työhön. Ja sopivimmin sen lisäksi, että löydät oikean osan siitä, jotta pääset alkuun tällä tiellä. Ja uskon, että kuulemme siitä tänään, mutta ennen kuin teemme sen, aion siirtyä yliopistolleni Robin Bloorille ja kuulla hänen ottavansa aiheeseen. Robin, voinko siirtää sinulle?
Robin Bloor: Kyllä, voit todella. Katsotaan, toimiiko tämä, niin kyllä, se toimii. Okei, tulen toisesta suunnasta kuin Dez todella, mutta päädyn samaan paikkaan. Kyse on yhteyden muodostamisesta tietoihin, joten ajattelin vain käyvän läpi tiedonsiirtoon liittyvän todellisuuden, kohta kerrallaan.
On tosiasia, että tiedot ovat pirstoutuneempia kuin koskaan. Tietomäärä kasvaa ilmiömäisesti, mutta tosiasiassa myös eri tietolähteet kasvavat uskomattoman vauhdilla, ja siksi tiedot pirstoutuvat koko ajan. Mutta etenkin analytiikkasovellusten takia - mutta ne eivät ole ainoita sovelluksia - meillä on todella hyvä syy yhdistää kaikki nämä tiedot, joten olemme jumissa vaikeassa paikassa, olemme jumissa pirstoutuneiden tietojen maailmassa, ja tiedoissa on mahdollisuus, kun Dez kutsui sitä, uutta öljyä.
Tietoja, hyvin, se oli tapana elää pyörivällä levyllä, joko tiedostojärjestelmissä tai tietokannoissa. Nyt se elää paljon monipuolisemmassa ympäristössä, se elää tiedostojärjestelmissä, mutta elää nykyään myös Hadoop-tapauksissa tai jopa Spark-tapauksissa. Se elää useissa lajeissa tietokantoja. Ei niin kauan sitten, standardoimme jonkin verran relaatiotietokannan, ja tiedätkö, että se on kulunut ikkunasta viimeisen viiden vuoden aikana, koska on olemassa asiakirjatietokantoja ja graafisia tietokantoja, joten tiedät, että pelillä on muuttunut. Joten se asui pyörivällä levyllä, mutta elää nyt SSD: llä. Viimeisin määrä SSD - ehdottomasti viimeisin SSD-yksikkö on tulossa Samsung - kaksikymmentä gigatavua, mikä on valtava. Nyt se elää muistissa siinä mielessä, että tietojen tärkein kopio voi olla muistissa eikä levyllä. Meillä ei ollut tapana rakentaa sellaisia järjestelmiä; teemme nyt. Ja se elää pilvessä. Mikä tarkoittaa, että se voi elää missä tahansa näistä asioista, pilvessä. Et välttämättä tiedä missä pilvi on, sinulla on vain sen osoite.
Hadoop on toistaiseksi epäonnistunut vain kootakseen kohtaan pisteen laajennettavana tietovarastona. Olimme toivoneet, että siitä tulee laajennettavissa oleva tietovarasto, ja siitä tulee vain yksi tiedostojärjestelmä kaikelle, ja niin se olisi - sateenkaarit ilmestyisivät taivaalle pohjimmiltaan ja yksisarviset tanssisivat ympäriinsä, eikä mitään sellaista tapahtunut. Mikä tarkoittaa, että joudumme lopulta tietoliikenneongelmaan, eikä tiedonsiirtoon ole toisinaan tarvetta, mutta se on myös vaikeus. Tiedot todellakin ovat painovoimaisia nykyään, kun olet jo päässyt monen teratavun dataan, poiminnasta ja heittämisestä ympärilleen, se aiheuttaa latenssien esiintymisen verkossa tai näkymisen eri paikoissa. Jos haluat siirtää tietoja ympäri, ajoitus on tekijä. Nykyään melkein aina on joitain rajoituksia, kuinka paljon aikaa sinulla on yhden asiakirjan, yhden tiedon hankkimisesta paikasta toiseen. Aikaisemmin ajattelimme eräikkunoina, kun kone oli tavallaan tyhjäkäynnillä, ja riippumatta siitä, kuinka paljon dataa sinulla oli, voit vain heittää sen ympäri ja kaikki toimisi. No, se on mennyt, elämme paljon enemmän reaaliaikaisessa maailmassa. Siksi ajoitus on tekijä. Heti kun haluat siirtää tietoja, joten jos tiedoissa on painovoimaa, et todennäköisesti voi siirtää niitä.
Tietojen hallinta on tekijä siinä mielessä, että olet tosiasiallisesti joutunut hallitsemaan kaikkia näitä tietoja, et saa sitä ilmaiseksi, ja replikointi voi olla tarpeen, jotta tiedot saadaan tosiasiassa suorittamaan tarvittava työ, koska se ei välttämättä ole minne tahansa olet pannut. Sillä ei ehkä ole riittäviä resursseja tietojen normaalin käsittelyn suorittamiseksi. Joten tiedot replikoituvat ja tiedot replikoituvat enemmän kuin voisit kuvitella. Luulen, että joku kertoi minulle jo kauan sitten, että keskimääräinen tieto toistetaan ainakin kaksi ja puoli kertaa. ESB tai Kafka tarjoavat vaihtoehdon tiedonkululle, mutta nykyään se vaatii arkkitehtuuria. Nykyään sinun on todella mietittävä tavalla tai toisella sitä, mitä tietojen heittäminen tosiasiallisesti tarkoittaa. Siksi tietojen käyttö siellä missä se on, on yleensä parempi, kunhan tietysti voit saada tarvitsemasi suorituskyvyn, kun tosiasiallisesti etsit tietoja ja se riippuu asiayhteydestä. Joten tilanne on joka tapauksessa vaikea. Tietokyselyjen suhteen meillä oli tapana ajatella SQL: tä. Olemme nyt tulleet oikein kyselyiden eri muotoihin, SQL kyllä, mutta vierekkäiset, myös graafiset kyselyt, Spark on vain yksi esimerkki tekemällä kuvaajaa, koska myös meidän on tehtävä tekstihakua enemmän kuin koskaan ennen, myös regex-tyyppisiä hakuja, mikä on todella monimutkaista kuvioiden etsintää ja aitoa kuvioiden yhteensovittamista, kaikki nämä asiat todella kuplivat. Ja ne kaikki ovat hyödyllisiä, koska ne antavat sinulle mitä etsit, tai he voivat saada sinut mitä etsit.
Nyt päivät sisältävät kyselyt kattavat useita tietoja, joten se ei aina tehnyt niin, ja usein suorituskyky on kauhistuttava, jos teet niin. Joten, se riippuu olosuhteista, mutta ihmiset odottavat kykenevänsä kysymään tietoja useista tietolähteistä, joten tietyn tyyppisten tietojen yhdistäminen on yhä ajankohtaisempaa. Tietojen virtualisointi, joka on erilainen tapa tehdä se suorituskyvystä riippuen, on myös erittäin yleinen. Tietokyselyt ovat itse asiassa osa prosessia, ei koko prosessia. On vain syytä huomauttaa, että jos tarkastellaan tosiasiallisesti analytiikan suorituskykyä, todellinen analysointi voi viedä kauhean paljon kauemmin kuin tiedonkeruu, koska se riippuu olosuhteista, mutta tietokyselyt ovat ehdottoman välttämättömiä, jos haluat tehdä tällainen analyysi useilla tietolähteillä, ja se vain, sinun on todellakin oltava ominaisuuksia, jotka kattavat.
Joten luetteloista. Luettelot ovat olemassa syystä, ainakin sanomme, että tiedätkö, että meillä on hakemistoja ja skeemoja tietokannoissa, ja meillä on jokainen luettelo ja missä tahansa menetkin, löydät yhden paikan ja sitten todella huomaa, että siellä on jonkinlainen luettelo, ja yhtenäinen globaali luettelo on selvästi hyvä idea. Mutta hyvin harvoilla yrityksillä on sellainen asia. Muistan, että vuonna 2000 - kaksituhatta paniikkia - muistan, että kommunistit eivät edes pystyneet selvittämään, kuinka monta suoritettavissa olevaa ohjelmaa heillä olivat, vaikka et ajattelekaan kuinka monta erilaista tietovarastoa heillä oli, ja todennäköisesti tilanne on nyt, tiedät, että useimmat yritykset eivät tiedä aktiivisesti globaalisti, mitä tietoja heillä on. Mutta tietysti on yhä tarpeellisempaa saada globaali luettelo tai ainakin olla kokonaisvaltainen kuva siitä, mitä tapahtuu tietolähteiden kasvun ja sovellusten jatkuvan kasvun vuoksi, ja se on erityisen välttämätöntä analyysille, koska sinäkin yhdellä tavalla, ja täällä on muitakin kysymyksiä, kuten sukulaisuus ja dataongelmat, ja se on välttämätöntä turvallisuudelle, monille tiedonhallinnan näkökohdille, jos et todella tiedä mitä tietojasi sinulla on, idea että aiot hallita sitä, on vain järjetöntä. Joten se, että kaikki tiedot on luetteloitu jollain tavalla, on vain tosiasia. Kysymys on, onko luettelo johdonmukainen, ja oikeasti mitä voit tehdä sillä. Joten siirron takaisin Rebeccaan.
Rebecca Jozwiak: Okei, kiitos Robinille. Seuraavaksi meillä on David Crawford Alationista, David aion mennä eteenpäin ja välittää pallon sinulle, ja voit ottaa sen pois.
David Crawford: Kiitos paljon. Arvostan todellakin, että olette minua tässä näyttelyssä. Luulen aloittavani tämän, joten uskon, että tehtäväni tässä on ottaa osa tästä teoriasta ja nähdä, kuinka sitä todella sovelletaan ja tulokset, joita pystymme ajamaan todellisten asiakkaiden kohdalla ja niin näet muutama dioilla, haluan puhua siitä, mitä tuloksia voimme nähdä analyyttisissä mahdollisesti parannuksissa. Joten keskustelun motivoimiseksi aiomme puhua siitä, kuinka he pääsivät sinne. Joten olen onnekas pääsemään työskentelemään melko läheisessä yhteistyössä useiden todella älykkäiden ihmisten, näiden asiakkaiden kanssa, ja haluan vain tuoda esiin muutaman, jotka ovat pystyneet mittaamaan, ja puhumaan siitä, kuinka tietokatalogi on vaikuttanut heidän analyytikkoonsa työnkulku. Ja vain pysyäkseni lyhyen eturintaman mielestäni yksi asioista, joita näemme muuttuvan, sisältäen tietokatalogi jaet aiempien välittämien ratkaisujen kanssa ja yksi tapa, jolla suhteet todella ajattelevat kokoamiamme ratkaisuja, on aloittaa analyytikoilta ja työskentele taaksepäin. Sanotaan, että tehdään tämä analyytikoiden tuottavuuden mahdollistamiseksi. Toisin kuin pelkkä noudattaminen tai pelkkä inventaarion luominen, olemme tekemässä työkalua, joka tekee analyytikoista tuottavampia.
Joten kun puhun tietoteknikon kanssa rahoituspalveluyrityksellä Square, siellä on kaveri Nick, joka kertoi meille kuinka hänen, hänellä kului useita tunteja löytää oikea tietojoukko raportin aloittamiseen, nyt hän voi tee se muutamassa sekunnissa käyttämällä hakua markkinaosuudella, keskustelemme heidän CTO: nsa kanssa, joka veti hänen analyytikoitaan, jotka käyttivät Square: ta, anteeksi, käytti Alaa, saadakseen selville, mitä heidän, minkälaisia etuja he näkivät, ja he ilmoittivat 50 Prosenttiosuus tuottavuuden lisäämiselle, ja koska yhdellä maailman parhaista jälleenmyyjistä, eBayssa, heillä on yli tuhat ihmistä, jotka tekevät säännöllisesti SQL-analyysejä, ja työskentelen melko läheisesti Deb Saysin kanssa, joka on projekti tietovälinetyöryhmän päällikkö, ja hän huomasi, että kun kyselyt hyväksyvät Alaation, hyväksyvät luettelon, he näkevät kaksinkertaisen nopeuden kirjoittaa uusia kyselyitä tietokantaa vastaan.
Joten nämä ovat todellisia tuloksia, nämä ovat ihmisiä, jotka tosiasiallisesti soveltavat luetteloa organisaatiossaan, ja haluan opastaa sinut läpi mitä tarvitaan perustamiseen. Kuinka luettelo vakiintuu yritykseen, ja ehkä tärkeintä sanoa, että suuri osa siitä tapahtuu automaattisesti, joten Dez puhui järjestelmistä, järjestelmien oppimisesta, ja juuri se moderni tietokatalogi tekee. Joten he asentavat Alation-tietokeskukseensa ja yhdistävät sen sitten dataympäristön eri metatietojen lähteisiin. Keskityn vähän tietokantoihin ja BI-työkaluihin - molemmista näistä puretaan teknisiä metatietoja, pohjimmiltaan siitä, mitä on olemassa. Eikä, niin mitkä pöydät? Mitä raportteja? Mitkä ovat raportin määritelmät? Joten he purkavat kyseisen teknisen metatiedon, ja luettelosivu luodaan automaattisesti jokaiselle näiden järjestelmien sisällä olevalle objektille, ja sitten he myös purkaavat ja kerrostavat kyseisen teknisen metatiedon päälle, kerroittavat käyttödatan päälle. Se tehdään pääasiassa lukemalla kyselylokeja tietokannasta, ja tämä on todella mielenkiintoinen tietolähde. Joten aina, kun analyytikko kirjoittaa kyselyn, aina kun raportointityökalu on riippumatta siitä, onko se kotikasvatettu vai hyllyltä, suorittaako raportointityökalu kyselyn kojetaulun päivittämiseksi, kun sovellus suorittaa kyselyn tietojen lisäämiseksi toimimaan tietojoukko - kaikki nämä asiat tallennetaan tietokantakyselylokeihin. Onko sinulla luetteloa vai ei, ne tallennetaan kyselylokiin tietokannan kanssa. Mitä tietokatalogi voi tehdä, ja etenkin mitä Alation-katalogi voi tehdä, lue nämä lokit, kysy niiden sisällä olevat kyselyt ja luo todella mielenkiintoinen käyttökaavio näihin lokiin perustuen, ja otamme sen käyttöön tiedottaakseen tuleville käyttäjille tietoja siitä, kuinka tietojen aiemmat käyttäjät ovat käyttäneet sitä.
Joten tuomme kaiken tämän tiedon yhteen luetteloon, ja vain tämän tyyppiseksi tekemiseksi, nämä ovat integraatiot, jotka on jo asennettu asiakkaille, joten olemme nähneet Oracle, Teradata, Redshift, Vertica ja joukon muita relaatiotietokannat. Hadoopin maailmassa Hadoopilla on valikoima SQL-tyyppejä, eräänlainen relaatio-, meta-kauppoja Hadoop-tiedostojärjestelmän, Impala, Tez, Presto ja Hive päälle, olemme nähneet menestystä myös pilvipalvelun Hadoopin yksityisten palveluntarjoajien, kuten Altiscalen, kanssa ja me ovat myös pystyneet muodostamaan yhteyden Tableau-palvelimiin, MicroStrategy-palvelimiin ja indeksoimaan siellä olevat kojetaulut, samoin kuin integroinnit datatieteen kartoitustyökaluihin, kuten Plotly.
Joten, olemme yhteydessä kaikkiin näihin järjestelmiin, olemme yhdistäneet nämä järjestelmät asiakkaisiin, olemme vetäneet sisään teknisiä metatietoja, olemme vetäneet käyttötiedot ja lajittelimme automaattisesti tietokatalyysin, mutta tällä tavalla me keskittää tiedon, mutta pelkästään asioiden keskittäminen tietoluetteloon ei sinällään tarjoa niille todella upeita tuottavuuden parannuksia, joista olemme puhuneet eBayn, Squaren ja markkinaosuuden kanssa. Jotta voimme tehdä niin, meidän on itse asiassa muutettava tapaa, jolla ajattelemme tiedon toimittamista analyytikoille. Yksi niistä kysymyksistä, joita he kysyvät valmistautuakseen tähän, oli ”Kuinka luettelo todella vaikuttaa analyytikon työnkulkuun?”
Siihen me vietämme koko päivän ajatellessamme, ja puhuaksesi tästä ajattelun muutoksesta, joka koskee push-säkeitä pull-mallissa, halusin tehdä nopean analogisen kuvan siitä, millainen maailma oli ennen ja jälkeen lukemisen Kindlessa. Joten se on vain kokemus, joka joillakin toisilla saattaa olla, kun luet fyysistä kirjaa, törmänät sanaan, et ole varma, että tiedät sanan määritelmän erittäin hyvin, voit arvata sen kontekstin perusteella, ei niin todennäköisesti, että sinä aiomme nousta sohvalta, kävellä kirjahyllyllesi, löytää sanakirjasi, pölyttää sen ja kääntyä oikeaan paikkaan aakkosellisessa sanaluettelossa varmistaaksesi, että kyllä, sinulla oli tämä määritelmä aivan oikein, ja tiedät sen vivahteet. Joten sitä ei oikeastaan tapahdu. Joten ostat Kindle-sovelluksen ja alat lukea kirjoja siellä, ja näet sanan, josta et ole täysin varma, ja kosketat sanaa. Yhtäkkiä, aivan samassa näytössä, on sanan sanakirjan määritelmä kaikilla sen vivahteilla, erilaisilla esimerkkikäytöksillä, pyyhkäisemällä hiukan, ja saat Wikipedia-artikkelin aiheesta, pyyhkäise taas, saat käännöstyökalun, joka pystyy kääntämään sen muille kielille tai muille kielille, ja yhtäkkiä kielitaidosi on paljon rikkaampi, ja se tapahtuu vain hämmästyttävän monta kertaa verrattuna siihen, kun piti käydä ja vedä se resurssi itsellesi.
Joten aion väittää, että analyytikon työnkulku ja tapa, jolla analyytikko käsittelee tietodokumentaatiota, on oikeastaan hyvin samanlainen kuin miten lukija toimii vuorovaikutuksessa sanakirjan kanssa, onko se fyysinen, tai vaikka Kindle, ja niin me, tapa, jolla näimme tämän tuottavuuden lisääntymisen, olemme tyhjentämässä luetteloa, vaan yhdistämällä se analyytikon työnkulkuun, ja niin he ovat pyytäneet minua tekemään demo täällä, ja haluan tämän esityksen painopisteeksi. Mutta haluan vain luoda demon kontekstin. Kun ajattelemme tietojen siirtämistä käyttäjille, kun he tarvitsevat sitä, ajattelemme oikea paikka tehdä se, paikka, jossa he viettävät aikansa ja missä he tekevät analyysejä, on SQL-kyselytyökalu. Paikka, jossa kirjoitat ja suoritat SQL-kyselyjä. Ja niin me rakensimme yhden ja rakensimme sen, ja asia, joka todella eroaa siitä muista kyselytyökaluista, on sen syvä integraatio tietoluetteloon.
Joten kyselytyökalumme on nimeltään Alation Compose. Se on verkkopohjainen kyselytyökalu, jonka näytän sinulle sekunnissa. Verkkopohjainen kyselytyökalu, joka toimii kaikissa niistä tietokannan logoista, jotka näit edellisessä diassa. Yritän erityisesti demonstroida tapaa, jolla luettelotiedot tulevat käyttäjille. Ja se tekee sen näillä kolmella eri tavalla. Se tekee sen interventioiden avulla, ja silloin joku, joka on tietojen pääkäyttäjä tai tietojen ylläpitäjä tai jonkinlainen järjestelmänvalvoja tai hallinnoija, voi sanoa: “Haluan erottaa huomautuksen tai varoituksen työnkulun ja varmista, että se toimitetaan käyttäjille oikeaan aikaan. ”Joten se on interventio ja me osoitamme sen.
Älykkäät ehdotukset ovat tapa, jossa työkalu käyttää kaikkia kokonaistietoaan luettelosta ehdottaakseen kyselyn objekteja ja osia kirjoitettaessa sitä. Tärkeintä on tietää, että kyselyloki todella hyödyntää sitä tehdäkseen, ehdottaa asioita käytön perusteella ja löytää myös jopa aiemmin kirjoitettujen kyselyiden osia. Ja me osoitamme sen.
Ja sitten esikatselut. Esikatselut ovat, kun kirjoitat objektin nimeä, osoitamme sinulle kaiken, mitä luettelo tietää, tai ainakin tärkeimmät asiat, jotka luettelo tietää objektista. Joten näytteet tiedoista, jotka olivat käyttäneet sitä aiemmin, objektin looginen nimi ja kuvaus, tulevat kaikki sinulle, kun kirjoitat sitä ilman, että sinun tarvitsee mennä pyytämään sitä.
Joten puhumatta enempää, pääsen demiin ja odotan vain sen ilmestymistä. Aion näyttää sinulle täällä kyselytyökalun. Se on oma SQL-kirjoitusrajapinta. Se on tietyssä mielessä erillinen käyttöliittymä luettelosta. Dez ja Robin puhuivat luettelosta, ja hyppään vähän luettelon käyttöliittymän yli suoraan siihen, miten se tuodaan suoraan työnkulun palvelemiseen.
Näytän vain paikan, johon voin kirjoittaa SQL: n, ja alareunassa näet, että meillä on jonkin verran tietoa esineistä, joihin viitamme. Joten aion vain kirjoittaa kyselyn ja lopetan, kun pääsen johonkin näistä interventioista. Joten kirjoitan “valitse” ja haluan vuoden. Haluan nimen. Ja etsin joitain palkatietoja. Joten tämä on koulutusaineisto. Siinä on tietoa korkeakouluista, ja tarkastelen tiedekuntien keskipalkkaa, joka on yhdessä näistä taulukoista.
Joten olen itse kirjoittanut sanan "palkka". Se ei ole tarkalleen sarakkeen nimessä tällä tavalla. Käytämme sekä loogisia metatietoja että fyysisiä metatietoja ehdotusten tekemiseen. Ja mitä haluan huomauttaa tässä, tämä keltainen laatikko, joka esiintyy täällä. Sanotaan, että tässä sarakkeessa on varoitus. En käynyt etsimässä sitä, en ottanut luokkaa, kuinka näitä tietoja käytetään oikein. Se tuli minulle, ja se sattuu olemaan varoitus salassapitosopimuksesta, joka liittyy näihin tietoihin. Joten on olemassa joitain julkistamissääntöjä. Jos aion kysyä näitä tietoja, aion poistaa tiedot tästä taulukosta, minun pitäisi olla varovainen tietojen julkistamisessa. Joten sinulla on täällä hallintopolitiikka. Joitakin sääntöjen noudattamista koskevia haasteita on paljon helpompaa noudattaa tätä käytäntöä, kun tiedän siitä sillä hetkellä, kun tarkastelen tietoja.
Joten minulla on tuo tullessaan eteenpäin, ja sitten aion myös tutkia opetusta. Ja täällä näemme esikatselujen tulevan peliin. Tässä lukukausipalkissa näen - laitospöydällä on lukukausipalkki, ja näen sen profiilin. Alation menee ja vetää näytetietoja taulukoista, ja tässä tapauksessa se näyttää minulle jotain, joka on aika mielenkiintoista. Se osoittaa minulle arvojen jakauman ja osoittaa, että nolla-arvo näkyi näytteessä 45 kertaa ja enemmän kuin mikään muu arvo. Joten minulla on jonkinlainen käsitys siitä, että saatamme puuttua tietoja.
Jos olen edistynyt analyytikko, silloin tämä saattaa olla osa työnkulkuani. Varsinkin jos olen erityisen huolellinen, jossa tekisin joukon profilointikysymyksiä etukäteen. Aina lähestyessäni uutta tietoa, mietin aina sitä, mikä on tietomme kattavuus. Mutta jos olen uusi tietoanalyysissä, jos olen uusi tässä tietojoukossa, voisin olettaa, että jos sarakkeessa on sarake, se täytetään jatkuvasti. Tai voin olettaa, että jos sitä ei ole täytetty, se ei ole nolla, se on nolla tai jotain sellaista. Mutta tässä tapauksessa meillä on paljon nollia, ja jos tekisin keskiarvon, ne olisivat todennäköisesti vääriä, jos vain olettaisin, että nuo nollat olivat tosiasiassa nollia puuttuvien tietojen sijaan.
Mutta Alation, tuomalla tämän esikatselun työnkulkuun, pyytää eräänlaista katsomaan näitä tietoja ja antaa jopa eräänlaisille aloitteleville analyytikoille mahdollisuuden nähdä, että kyseisistä tiedoista on jotain huomioitavaa. Joten meillä on tuo esikatselu.
Seuraava asia, jonka teen, yritän selvittää, mistä taulukoista nämä tiedot saadaan. Joten täällä näemme fiksut ehdotukset. Se on kulkenut koko ajan, mutta erityisesti täällä, en ole edes kirjoittanut mitään, mutta se aikoo ehdottaa minulle, mitä taulukoita haluaisin käyttää tähän kyselyyn. Ja tärkeintä tietää tämä on, että se hyödyntää käyttötilastoja. Joten esimerkiksi eBay-ympäristössä, jossa sinulla on satoja tuhansia taulukoita yhdessä tietokannassa ja jolla on työkalu, joka voi tyyppiä saada vehnä märeistä, ja käyttää näitä käyttötilastoja, on todella tärkeää näiden tekemisessä. ehdotuksia jotain.
Joten se ehdottaa tätä taulukkoa. Kun tarkastelen esikatselua, korostamme tosiasiassa kolme saraketta, jotka olen jo maininnut kyselyssäni. Joten tiedän, että sillä on kolme, mutta sillä ei ole nimeä. Minun täytyy saada nimi, joten aion liittyä. Kun liittyin, nyt minulla on jälleen nämä esikatselut, jotka auttavat minua löytämään, missä on nimen sisältävä taulukko. Joten näen, että tällä nimellä on hienosti muotoiltu, sellainen oikein isoin kirjaimin käytetty nimi. Vaikuttaa siltä, että jokaisella toimielimellä on yksi rivi nimellä, joten tartun siihen ja tarvitsen nyt liittymisehtoa.
Ja niin, tässä, mitä Alation tekee, se tarkastelee jälleen kyselylokeja, näkee aikaisemmin, että nämä kaksi taulukkoa on liitetty, ja ehdottaa erilaisia tapoja liittyä niihin. Jälleen kerran on jonkinlainen interventio. Jos tarkastelen yhtä näistä, se saa varoituksen, joka osoittaa minulle, että sitä tulisi käyttää vain kokonaisanalyysiin. Se todennäköisesti tuottaa väärän asian, jos yrität tehdä jotain toimielimen kautta. Tätä OPE-tunnuksella varustettua taulukkoa pidetään oikeana tapana yhdistää nämä kaksi taulukkoa, jos haluat yliopistotason tietoja. Joten teen sen, ja se on lyhyt kysely, mutta olen kirjoittanut kyselyni ilman, että minulla on oikeastaan välttämättä mitään käsitystä siitä, mitä tiedot ovat. En ole koskaan itse tarkastellut tämän tietojoukon ER-kaaviota, mutta tiedän jo melko paljon näistä tiedoista, koska asiaankuuluvat tiedot ovat saapuneet minulle.
Joten nämä ovat tavallaan kolme tapaa, joilla luettelo voi integroidun kyselytyökalun kautta vaikuttaa suoraan työnkulkuun kirjoittaessasi kyselyjä. Mutta yksi muista eduista, jotka johtuvat kyselytyökalun integroimisesta luetteloon, on se, että kun valmistan kyselyni ja tallenn sen, voin laittaa otsikon, kuten ”Institution Opetus ja tiedekunnan palkka”, ja sitten minulla on täällä painike, joka antaa minun julkaista sen vain luetteloon. Minusta on erittäin helppoa syöttää tämä takaisin. Vaikka en julkaise sitä, se sieppataan osana kyselylokea, mutta kun julkaisen sen, siitä tulee tosiasiallisesti osa keskitetyn paikan, jossa kaikki tietotiedot asuvat, tapaa.
Joten jos napsautin Etsi kaikkia Alation-kyselyjä, minut viedään - ja täällä näet lisää luettelon käyttöliittymää - minut siirretään omistettuun kyselyhakuun, joka näyttää minulle tavan löytää kyselyjä kaikkialta koko organisaation. Ja huomaat, että juuri julkaistu kyselyni on yläosassa. Ja jotkut saattavat huomata täällä, kun pyydystämme kyselyitä, sieppaamme myös kirjoittajia, ja me jollakin tavalla luomme tämän suhteen minut kirjoittajana ja näiden tietoobjektien välillä, joista nyt tiedän jotain. Ja minua vahvistetaan asiantuntijaksi tässä kyselyssä ja näissä tietoobjekteissa. Se on todella hyödyllistä, kun ihmisten on mentävä oppimaan tietoja, sitten he voivat löytää oikean henkilön opiskelemaan tietoja. Ja jos olen tosiasiallisesti uusi, riippumatta siitä, olenko edistynyt analyytikko - edistyneenä analyytikkona, voin katsoa tätä ja nähdä joukon esimerkkejä, jotka saavat minut aloittamaan uuden tietojoukon. Koska joku, joka ei ehkä ole erityisen taitava SQL: n suhteen, voin löytää valmiita kyselyitä, jotka ovat raportteja, joita voin hyödyntää.
Tässä on Phil Mazanettin keskimääräiset SAT-pisteet. Napsauta tätä ja saan eräänlaisen luettelosivun itse kyselylle. Se puhuu kirjoitetusta artikkelista, joka viittaa tähän kyselyyn, joten minun on luettava joitain asiakirjoja, jotka haluan oppia käyttämään sitä. Ja voin avata sen kyselytyökalussa napsauttamalla Luo-painiketta ja voin suorittaa sen täällä itse edes muokkamatta sitä. Ja itse asiassa, näet vähän kevyistä raportointiominaisuuksistamme, joissa kirjoittaessasi kyselyä voit pudottaa tällaisen mallimuuttujan ja se luo yksinkertaisen tavan luoda lomake kyselyyn perustuvan parilla parametreilla.
Joten minulla on demo. Aion vaihtaa takaisin dioihin. Vain eräänlaisena huomautuksena osoitimme, kuinka järjestelmänvalvoja, tietohallintojohtaja voi puuttua asettamalla varoituksia kyselytyökalussa näkyviin kohteisiin, kuinka Alation käyttää tietämystä tietokohteiden käytöstä älykkäiden ehdotusten tekemiseen, miten se tuo profiloinnissa ja muissa vinkissä parantaa analyytikoiden työnkulkuja koskettaessaan tiettyjä esineitä ja kuinka kaikki sellaiset syötetään takaisin luetteloon, kun uusia kyselyjä kirjoitetaan.
Ilmeisesti olen edustaja yrityksen puolesta. Aion sanoa mukavia asioita tietoluetteloista. Jos haluat kuulla suoraan yhdeltä asiakkaaltamme, Kristie Allen Safewaylla johtaa analyytikkotiimiä ja hänellä on todella hieno tarina ajasta, jolloin hänen täytyi todella lyödä kelloa markkinointikokeen toimittamiseksi, ja kuinka koko hänen koko joukkue käytti Alation-yhteistyötä tehdäkseen yhteistyötä ja kääntyäkseen nopeasti projektiin. Joten voit seurata tätä bit.ly-linkkiä tarkistaaksesi tarinan, tai jos haluat kuulla vähän siitä, kuinka Alation voisi tuoda tietoluettelon organisaatioosi, olemme iloisia perustaessamme henkilökohtaisen esittelyn. Kiitos paljon.
Rebecca Jozwiak: Kiitos paljon, David. Olen varma, että Dezillä ja Robinilla on muutama kysymys ennen kuin esitän yleisön kysymykset ja vastaukset. Dez, haluatko mennä ensin?
Dez Blanchfield: Ehdottomasti. Rakastan ajatusta tästä julkaistujen kyselyiden käsitteestä ja linkin se takaisin kirjoittamisen lähteeseen. Olen ollut pitkäaikainen mestari tämän yrityksen sisäisen sovelluskaupan ideasta ja mielestäni tämä on todella loistava perusta rakentaa siihen.
Tulin tavallaan saamaan jonkinlaisen käsityksen joihinkin organisaatioihin, joita näet tekemässä tätä, ja joihinkin menestystarinoihin, joita heillä mahdollisesti on ollut koko tämän matkan aikana, jossa ei vain hyödynnetty työkalusi ja alustasi tietojen löytämiseksi, vaan muuttaa sitten myös heidän sisäiset kulttuuriset ja käyttäytymispiirteensä. Nyt sinulla on tällainen oma sovellusliike, josta voit vain ladata, konseptin, jonka kautta he eivät vain löydä sitä, vaan he voivat itsekin alkaa kehittää pieniä yhteisöjä tiedon ylläpitäjien kanssa.
David Crawford: Joo, mielestäni olemme yllättyneitä. Uskomme kyselyjen jakamisen arvoon sekä menneisyydestäni Adtechin tuotepäällikkönä että kaikilta asiakkailta, joiden kanssa olemme puhuneet, mutta olen silti yllättynyt siitä, kuinka usein se on yksi ensimmäisistä asioista, joita asiakkaat puhutaan arvosta, jonka he pääsevät ulos Alaatiosta.
Suoritin jonkin verran käyttäjän testaamista kyselytyökalua yhdellä asiakkaamme nimeltä Invoice2go, ja heillä oli suhteellisen uusi tuotepäällikkö, ja he sanoivat - hän itse kertoi minulle, käyttämättömän testin aikana, "En todellakaan haluaisi kirjoittamalla SQL: tä ollenkaan paitsi että se on helppo Alationin avulla. "Ja tietysti pääministeerinä menen sellaisenaan" Mitä tarkoitat, kuinka teimme sen? "Ja hän sanoi:" No, oikeastaan se on vain koska voin kirjautua sisään ja nähdä kaikki nämä olemassa olevat kyselyt. ”Alkaminen tyhjästä taulukosta SQL: llä on uskomattoman vaikea tehtävä, mutta olemassa olevan kyselyn muuttaminen, jossa näet lopputuloksen ja voit sanoa, "Voi, tarvitsen vain tämän ylimääräisen sarakkeen" tai "Minun on suodatettava se tiettyyn ajanjaksoon", se on paljon helpompi tehtävä.
Olemme nähneet eräänlaisia näistä apurooleista, kuten tuotepäälliköt, ehkä myyntihenkilöt, jotka alkavat poimia ja jotka aina halusivat oppia SQL: n ja alkaa poimia sitä käyttämällä tätä luetteloa. Olemme myös nähneet, että monet yritykset ovat yrittäneet tehdä eräänlaista avointa lähdekoodia. Olen yrittänyt rakentaa tällaisia asioita sisäisesti, missä ne seuraavat kyselyjä ja tekevät niiden saataville, ja niiden hyödyllisyyteen on joitain todella hankalia suunnittelun haasteita. Facebookilla on ollut sisäinen työkalu, jota he kutsuvat HiPaliksi, joka eräänlaisena kaapasi kaikki Hivelle kirjoitetut kyselyt, mutta se, mitä huomaat, on se, että jos et pilaa käyttäjiä oikealla tavalla, päädyt vain erittäin pitkä luettelo valituista lauseista. Ja käyttäjänä, joka yrittää selvittää, onko kysely minulle hyödyllinen vai onko siitä jotain hyvää, jos katson vain pitkää valittujen lauseiden luetteloa, vie paljon kauemmin, kun saan jotain arvottomana siellä kuin aloittaa tyhjästä. Mietimme melko huolellisesti, kuinka tehdä kyselyluettelo, joka tuo oikeat asiat eteen ja tarjoaa sen hyödyllisellä tavalla.
Dez Blanchfield: Luulen, että me kaikki käymme läpi tämän matkan hyvin nuoresta iästä aikuisuuteen, monin tavoin. Joukko tekniikoita. Olen itse henkilökohtaisesti käynyt läpi saman aiton asian, kuten oppinut leikkaamaan koodia. Halusin käydä läpi lehtiä ja sitten kirjoja, ja opiskelen tietyn tason, ja sitten minun piti mennä ja oikeasti saada lisää koulutusta siitä.
Mutta vahingossa huomasin, että jopa mennessäni opettaessani itseäni, lukemalla lehtiä ja lukemalla kirjoja ja leikkaamalla muiden ihmisten ohjelmia ja menemällä sitä koskeville kursseille, päädyin silti oppimaan yhtä paljon kursseista kuin puhuin vain muille. ihmiset, joilla oli kokemuksia. Ja mielestäni se on mielenkiintoinen löytö, että nyt kun tuodaan tietoanalytiikkaan, näemme periaatteessa saman rinnakkain, että ihmiset ovat aina melko älykkäitä.
Toinen asia, jonka todella haluan ymmärtää, on erittäin korkealla tasolla monien organisaatioiden kysyä: ”Kuinka kauan kestää pääseminen siihen pisteeseen?” Mikä on kärkipaikka aikataulussa, kun ihmiset saavat käyttöjärjestelmäsi asennettuna, ja he alkoivat löytää työkaluja? Kuinka nopeasti ihmiset vain tavallaan näkevät tämän asian muuttuvan todella välittömäksi "a-ha" -hetkeksi, jolloin he ymmärtävät, että he eivät ole enää edes huolissaan sijoitetun pääoman tuottoprosentista, koska se on olemassa, mutta nyt he todella muuttavat liiketoimintaa ? Ja he ovat löytäneet kadonneen taiteen ja odottavat voivansa tehdä jotain todella, todella hauskaa sen kanssa.
David Crawford: Joo, voin koskea sitä hiukan. Luulen, että kun asennamme, yksi hienoista asioista, joista ihmiset pitävät suoraan tietojärjestelmiin kytketyn luettelon suhteen, on, että et aloita tyhjänä missä sinun on tavallaan täytettävä se sivu sivulta. Ja tämä on totta totta aiemmissa tietoratkaisuissa, joissa aloitat tyhjellä työkalulla ja sinun on aloitettava sivun luominen kaikelle, jonka haluat dokumentoida.
Koska dokumentoimme niin monet asiat automaattisesti purkamalla metatiedot, lähinnä muutaman päivän kuluessa ohjelmiston asentamisesta, sinulla on kuva tietoympäristöstäsi, joka on vähintään 80 prosenttia siellä työkalussa. Ja sitten luulen heti, kun ihmiset alkavat kirjoittaa kyselyjä työkalulla, he tallennetaan automaattisesti takaisin luetteloon, ja niin he alkavat myös näkyä.
En halua olla liian innokas sanomalla sitä. Mielestäni kaksi viikkoa on melko hyvä varovainen arvio kuukauteen. Kaksi viikkoa kuukauteen, konservatiivinen arvio todella kääntyä ympäri ja tuntea kuin saat siitä hyötyä, kuten alat jakaa tietoa ja pystyä menemään sinne ja selvittämään tietojasi tiedoista.
Dez Blanchfield: Se on todella hämmästyttävää, kun mietit sitä. Tosiasia, että joidenkin suurten tietoalustojen, joita indeksoit ja luetteloit tehokkaasti, toteuttaminen, käyttöönotto ja seisonta oikein kestää joskus jopa vuoden.
Viimeinen kysymys, jonka sain sinulle ennen kuin luovutan Robin Bloorille, on liittimet. Yksi niistä asioista, joka hyppää heti minua kohti, on selvästi, että koko haaste on selvitetty. Joten on pari kysymystä todella nopeasti. Yksi, kuinka nopeasti liittimet otetaan käyttöön? Aloitat tietysti suurimmalla alustalla, kuten Oracles ja Teradatas ja niin edelleen ja DB2. Mutta kuinka säännöllisesti näet uusien liittimien tulevan läpi, ja kuinka läpimenoaikaa ne käyttävät? Kuvittelen, että sinulla on heille vakiokehys. Ja kuinka syvälle sinä mene niihin? Esimerkiksi maailman oraakit ja IBM: t, ja jopa Tereadata, ja sitten jotkut suosituimmista myöhäisistä avoimen lähdekoodin alustoista. Työskentelevätkö he suoraan kanssasi? Löydätkö sen itse? Onko sinulla oltava sisäpiiritieto näillä alustoilla?
Miltä näyttää muodostua liittimen kehittäminen, ja kuinka syvällisesti osallistut kumppanuuksiin varmistaaksesi, että nämä liittimet löytävät kaiken mitä pystyt?
David Crawford: Kyllä, se on hieno kysymys. Uskon, että pääosin voimme kehittää liittimiä. Teimme varmasti, kun olimme nuorempi startup, eikä meillä ollut asiakkaita. Voimme kehittää yhteyksiä varmasti tarvitsematta sisäistä pääsyä. Emme koskaan saa erityisiä käyttöoikeuksia tietojärjestelmiin, jotka eivät ole julkisesti saatavilla, ja usein ilman sisäpiiritietoa. Hyödynnämme itse tietojärjestelmien metatietopalveluita. Usein ne voivat olla melko monimutkaisia ja vaikeita työskennellä. Tunnen erityisesti SQL Serverin, sen, kuinka he hallitsevat kyselylokea, siellä on useita erilaisia kokoonpanoja ja siinä on jotain, josta sinun on todella työskenneltävä. Sinun on ymmärrettävä sen vivahteet ja nupit ja soittimet sen asettamiseksi oikein. Se on asia, jonka kanssa työskentelemme asiakkaiden kanssa, koska olemme tehneet sen useita kertoja aiemmin.
Mutta tietyssä määrin se hyödyntää julkisia sovellusliittymiä, jotka ovat käytettävissä, tai käytettävissä olevia julkisia käyttöliittymiä. Meillä on kumppanuussuhteita useiden näiden yritysten kanssa, mikä on useimmiten sertifioinnin peruste, jotta he tuntevat olonsa mukavaksi sanomalla, että toimimme ja että he voivat myös tarjota meille resursseja testaamiseen, joskus jo varhain päästä käyttämään alustaa, joka tulee ulos varmistaakseen, että työskentelemme uusien versioiden parissa.
Kiertääkseni uuden yhteyden sanoisin jälleen, että yritän olla varovainen, sanotaan kuusi viikkoa kahteen kuukauteen. Se riippuu siitä, kuinka samanlainen se on. Joten jotkut Postgre toimii tyypiltään hyvin samanlaiselta kuin Redshift. Redshift ja Vertica jakavat paljon yksityiskohtia. Joten voimme hyödyntää näitä asioita. Mutta kyllä, kuusi viikkoa tai kaksi kuukautta olisi reilua.
Meillä on myös sovellusliittymiä, joten - ajattelemme Alaa myös metatietoalustana, joten jos jotain ei ole käytettävissä, jotta voimme tavoittaa ja automaattisesti tarttua, on olemassa tapoja, joilla voit kirjoittaa liitännän itse ja työntää sen järjestelmäämme niin että kaikki keskittyy yhä yhteen hakukoneeseen.
Dez Blanchfield: Fantastinen. Arvostan sitä, että. Joten luovutamme sen Robinille, koska olen varma, että hänellä on myös lukuisia kysymyksiä. Robin?
Rebecca Jozwiak: Robin voi olla mykkä.
Dez Blanchfield: Olet vaiennut itsesi.
Robin Bloor: Kyllä, oikein. Anteeksi, mykkäsin itseni. Mikä on prosessi, kun otat tämän käyttöön? Olen utelias, koska monissa paikoissa voi olla paljon tietoa. Joten miten se toimii?
David Crawford: Kyllä, varmasti. Menemme sisään, ensin se on eräänlainen tietotekniikkaprosessi, jolla varmistetaan palvelimemme varustelu, verkkoyhteyksien saatavuus ja portit ovat auki, jotta pääsemme järjestelmiin tosiasiallisesti. He kaikki tietävät usein, mistä järjestelmistä he haluavat aloittaa. Tietäen tietojärjestelmän sisällön, joka - ja joskus me todella autamme heitä. Autamme heitä tekemään ensin kyselylokiin ymmärtääkseen kuka käyttää mitä ja kuinka monta käyttäjää heillä on järjestelmässä. Joten autamme selvittämään missä - he usein, jos heillä on satoja tai tuhansia ihmisiä, jotka saattavat kirjautua tietokantoihin, eivät oikeastaan tiedä missä he kirjautuvat sisään, joten voimme selvittää kyselylokit kuinka monta yksilöllistä käyttäjätiliä olet tosiasiallisesti kirjautumassa sisään ja suorittamassa kyselyjä täällä noin kuukauden sisällä.
Joten voimme hyödyntää sitä, mutta usein vain tärkeimmissä. Saamme ne perustaa ja sitten on prosessi, jossa sanotaan: "Ensisijaistetaan." Rinnakkain voi tapahtua erilaisia aktiviteetteja. Keskityn kyselytyökalun käytön koulutukseen. Heti kun ihmiset alkavat käyttää kyselytyökalua, monet ihmiset rakastavat sitä, että se on vain yksi käyttöliittymä kaikkiin heidän eri järjestelmiin. He rakastavat myös sitä, että se on web-pohjainen, ei sisällä asennuksia, jos he eivät halua. Turvallisuuden kannalta he haluavat, että niillä on eräänlainen yksi tulopiste, verkon kannalta yrityksen tietotekniikkaverkon ja tietokeskuksen välillä, jossa tuotantotietolähteet asuvat. Ja niin he perustavat Alationin kyselytyökaluksi ja alkavat käyttää Composea kaikkien näiden järjestelmien yhteyspisteenä.
Joten kun tämä tapahtuu, keskitymme koulutukseen ymmärtämään, mitkä ovat erot verkko- tai palvelinpohjaisen kyselytyökalun ja työpöydälläsi olevien erojen välillä ja eräät käytön vivahteet että. Ja samalla yritämme tunnistaa arvokkaimmat tiedot hyödyntämällä jälleen kyselylokin tietoja ja sanomalla: "Hei, saatat haluta käydä sisään ja auttaa ihmisiä ymmärtämään näitä. Aloitetaan julkaisemalla edustajakyselyjä näissä taulukoissa. ”Se on joskus tehokkain tapa saada ihmiset nopeasti nousemaan. Katsotaanpa omaa kyselyhistoriaasi, julkaista nämä asiat niin, että ne näkyvät ensimmäisinä kyselyinä. Kun ihmiset katsovat taulukkosivua, he näkevät kaikki kyseiseen taulukkoon kosketut kyselyt, ja he voivat aloittaa sieltä. Ja sitten alamme lisätä otsikoita ja kuvauksia näihin esineisiin, jotta niitä on helpompi löytää ja etsiä, jotta tiedät joitain vivahteita, kuinka sitä käytetään.
Varmistamme, että tutustumme kyselylokiin perusteellisesti, jotta voimme tuottaa linjaa. Yksi tekemistämme asioista on se, että katsomme kyselylokin läpi aikoinaan, kun tiedot liikkuvat taulukosta toiseen. Tämän avulla voimme esittää yhden yleisimmin esitetyistä kysymyksistä tietotaulukoita, mistä tämä tuli? Kuinka voin luottaa siihen? Joten mitä voimme näyttää, ei ole vain siitä, mistä muista taulukoista se tuli, vaan myös kuinka se muuttui matkan varrella. Jälleen tämä on eräänlainen powered by kyselylokin.
Joten varmistamme, että nämä asiat on asetettu ja että olemme tulossa linjaan järjestelmään, ja kohdistamme arvokkaimpiin ja tehokkaimmin käytettyihin metatietokappaleisiin, jotka pystymme vakiinnuttamaan taulukkosivuilla, jotta kun etsit, löydät jotain hyödyllistä.
Robin Bloor: Okei. Toinen kysymys - yleisöltä löytyy paljon kysymyksiä, joten en halua viettää täällä liikaa aikaa - toinen kysymys, joka sellaiselle mieleen tulee, on vain kipupisteet. Paljon ohjelmistoja ostetaan, koska ihmisillä on tavalla tai toisella vaikeuksia joihinkin. Joten mikä on yleinen kivunkohta, joka johtaa ihmiset Alaatioon?
David Crawford: Kyllä. Mielestäni niitä on muutamia, mutta mielestäni yksi niistä, joista kuulemme melko usein, on analyytikko lennolla. ”Tarvitsen lähiaikoina palkata 10, 20, 30 ihmistä, joiden on tuotettava uusia tietoja näistä tiedoista. Kuinka he nousevat vauhtiin?” Joten analyytikko alukselle asettaminen on jotain, jota varmasti puuttua. Sen lisäksi vanhemmat analyytikot vapauttavat siitä, että he viettävät kaiken aikansa vastaamalla muiden ihmisten tietoihin liittyviin kysymyksiin. Se on myös hyvin yleinen tapa. Ja nämä molemmat ovat lähinnä koulutusongelmia.
Ja sitten sanoisin toisen paikan, jonka näemme ihmisten omaksumassa Alaatiota, kun he haluavat perustaa aivan uuden tietoympäristön jonkun työskentelemistä varten. He haluavat mainostaa ja markkinoida tätä sisäisesti, jotta ihmiset voivat hyödyntää sitä. Sitten Alationin tekeminen uuden analyyttisen ympäristön etulinjaksi on erittäin houkutteleva. Sillä on dokumentaatio, sillä on yksi johdantopaikka järjestelmiin - yksi pääsypiste järjestelmiin, ja niin, se on toinen paikka, jossa ihmiset tulevat luoksemme.
Robin Bloor: Okei, välitän sinut Rebeccaan, koska yleisö yrittää päästä sinuun.
Rebecca Jozwiak: Kyllä, meillä on täällä paljon todella hyviä yleisökysymyksiä . Ja David, tämä poseerattiin nimenomaan sinulle. Se on jollekulta, jolla on ilmeisesti jonkin verran kokemusta ihmisten tyyppisistä väärinkäytöksistä, ja hän sanoo tavallaan, että mitä enemmän voimme lisätä käyttäjiä, sitä vaikeampaa on hallita laskennallisten resurssien vastuullista käyttöä. Joten voit puolustaa väärien, mutta yleisten kyselylausekkeiden leviämistä vastaan?
David Crawford: Kyllä, näen tämän kysymyksen. Se on hieno kysymys - kysymys, jota saamme melko usein. Olen nähnyt tuskan itse aikaisemmissa yrityksissä, joissa sinun täytyy kouluttaa käyttäjiä. Esimerkiksi: "Tämä on lokitaulukko, sillä lokit palautuvat vuosien ajan. Jos aiot kirjoittaa kyselyn tähän taulukkoon, sinun on todellakin rajoitettava päivämäärällä. ”Joten se on esimerkiksi koulutus, jonka kävin läpi aiemmassa yrityksessä, ennen kuin minulle annettiin pääsy tietokantaan.
Meillä on muutama tapa yrittää puuttua tähän. Sanoisin, että mielestäni kyselylokin tiedot ovat todella ainutlaatuisen arvokkaita sen käsittelemiseksi. Se antaa uuden käsityksen verrattuna siihen, mitä tietokanta tekee sisäisesti kyselosuunnittelijan kanssa. Ja mitä me teemme, yksi niistä interventioista - meillä on manuaaliset interventiot, jotka osoitin, ja se on hyödyllinen, eikö? Joten tietyllä liittymisellä voit esimerkiksi sanoa: "Vanhennetaan tämä." Sillä on iso punainen lippu, kun se näkyy älykkäissä ehdotuksissa. Joten se on yksi tapa yrittää tavoittaa ihmisiä.
Toinen asia, jota teemme, on automatisoitu toteutuksen yhteydessä tapahtuvissa interventioissa. Se tosiasiallisesti käyttää kyselyn jäsentävää puuta ennen kuin ajamme sen näkyviin. Sisältääkö se tietyn suodattimen vai pari muuta asiaa, joita myös siellä teemme. Mutta yksi arvokkaimmista ja yksinkertaisin selittää on, sisältääkö se suodattimen? Joten kuten juuri mainitsemassani esimerkissä, tässä lokitaulukossa, jos aiot kysyä sitä, on oltava ajanjakso, voit määrittää taulukkosivulla, että valtuutat kyseisen ajanjakson suodattimen käytettäväksi. Jos joku yrittää suorittaa kyselyn, joka ei sisällä kyseistä suodatinta, se itse asiassa pysäyttää hänet suurella varoituksella ja sanoo: ”Sinun pitäisi todennäköisesti lisätä kyselyyn jokin tällainen SQL.” He voivat jatkaa, jos he haluavat. Emme aio kieltää heitä kokonaan käyttämästä sitä - se on myös kysely, sen täytyy päivän lopussa suorittaa kyselyitä. Asetamme heidän edessään melko suuren esteen ja annamme heille ehdotuksen, konkreettisen sovellettavan ehdotuksen kyselyn muuttamiseksi heidän suorituskyvyn parantamiseksi.
Teemme sen myös joissakin tapauksissa automaattisesti, tarkkailemalla kyselylokea. Jos näemme, että jotkut todella suuret prosenttiosuudet tämän taulukon kyselyistä hyödyntävät tiettyä suodatinta tai tiettyä liittymislauseketta, niin pop-up todella otetaan käyttöön. Edistämme sitä interventioon. Itse asiassa se tapahtui minulle sisäisessä tietokokonaisuudessa. Meillä on asiakastietoja ja käyttäjätunnuksia, mutta käyttäjätunnus on asetettu, koska se on sellaista - meillä on käyttäjätunnukset jokaisella asiakkaalla. Se ei ole ainutlaatuinen, joten sinun on paritettava se asiakastunnuksella, jotta saat yksilöllisen liittymisavaimen. Ja kirjoitin kyselyä ja yritin analysoida jotain, ja se ilmestyi ja sanoi: ”Hei, kaikki muut näyttävät liittyvän näihin taulukoihin sekä asiakastunnuksella että käyttäjätunnuksella. Oletko varma, ettet halua tehdä niin? ”Ja se todella estäi minua tekemästä vääriä analyysejä. Joten se toimii sekä analyysin tarkkuuden että suorituskyvyn kannalta. Joten se on sellainen miten otamme tämän ongelman eteen.
Rebecca Jozwiak: Minusta se näyttää olevan tehokasta. Sanoit, että et välttämättä estä ihmisiä hankkimasta resursseja, mutta opetat heille jonkin verran, että heidän tekemänsä ei välttämättä ole paras, eikö niin?
David Crawford: Odotamme aina, että käyttäjät eivät ole haitallisia - antavat heille parhaat aikomukset - ja yritämme olla melko avoimia tällä tavalla.
Rebecca Jozwiak: Okei. Tässä on toinen kysymys: “Mitä eroa on luettelonhallinnalla, kuten ratkaisullasi, ja MDM-työkalulla? Vai luottaako se tosiasiallisesti erilaiseen periaatteeseen laajentamalla kyselytaulukoiden valintaa, kun taas MDM tekisi sen automaattisesti, mutta samalla taustalla olevan metadatan keräämisen perustana. "
David Crawford: Joo, mielestäni kun tarkastelen perinteisiä MDM-ratkaisuja, ensisijainen ero on filosofinen. Kyse on siitä, kuka käyttäjä on. Aivan kuten sanoin esityksen alussa, Alation, luulen, että kun me perustettiin, me perustettiin tavoitteena antaa analyytikoille tuottaa enemmän oivalluksia, tuottaa niitä nopeammin, olla tarkempia näkemyksissä, joita he tuottaa. En usko, että se on koskaan ollut perinteisen MDM-ratkaisun tavoite. Nämä ratkaisut on yleensä suunnattu ihmisille, joiden on tuotettava raportteja siitä, mitä tietoja on talteen otettu SCC: lle tai sisäisesti muunlaista auditointitarkoitusta varten. Se voi joskus antaa analyytikoille mahdollisuuden, mutta useimmiten, jos se antaa mahdollisuuden harjoittajille heidän työssään, se todennäköisemmin mahdollistaa tietoarkkitehdin, kuten DBA.
Kun mietit asioita analyytikon näkökulmasta, silloin alat rakentaa kyselytyökalua, jota MDM-työkalu ei koskaan tekisi. Silloin alkaa miettiä suorituskykyä ja tarkkuutta sekä ymmärtää, mitkä tiedot liittyvät liiketoiminnan tarpeeseen. Kaikki nämä asiat ovat asioita, jotka ovat mielenkiintoisia mielessämme, kun suunnittelemme työkalua. Se menee hakualgoritmeihimme, se sisältyy luettelosivujen asetteluun ja kykyyn lisätä tietoa ympäri organisaatiota. Se menee tosiasiaan, että rakensimme kyselytyökalun ja rakensimme luettelon suoraan siihen, joten mielestäni se todella tulee siitä. Mitä käyttäjää sinulla on ensin mielessä?
Rebecca Jozwiak: Okei, hyvä. Se todella auttoi selittämään sen. Kuka kuoli saada käsiinsä arkistoja, koska hänen piti lähteä, mutta hän todella halusi hänen kysymykseen vastaavan. Hän sanoi, että alussa mainittiin, että kieliä on useita, mutta onko SQL ainoa kieli, jota käytetään Compose-komponentissa?
David Crawford: Kyllä, se on totta. Ja yksi niistä asioista, jotka olen huomannut todistaessani erään tyyppisten tietokantojen, asiakirjatietokantojen, graafitietokantojen, tärkeimpien arvovarastojen räjähdystä, on, että ne ovat todella tehokkaita sovelluskehitykseen. Ne voivat palvella erityisiä tarpeita siellä todella hyvin, paremmilla tavoilla kuin relaatiotietokannat pystyvät.
Mutta kun palautat sen tietoanalyysiin, kun palautat sen - kun haluat antaa kyseisen tiedon ihmisille, jotka aikovat tehdä tapausraportointia tai kaivata tietoja tilapäisesti, että he palaavat aina relaatiotietoihin ainakin käyttöliittymä ihmisille. Osa siitä vain siksi, että SQL on tietojen analysoinnin kieli, joten ihmisille se tarkoittaa myös integroitavia työkaluja. Mielestäni tämä on syy siihen, että Hadoopin SQL on niin suosittu ja sen ratkaisemiseksi on niin paljon yrityksiä, koska ihmiset tietävät päivän päätteeksi. On luultavasti miljoonia ihmisiä, jotka osaavat kirjoittaa SQL: tä, enkä uskalla miljoonia ihmisiä, jotka osaavat kirjoittaa Mongo-yhdistelmäputken kehyskyselyn. Ja että se on standardikieli, jota käytetään integroimaan todella monenlaisille alustoille. Joten kaikki mitä sanotaan, meitä pyydetään harvoin menemään sen ulkopuolelle, koska tämä on käyttöliittymä, jota useimmat analyytikot käyttävät, ja se on paikka, johon keskityimme, etenkin Compose-ohjelmassa, SQL-kirjoittamiseen.
Sanoisin, että tietojenkäsittelytiede on paikka, jossa he uskaltavat olla eniten ulkopuolella, joten saamme satunnaisia kysymyksiä Pigin tai SAS: n käytöstä. Nämä ovat asioita, joita emme ehdottomasti käsittele säveltämisessä ja jotka haluaisimme kaapata luetteloon. Ja näen myös R: n ja Pythonin. Meillä on pari tapaa luoda rajapintoja, joilla voit käyttää Alaatioon kirjoitettuja kyselyitä R- ja Python-komentosarjojen sisällä, joten koska usein kun olet tietoteknikko ja työskentelet komentosarjojen kielellä, lähdetiedot ovat relaatiotietokannassa. Aloitat SQL-kyselyllä ja käsittelet sitten sitä edelleen ja luot kuvaajia R: n ja Pythonin sisällä. Ja olemme tehneet paketteja, jotka voit tuoda niihin skripteihin, jotka vetävät kyselyjä tai kyselyn tuloksia Alation-ohjelmasta, jotta sinä voit tavallaan saada sekoitettua työnkulkua.
Rebecca Jozwiak: Okei, hienoa. Tiedän, että olemme juokseneet hiukan tunnin huipun ohi, kysyn vain vielä yhden tai kaksi kysymystä. Tiedän, että puhuit kaikista eri järjestelmistä, joihin voit muodostaa yhteyden, mutta mitä ulkoisesti ylläpidettävään ja sisäisesti ylläpidettävään tietoon voidaan etsiä yhdessä yhdessä näkymässä, yhdellä alustalla?
David Crawford: Toki. Täällä on muutama tapa. Tarkoitan ulkoisesti isännöityä, voisin kuvitella, yritän miettiä tarkalleen mitä tämä saattaa tarkoittaa. Se voi tarkoittaa tietokantaa, jota joku isännöi AWS: ssä sinulle. Se voi tarkoittaa julkista tietolähdettä data.gov. Yhdistämme suoraan tietokantoihin kirjautumalla sisään aivan kuten toinen sovellus tietokantatilillä, ja näin me purkamme metatiedot. Joten jos meillä on tili ja verkon portti on auki, voimme päästä siihen. Ja sitten, kun meillä ei ole noita asioita, meillä on jotain, jota kutsutaan virtuaaliseksi tietolähteeksi, jonka avulla voit pääasiallisesti siirtää dokumentaatiota joko automaattisesti, kirjoittamalla oman liittimen tai täyttämällä sen tekemällä jopa CSV-lähetyksen tapaan, dokumentoida tiedot sisäisten tietojen rinnalla. Se viedään kaikki hakukoneeseen. Siitä tulee viittaus artikkeleihin ja muuhun dokumentointiin ja keskusteluihin järjestelmän sisällä. Joten näin käsittelemme, kun emme pysty suoraan muodostamaan yhteyttä järjestelmään.
Rebecca Jozwiak: Okei, siinä on järkeä. Ammun vain vielä yhden kysymyksen sinulle. Yksi osallistuja on kysytään: "Kuinka tietoluettelon sisältö olisi validoitava, varmennettava tai ylläpidettävä, kun lähdetietoja päivitetään, kun lähdetietoja muokataan jne."
David Crawford: Niin, kysymys on meille paljon, ja mielestäni yksi niistä asioista, jonka me - yksi filosofioistamme, kuten sanoin, emme usko käyttäjien olevan haitallisia. Oletetaan, että he yrittävät antaa parhaan tiedon. He eivät tule sisään ja harhaan tarkoituksellisesti harhauttavat tietoja tiedoista. Jos se on ongelma organisaatiossasi, ehkä Alation ei ole oikea työkalu sinulle. Mutta jos oletat käyttäjien hyviä aikomuksia, ajattelemme sitä jostakin kohdasta, missä päivitykset tulevat sisään, ja sitten yleensä teemme sen, että laitamme taloudenhoitajan, joka vastaa jokaisesta tietoobjektista tai tietoosasta. Ja voimme ilmoittaa niille valvojille, kun metatietoihin tehdään muutoksia, ja he voivat käsitellä sitä tällä tavalla. He näkevät päivitykset tulevat sisään, he validoivat ne. Jos he eivät ole oikeassa, he voivat palata takaisin ja muuttaa niitä ja tiedottaa, ja toivottavasti tavoittaa jopa tiedon lähettäneet käyttäjät ja auttaa heitä oppimaan.
Joten se on ensisijainen tapa ajatella sen tekemistä. Tällainen väkijoukon ehdotus ja luottamusmiesten johto, joten meillä on joitain ominaisuuksia sen ympärillä.
Rebecca Jozwiak: Okei, hyvä. Ja jos voisit vain kertoa ihmisille, kuinka he voivat parhaiten päästä alkuun Alationin kanssa, ja mihin he voivat mennä erityisesti saadakseen lisätietoja. Tiedän, että jaoit yhden bit.ly. Onko se paras paikka?
David Crawford: Alation.com/learnmore Mielestäni on hieno tapa edetä. Alation.com-sivustolla on paljon demo-resursseja, asiakkaiden valkoisia kirjoja ja uutisia ratkaisustamme liittyäksesi demoun. Joten mielestäni se on hieno paikka aloittaa. Voit myös lähettää sähköpostia.
Rebecca Jozwiak: Okei, hienoa. Ja tiedän, osallistujat, pahoillani, jos en vastannut kaikkiin kysymyksiin tänään, mutta jos ei, ne välitetään eteenpäin Davidille tai hänen myyntitiimilleen tai jollekin Alatioon, joten he voivat ehdottomasti auttaa vastaamaan kysymyksiisi ja auttaa ymmärtämään mitä Alation tekee tai mitä he tekevät parhaiten.
Ja sen kanssa, ihmiset, menen eteenpäin ja allekirjoittaa meidät. Löydät arkistot aina InsideAnalysis.com -sivulta. Löydät sen myös osoitteesta Techopedia.com. Niillä on taipumus päivittää hiukan nopeammin, joten tarkista se ehdottomasti. Ja kiitos paljon David Crawfordille, Dez Blanchfieldille ja Robin Boorille tänään. Se on ollut hieno webcast. Ja sen kanssa jätän jäähyväiset. Kiitos, ihmiset. Hei hei.
David Crawford: Kiitos.