Sisällysluettelo:
Määritelmä - mitä tietojen profilointi tarkoittaa?
Datan profilointi on tekniikka, jota käytetään tutkimaan tietoja eri tarkoituksiin, kuten tarkkuuden ja täydellisyyden määrittämiseen. Tämä prosessi tutkii tietolähdettä, kuten tietokantaa, paljastaaksesi virheelliset alueet tietojen järjestämisessä. Tämän tekniikan käyttöönotto parantaa tiedon laatua.
Tietojen profilointiin viitataan myös datan löytämisenä.
Techopedia selittää tietojen profiloinnin
Tietojen profilointi on menetelmä, jolla tutkitaan tietolähteessä olevia tietoja ja kerätään tilastoja ja tietoja kyseisestä tiedosta. Tällaiset tilastot auttavat tunnistamaan metatietojen käytön ja tiedon laadun. Tätä menetelmää käytetään laajasti yritystietojen varastoinnissa.
Tietojen profilointi selventää datan rakennetta, suhdetta, sisältöä ja johdannaissääntöjä, jotka auttavat ymmärtämään metatietojen poikkeavuuksia. Tietojen profiloinnissa käytetään erityyppisiä kuvaavia tilastoja, mukaan lukien keskimääräinen, minimi, maksimiarvo, prosenttipiste, taajuus ja muut aggregaatit, kuten lukumäärä ja summa. Profiilitoiminnan aikana saatavat lisätiedot ovat metatietotyyppiä, pituutta, erillisiä arvoja, ainutlaatuisuutta ja abstraktia tyyppitunnistusta.