Koti tietokannat Mikä on likaista tietoa? - määritelmä techopediasta

Mikä on likaista tietoa? - määritelmä techopediasta

Sisällysluettelo:

Anonim

Määritelmä - mitä likainen data tarkoittaa?

Likaisella tiedolla tarkoitetaan tietoa, joka sisältää virheellisiä tietoja. Sitä voidaan käyttää myös viitattaessa tietoihin, jotka ovat muistissa ja joita ei ole vielä ladattu tietokantaan. Likaisten tietojen poistaminen kokonaan lähteestä on epäkäytännöllistä tai käytännössä mahdotonta.

Seuraavia tietoja voidaan pitää likaisina tiedoina:

  • Harhaanjohtavia tietoja
  • Päällekkäiset tiedot
  • Virheelliset tiedot
  • Virheelliset tiedot
  • Ei integroitu data
  • Tietoja, jotka rikkovat yrityssääntöjä
  • Tiedot ilman yleistä muotoilua
  • Virheellisesti pilkotut tai kirjoitetut tiedot

Techopedia selittää likaisen tiedon

Virheellisten tietojen syöttämisen lisäksi likaista tietoa voidaan tuottaa virheellisten tietojen hallinta- ja tallennusmenetelmien takia. Joitakin likaisia ​​tietotyyppejä selitetään alla:

  • Virheelliset tiedot - Tietojen paikkansapitävyyden tai oikeellisuuden varmistamiseksi syötetyn arvon tulisi olla kentän voimassa olevien arvojen mukainen. Esimerkiksi kuukausikenttään syötetyn arvon tulisi olla välillä 1 - 12 tai yksilön iän on oltava alle 130. Tietojen arvon oikeellisuus voidaan varmistaa ohjelmallisesti hakutaulukoiden tai muokkaustarkistusten avulla.
  • Virheelliset tiedot - On mahdollista, että data-arvo voi olla oikea, mutta ei tarkka. Toisinaan on käytännöllistä tutkia muita tiedostoja tai kenttiä selvittääksesi, onko tietoarvo oikein käytetyn kontekstin perusteella. Silti tarkkuus voidaan usein vahvistaa vain manuaalisella varmennuksella.
  • Liiketoimintasääntöjen rikkomukset - Liiketoimintaa rikkovat tiedot ovat toisen tyyppisiä likaisia ​​tietoja. Esimerkiksi voimaantulopäivän on oltava aina ennen viimeistä voimassaolopäivää. Toinen esimerkki yrityssääntöjen rikkomisesta voi olla potilaan Medicare-vakuutusvaate, jossa potilas voi olla vielä eläkeiän alaisena eikä hänellä ole oikeutta Medicareen.
  • Epäjohdonmukaiset tiedot - Valitsemattomat tietojen redundanssit johtavat tietojen epäjohdonmukaisuuksiin. Jokaiseen organisaatioon liittyy epäjohdonmukaisia ​​ja toistuvia tietoja. Tämä on erityisen tyypillistä asiakastietojen kanssa.
  • Puutteelliset tiedot - Tiedot, joista puuttuvat arvot, ovat puutteellisten tietojen päätyyppi.
  • Päällekkäiset tiedot - Päällekkäisiä tietoja voi ilmetä toistuvien lähetysten, virheellisen tietojen yhdistämisen tai käyttäjän virheiden vuoksi.

Tietojen laadun parantamiseksi ja likaisen tiedon estämiseksi organisaatioiden olisi sisällytettävä menetelmät tietojen täydellisyyden, pätevyyden, johdonmukaisuuden ja oikeellisuuden varmistamiseksi.

Mikä on likaista tietoa? - määritelmä techopediasta