Sisällysluettelo:
Määritelmä - Mitä ulkopuolinen havaitseminen tarkoittaa?
Ulkopuolinen havaitseminen on prosessi, jolla havaitaan poikkeamat ja myöhemmin poistetaan ne tietystä datajoukosta.
Poikkeama voidaan määritellä tietoksi tai havainnoksi, joka poikkeaa huomattavasti annetusta normista tai tietojoukon keskiarvosta. Poikkeama voi johtua vain sattumasta, mutta se voi myös viitata mittausvirheeseen tai siihen, että annetulla tietojoukolla on raskaanpäällinen jakauma.
Tässä on yksinkertainen skenaario ulkopuoliseen havaitsemiseen. Mittausprosessi tuottaa jatkuvasti lukemat välillä 1–10, mutta joissain harvinaisissa tapauksissa saamme mittaukset suurempia kuin 20.
Näitä harvinaisia normin ulkopuolella olevia mittauksia kutsutaan poikkeavuuksiksi, koska ne "sijaitsevat" normaalin jakautumiskäyrän ulkopuolella.
Techopedia selittää ulkoisen havaitsemisen
Ei todellakaan ole standardisoitua ja jäykkää matemaattista menetelmää poikkeavuuden määrittämiseksi, koska se todella vaihtelee joukon tai tietopopulaation mukaan, joten sen määrittämisestä ja havainnasta tulee lopulta subjektiivinen. Jatkuvalla näytteenotolla tietyllä tietokentällä voidaan määrittää ulkopuolisen ominaisuudet havaitsemisen helpottamiseksi.
Poikkeavuuksien havaitsemiseksi on olemassa malliperusteisia menetelmiä, ja ne olettavat, että kaikki tiedot on otettu normaalijakaumasta ja että niiden avulla voidaan tunnistaa poikkeamina havainnot tai kohdat, joiden katsotaan olevan epätodennäköisiä keskipisteen tai keskihajonnan perusteella. Ulkopuoliselle havaitsemiselle on olemassa useita menetelmiä:
- Grubbin testi poikkeajille - Tämä perustuu oletukseen, että tiedot ovat normaalijakaumia ja poistavat yhden ulkopinnan kerrallaan testin toistettaessa, kunnes enempää poikkeavia ei löydy.
- Dixonin Q-testi - Perustuu myös tietojoukon normaalisuuteen, tämä menetelmä testaa huonon datan varalta. On huomattu, että tätä tulisi käyttää säästeliäästi eikä koskaan useammin kuin kerran tietojoukossa.
- Chauvenetin kriteeri - Tätä käytetään analysoimaan, onko ulkopuoli väärää vai onko se edelleen rajoissa, ja katsotaanko se joukkona. Keskiarvo ja keskihajonta otetaan ja lasketaan todennäköisyys, että poikkeavuus tapahtuu. Tulokset määrittävät, onko se sisällytettävä vai ei.
- Piercen kriteeri - Virheraja asetetaan havainnointisarjalle, jonka jälkeen kaikki havainnot hylätään, koska niihin liittyy jo niin suuri virhe.
