Sisällysluettelo:
Määritelmä - Mitä ristivalidointi tarkoittaa?
Ristivalidointi on tekniikka, jota käytetään arvioimaan, kuinka tilastollisen analyysin tulokset yleistyvät riippumattomaksi tietojoukkoksi. Ristiinvalidointia käytetään laajalti asetuksissa, joissa tavoite on ennustus ja on tarpeen arvioida ennustavan mallin suorituskyvyn tarkkuus. Ensisijainen syy ristiinvalidoinnin käyttämiseen tavanomaisen validoinnin sijasta on, että tietojen jakamiseen erillisiin koulutus- ja testijoukkoihin (kuten tavanomaisessa validoinnissa) ei ole tarpeeksi tietoa. Tämä johtaa testaus- ja mallintamiskyvyn menettämiseen.
Ristiinvalidointi tunnetaan myös nimellä rotaationestimointi.
Techopedia selittää ristikkäisen validoinnin
Ennusteongelman ratkaisemiseksi malli varustetaan yleensä tunnetun datan tietojoukolla, jota kutsutaan harjoitustietosarjaksi, ja tuntemattomien tietojoukkojen kanssa, joita vastaan malli testataan, nimeltään testitietosarja. Tavoitteena on saada tietojoukko mallin testaamiseksi koulutusvaiheessa ja antaa sitten käsitys siitä, kuinka tietty malli mukautuu riippumattomaan tietojoukkoon. Ristiinvalidointikierros käsittää datan osittamisen täydentäviin osajoukkoihin, suorittamalla sitten analyysi yhdelle alajoukolle. Tämän jälkeen analyysi validoidaan muissa alajoukoissa (testisarjat). Vaihtelevuuden vähentämiseksi suoritetaan useita ristiintarkistuskierroksia käyttämällä monia erilaisia osioita, ja sitten saadaan tulosten keskiarvo. Ristivalidointi on tehokas tekniikka mallien suorituskykytekniikan arvioinnissa.