Sisällysluettelo:
Määritelmä - mitä testijoukko tarkoittaa?
Koneoppimisessa käytettävä testijoukko on toissijainen (tai tertiäärinen) tietojoukko, jota käytetään koneoppimisohjelman testaamiseen sen jälkeen, kun se on koulutettu alkuperäisen harjoitustietosarjan avulla. Ajatuksena on, että ennustavilla malleilla on aina jonkinlainen tuntematon kapasiteetti, joka on testattava, toisin kuin analysoinnissa ohjelmointinäkökulmasta.
Testisarja tunnetaan myös testitietosarjana tai testitiedona.
Techopedia selittää testisarjan
Monet asiantuntijat sanoisivat, että paras tapa on testata tietojoukko, joka on "eroteltu" tai pidetty prosessin loppuun. Insinöörit etsivät mallin ylimääräistä asennusta ja muita koulutusprosessin aiheita. Ihannetapauksessa on kolmas joukko, validointitietosarja, joka testaa luokittelijaparametreja. Sitten, ja vasta sitten, testijoukko voidaan tuoda esiin nähdäksesi kuinka hyvin ohjelmaa on koulutettu ja onko sen ennustava malli oikein uusissa tiedoissa. Vaikka jotkut mallit saattavat välttää osioidun testijoukon luomisen kokonaan, sitä pidetään usein lyhytnäköisyytenä, koska käytännön testauksen puute voi jättää ohjelman alttiiksi epätarkkuudelle.
