Sisällysluettelo:
Määritelmä - mitä merkitsemätön data tarkoittaa?
Leimaamattomalla tiedolla tarkoitetaan tietoja, joita ei ole merkitty tunnisteilla, jotka yksilöivät ominaisuudet, ominaisuudet tai luokitukset. Leimaamattomia tietoja käytetään tyypillisesti erilaisissa koneoppimismuodoissa.
Techopedia selittää leimaamattomat tiedot
Koneoppimisen tyypeissä, joita kutsutaan valvomattomiksi koneoppimisiksi, koneoppimisohjelma toimii arvioimalla merkitsemättömien tietojen sarjoja. Koska tiedoilla ei ole etikettejä, koneoppimisohjelman on tunnistettava jokainen tietokappale sen ominaisuuksista ja ominaisuuksista.
Yksi parhaimmista tavoista selittää tämä on käyttää hedelmäkulhojen metafooria. Oletetaan, että koneoppimisohjelma oppii tunnistamaan kolme erilaista hedelmää - banaaneja, viinirypäleitä ja omenoita. Jos alkuperäisen koulutusjoukon tiedot on merkitty, koneoppimisohjelma toimii tästä näkökulmasta - sovittamalla peräkkäiset kuvat yhteen näistä kolmesta luokasta.
Jos mikään datakappale ei kuitenkaan merkitä kolmella hedelmänimellä - banaaneilla, viinirypäleillä ja omenoilla -, koneoppimisohjelman on toimittava arvioimalla jokainen kuva ja tarkastelemalla ominaisuuksia, kuten väri - keltainen, punainen tai violetti - muoto - pitkä ja ohut, pyöreä tai klusteroitu - ja muut ominaisuudet.
Tästä esimerkistä on helppo nähdä, kuinka merkityt tiedot tarjoavat paljon helpompia mahdollisuuksia käyttää koneoppimisalgoritmeja päätöksenteon tuloksiin. Leikkaamattomiin tietoihin erikoistuneet hienostuneet, valvomattomat koneoppimisohjelmat voivat kuitenkin tuottaa myös hämmästyttävän tarkkoja ja tarkkoja tuloksia.
