Sisällysluettelo:
Määritelmä - mitä arvon oppimisen ongelma tarkoittaa?
Arvon oppimisongelma on erityinen peruskysymys koneoppimisen ja tekoälyn tekniikoiden kehittämisessä, ja siinä käsitellään ihmisen ja tietokoneen välistä eroa ja heidän ajattelutapojaan.
Lyhyesti sanottuna, arvon oppimisen ongelma perustuu siihen, kuinka vaikeaa tietokoneiden on selvittää, mitä "arvottaa" (sekä datan että politiikan kannalta) ja miten toimia koneoppimisverkossa, ja kuinka ohjelmoijat voivat optimoida miten ohjelma toimii vastaamaan alkuperäisiä aikomuksiaan, kun he tekivät sen.
Techopedia selittää arvon oppimisen ongelman
Avain arvon oppimisongelmaan on, että ohjelmoijille on erittäin tärkeää pystyä valmistamaan koneoppimisohjelmia, jotka suorittavat suunnitellut arvot. Saalis-22 on kuitenkin se, että arvoja ei voida nimenomaisesti ilmaista tavoilla, jotka estävät itse ohjelman oppimista.
Ihmiset puhuvat joskus koneoppimistekniikoiden "lähentymisestä" onnistuneena arvotietoihin keskittymisenä, mutta arvonoppimisongelma on tietyllä tavalla hiukan erilainen. Ajatuksena on, että koneenoppimisohjelmalle on oltava jokin ydin, jolla halutaan näyttää, sen sijaan, että kirjoitettaisiin vain oikea kirjoitus, joka on deterministinen tapa suorittaa ML.
Otetaan esimerkiksi tämä asiakirja arvon oppimisongelmasta, joka ehdottaa, että koneoppimisohjelmilla voisi olla tallennuspaketti syötteitä, jotka osoittavat ihmisen positiivisen reaktion ärsykkeisiin. Kun luet tämän tyyppisiä osoitteita arvo-oppimisongelmaan, käy selväksi, että koneoppimisessa on suuri aukko, jota ei ole helppo korjata - lähinnä miten - miten ihmiset luovat koneita, jotka todella ajattelevat ihmisiä? Toinen tapa selittää tämä on se, että arvon oppimisongelma menee sen ytimeen, kuinka ajattelemme ihmisinä ja kuinka ajatuksemme eivät aina perustu rote-syötteeseen.
Jotta tietokoneet voisivat mallintaa intuitioamme, vaistoamme, sosiaalisia taipumuksiamme ja syvimpiä eettisiä arvojamme, se on korkea järjestys, vaikka tietokoneet voivat oppia pelaamaan shakkia inhimillisellä tavalla tai syrjäyttämään meitä ratkaisemaan vaikeita matemaattisia ongelmia. Ammattilaiset voivat odottaa, että arvo-opiskeluohjelma on edelleen keskeinen osa koneoppimistekniikoiden kehittämistä.