Koti Trends Mikä on yksinkertainen tapa kuvata koneoppimisen puolueellisuutta ja variaatiota?

Mikä on yksinkertainen tapa kuvata koneoppimisen puolueellisuutta ja variaatiota?

Anonim

K:

Mikä on yksinkertainen tapa kuvata koneoppimisen puolueellisuutta ja variaatiota?

V:

Koneoppimisessa esiintyvää puolueellisuutta ja variaatiota voidaan kuvata lukuisilla monimutkaisilla tavoilla. Monet heistä hyödyntävät merkittävästi monimutkaisia ​​matemaattisia yhtälöitä ja kuvaavat graafisesti kuinka erityiset esimerkit edustavat erilaisia ​​määriä sekä biaasia että varianssia.

Tässä on yksinkertainen tapa kuvata bias, varianssi ja bias / varianssin kompromissi koneoppimisessa.

Sen ytimessä puolueellisuus on yksinkertaistaminen. Voi olla tärkeää lisätä vääristymisen määritelmään jokin oletus tai oletettu virhe.

Jos erittäin puolueellinen tulos ei ollut virhe - jos se koski rahaa -, se olisi erittäin tarkka. Ongelmana on, että yksinkertaistettu malli sisältää joitain virheitä, joten sitä ei ole härän silmässä - merkittävä virhe toistuu tai jopa vahvistuu koneoppimisohjelman toimiessa.

Varianssin yksinkertainen määritelmä on, että tulokset ovat liian hajallaan. Tämä johtaa usein ohjelman liian monimutkaisuuteen ja ongelmiin testi- ja harjoitusjoukkojen välillä.

Suuri varianssi tarkoittaa, että pienet muutokset aiheuttavat suuria muutoksia tuotoksiin tai tuloksiin.

Toinen tapa yksinkertaisesti kuvailla varianssi on, että mallissa on liian paljon kohinaa, ja siten koneoppimisohjelman on vaikeampaa eristää ja tunnistaa todellinen signaali.

Joten yksi yksinkertaisimmista tavoista vertailla puolueellisuutta ja varianssia on ehdottaa, että koneoppimisinsinöörien on kuljettava hieno linja liikaa esijännityksen tai ylimääräisen yksinkertaistamisen ja liiallisen varianssin tai liikaa välillä.

Toinen tapa edustaa tätä kaivoa on neljän kvadrantin kaavio, joka näyttää kaikki korkean ja matalan varianssin yhdistelmät. Pienen poikkeaman / pienen varianssin kvadrantissa kaikki tulokset kootaan yhteen tarkkaan klusteriin. Tuloksessa korkea bias / matala varianssi, kaikki tulokset kootaan virheelliseen klusteriin. Pienellä biasoinnilla / suurella varianssituloksella tulokset ovat hajallaan keskipisteen ympäri, joka edustaisi tarkkaa klusteria, kun taas suuressa biasissa / suuressa varianssituloksessa datapisteet ovat sekä hajallaan että kollektiivisesti epätarkkoja.

Mikä on yksinkertainen tapa kuvata koneoppimisen puolueellisuutta ja variaatiota?