Sisällysluettelo:
Määritelmä - mitä ylimääräinen asennus tarkoittaa?
Tilastoinnissa ja koneoppimisessa ylimääräinen asennus tapahtuu, kun malli yrittää ennustaa liian meluisen datan kehityksen. Yliasennus on seurausta liian monimutkaisesta mallista, jolla on liian monta parametria. Yli asennettu malli on epätarkka, koska trendi ei heijasta datan todellisuutta.
Techopedia selittää ylimääräisen asennuksen
Yli asennettu malli on malli, jonka trendisuunta heijastaa virheitä tiedoissa, joita sillä koulutetaan, sen sijaan, että ennustaisi tarkasti näkymätöntä tietoa. Tämä näkyy paremmin visuaalisesti datapistekuvaajan ja trendilinjan avulla. Yli asennettu malli näyttää käyrän, jossa on korkeammat ja matalammat pisteet, kun taas oikein asennetussa mallissa on sileä käyrä tai lineaarinen regressio.
Yliasennuksen pääongelma on, että malli on muistellut tehokkaasti olemassa olevat tietopisteet sen sijaan, että yrittäisi ennustaa, kuinka näkymättömät tietopisteet olisivat.
Ylimääräinen asennus johtuu tyypillisesti liiallisesta harjoituspisteiden määrästä. On olemassa useita tekniikoita, joita koneoppimistutkijat voivat käyttää ylimääräisen asennuksen lieventämiseen, mukaan lukien ristivalidointi, vakiointi, varhainen lopettaminen, karsinta, Bayesin esijännitteet, keskeyttäminen ja mallien vertailu.
