Sisällysluettelo:
Määritelmä - mitä Deep Q-Networks tarkoittaa?
Deep Q Networks (DQN) ovat hermoverkkoja (ja / tai niihin liittyviä työkaluja), jotka hyödyntävät syvää Q-oppimista tarjotakseen malleja, kuten älykkäiden videopelien simulaation. Sen sijaan, että Deep Q Networks olisi nimenomainen tietylle hermoverkkorakennukselle, se voi koostua konvoluutiohermostoista ja muista rakenteista, jotka käyttävät erityisiä menetelmiä oppiakseen erilaisista prosesseista.
Techopedia selittää Deep Q-Networksin
Syvän Q-oppimisen menetelmä käyttää tyypillisesti jotain, jota kutsutaan yleiseksi politiikan iteraatioksi, jota kuvataan politiikan arvioinnin ja politiikan iteraation yhdistelmänä, politiikkojen oppimiseksi korkean ulottuvuuden aistien kautta.
Esimerkiksi yleinen tyyppi syvä Q-verkko, jota kattavat tekniikkajulkaisut, kuten Medium, vie aistitulon Atari 2600 -peleistä mallitulosten mallinnukseen. Tämä tapahtuu hyvin perustavalla tasolla keräämällä näytteitä, tallentamalla niitä ja käyttämällä niitä kokemuksen uusintaan Q-verkon päivittämiseksi.
Yleisessä mielessä syvät Q-verkot harjoittavat syöttöjä, jotka edustavat aktiivisia toimijoita alueilla tai muissa kokeneissa näytteissä, ja oppivat sovittamaan nämä tiedot haluttuihin lähtöihin. Tämä on tehokas keinoälyn kehittämisessä käytettävä menetelmä, jolla voidaan pelata shakkeja kuten korkealla tasolla tai suorittaa muita korkean tason kognitiivisia toimia - esimerkiksi Atari- tai shakkivideopelien esimerkki on myös hyvä esimerkki siitä, kuinka AI käyttää inhimillisten tekijöiden perinteisesti käyttämät rajapintatyypit.
Toisin sanoen syvällä Q-oppimisella AI-pelaaja tulee olemaan enemmän kuin ihmispelaaja oppimisessa haluttujen tulosten saavuttamiseksi.