Koti kehitys Kuinka tasapainokäsite voi auttaa koneoppimisprojekteja?

Kuinka tasapainokäsite voi auttaa koneoppimisprojekteja?

Anonim

K:

Kuinka tasapainokäsite voi auttaa koneoppimisprojekteja?

V:

Yleensä tasapaino antaa tietoa koneoppimisesta pyrkiessä vakauttamaan koneoppimisympäristöjä ja luomaan tuloksia yhteensopivalla determinististen ja todennäköisyyskomponenttien yhdistelmällä.

Asiantuntijat kuvaavat "tasapainoa" tilanteena, jossa koneoppimisjärjestelmän rationaaliset toimijat saavuttavat yksimielisyyden strategisesta toiminnasta - etenkin Nashin tasapaino peliteoriassa käsittää kaksi tai useampia näistä järkevistä toimijoista yhdistämässä strategioita tunnustamalla, että mikään pelaaja ei hyöty tietyn strategian muuttaminen, jos muut pelaajat eivät muuta omaaan.

Ilmainen lataus: Koneoppiminen ja miksi sillä on merkitystä

Erityisen suosittu ja yksinkertainen Nash-tasapainon esittely sisältää yksinkertaisen matriisin, jossa kaksi pelaajaa valitsevat binaarisen lopputuloksen.

Yllä oleva on melko tekninen tapa kuvata tasapaino ja miten se toimii. Paljon epämuodollisempi tapa kuvata tasapainokäsitettä, erityisesti yllä oleva esimerkki kahdesta rationaalisesta toimijasta, joilla molemmilla on binaarivalinta, on miettiä sitä, mitä voisit kutsua "käveleväksi toisiaan kohti lukion käytävällä" -skenaariossa.

Oletetaan, että kaksi ihmistä kävelee eri suuntiin lukion käytävällä (tai muun tyyppisellä alueella), jossa on tilaa vain kahdelle henkilölle leveyden mukaan. Kaksi avointa polkua ovat binaaritulokset. Jos kaksi rationaalista toimijaa valitsevat erilaisia ​​binaarituloksia, jotka eivät ole ristiriidassa keskenään, he ohittavat toisensa ja sanovat hei. Jos he valitsevat kaksi ristiriitaista binaaritulosta - he kävelevät samassa tilassa, ja yhden heistä täytyy tuottaa.

Edellä olevassa esimerkissä, jos kaksi rationaalista toimijaa valitsevat kaksi yhteensopivaa ja ei-ristiriitaista tulosta, yleinen yksimielisyys on, että kukaan ei hyöty muuttamalla strategiaansa - tässä tapauksessa heidän kävelysuuntaan - jos toinen henkilö ei muuta omaansa.

Yllä oleva muodostaa tasapainon, joka voidaan mallintaa mihin tahansa tiettyyn koneoppimisrakenteeseen. Tämän yksinkertaisen esimerkin ansiosta lopputuloksena ovat aina kaksi rationaalista toimijaa, jotka toimivat yhteistyössä, toisin sanoen kaksi ihmistä, jotka kulkevat ohi toistensa.

Päinvastaista voitaisiin kutsua "epätasapainoksi" - jos kaksi rationaalista toimijaa valitsevat ristiriitaiset tulokset, kuten mainittiin, toisen niistä on annettava. Tätä mallinntava ML-ohjelma voidaan kuitenkin heittää äärettömään silmukkaan, jos molemmat päättävät tuottaa - aivan kuten kaksi ihmistä siirtyisi yrittämään sopeutua toisiinsa ja jatkaisivat edelleen kävelyä kohti törmäystä.

Yllä olevan kaltaisia ​​tasapainoja käytetään yleensä koneoppimisessa konsensuksen luomiseksi ja mallien vakauttamiseksi. Insinöörit ja kehittäjät etsivät niitä skenaarioita ja tilanteita, jotka hyötyvät tasapainosta, ja pyrkivät muuttamaan tai käsittelemään sellaisia, jotka eivät. Kun tarkastellaan reaalimaailman esimerkkejä, jotka vastaavat ML: n tasapainoa, on helppo nähdä, kuinka tällainen analyysi koneoppimisjärjestelmässä on ainutlaatuisesti opastavaa ihmisen käyttäytymisen mallintamiseksi luomalla rationaalisia toimijoita ja edustajia. Se on vain yksi erinomainen esimerkki siitä, kuinka tasapainoa voidaan käyttää edistykseen koneoppimisjärjestelmien soveltamisessa.

Kuinka tasapainokäsite voi auttaa koneoppimisprojekteja?