K:
Kuinka max-yhdistäminen auttaa tekemään AlexNetistä loistavan tekniikan kuvankäsittelyyn?
V:AlexNetissä, innovatiivisessa konvoluutiohermossa, maksimaalisen yhdistämisen käsite lisätään monimutkaiseen malliin, jossa on useita konvoluutiokerroksia, osittain tarkoituksena auttaa sovittamisessa ja virtaviivaistaa työtä, jota hermoverkko tekee työskennellessään kuvien kanssa asiantuntijoiden kutsumalla "epälineaarinen pienentämisstrategia."
AlexNetia pidetään laajasti melko suurena CNN: nä, koska se on voittanut vuoden 2012 ILSVRC: n (ImageNetin laaja-alainen visuaalinen tunnistushaaste), jota pidetään vesistöalueen tapahtumana koneoppimiseen ja hermoverkkojen etenemiseen (jotkut kutsuvat sitä tietokoneenäkymän "olympialaisiksi"). ).
Verkossa, jossa koulutus on jaettu kahteen GPU: hon, on viisi konvoluutiokerrosta, kolme täysin kytkettyä kerrosta ja joitain max pooling-toteutusta.
Pohjimmiltaan, maksimaalinen yhdistäminen vie "yhdistelmän" tuloksia neuronien kokoelmasta ja soveltaa niitä seuraavan kerroksen arvoihin. Toinen tapa ymmärtää tämä on se, että max pooling -lähestymistapa voi yhdistää ja yksinkertaistaa arvoja mallin sopivuuden lisäämiseksi.
Suurin yhdistäminen voi auttaa laskemaan kaltevuuksia. Voitaisiin sanoa, että se "vähentää laskentataakkaa" tai "kutistuu liian sopiviksi" - alasnäytteiden kautta max yhdistäminen kytkeytyy niin kutsuttuun "ulottuvuuden vähentämiseen".
Dimensionaalisuuden vähentäminen käsittelee ylimääräisen mallin olemassaoloa, jota on vaikea ajaa hermoverkon läpi. Kuvittele monimutkainen muoto, jossa on monia pieniä viirattuja muotoja ja jokainen pieni osa tästä viivasta edustaa datapistettä. Mitoituksen pienentämisen avulla insinöörit auttavat koneoppimisohjelmaa “pienentämään” tai ottamaan näytteitä vähemmän datapisteitä, jotta koko malli olisi yksinkertaisempi. Siksi, jos tarkastelet maksimaalista yhdistämiskerrosta ja sen tulosta, voit joskus nähdä yksinkertaisemman pikselin, joka vastaa ulottuvuuden pienentämisstrategiaa.
AlexNet käyttää myös toimintoa, jota kutsutaan tasasuuntaisiksi lineaarisiksi yksiköiksi (ReLU), ja max-pooling voi olla täydentävä tätä tekniikkaa käsittelemällä kuvia CNN: n kautta.
Asiantuntijat ja projektiin osallistujat ovat toimittaneet runsaasti visuaalisia malleja, yhtälöitä ja muita yksityiskohtia osoittaaksesi AlexNetin erityisen rakenteen, mutta yleisessä mielessä voit ajatella max-yhdistämistä useiden keinotekoisten neuronien tuotannon yhdistämiseksi tai vakiinnuttamiseksi. Tämä strategia on osa CNN: n kokonaisvaltaista rakennetta, josta on tullut synonyymi huippuluokan konenäkölle ja kuvan luokittelulle.