Sisällysluettelo:
Määritelmä - Mitä K-Lähin naapuri (K-NN) tarkoittaa?
K-lähimmän naapurin algoritmi, usein lyhennettynä k-nn, on lähestymistapa datan luokitukseen, joka arvioi, kuinka todennäköisesti datapiste on yhden tai toisen ryhmän jäsen sen mukaan, missä ryhmässä sitä lähimmät datapisteet ovat .
K-lähin naapuri on esimerkki "laiska oppija" -algoritmista, mikä tarkoittaa, että se ei rakenna mallia koulutusjoukon avulla ennen kuin tietojoukon kysely suoritetaan.
Techopedia selittää K-Lähin naapuri (K-NN)
K-lähin naapuri on datan luokittelualgoritmi, joka yrittää määrittää, mihin ryhmään datapiste kuuluu tarkastelemalla sen ympärillä olevia datapisteitä.
Algoritmi, joka etsii yhtä pistettä ruudukossa, yrittää selvittää, onko piste ryhmässä A tai B, tarkastelee sen lähellä olevien pisteiden tilaa. Alue määritetään mielivaltaisesti, mutta tarkoituksena on ottaa näyte tiedoista. Jos suurin osa pisteistä on ryhmässä A, on todennäköistä, että kyseinen datapiste on A eikä B ja päinvastoin.
K-lähin naapuri on esimerkki "laiska oppija" -algoritmista, koska se ei luo tietojoukon mallia etukäteen. Ainoat laskelmat ovat, kun sitä pyydetään kysymään datapisteen naapureita. Tämän avulla k-nn on erittäin helppo toteuttaa tiedon louhintaan.