Sisällysluettelo:
Määritelmä - Mitä K-tarkoittaa klusterointia?
K-tarkoittaa klusterointia on yksinkertainen ohjaamaton oppimisalgoritmi, jota käytetään klusterointiongelmien ratkaisemiseen. Se seuraa yksinkertaista menettelyä luokittelemalla tietty tietojoukko joukkoon klustereita, jotka on määritelty kirjalla "k", joka on etukäteen kiinnitetty. Sitten klusterit sijoitetaan pisteinä ja kaikki havainnot tai datapisteet liitetään lähimpään klusteriin, lasketaan, säädetään ja sitten prosessi alkaa käyttämällä uusia säätöjä, kunnes haluttu tulos saavutetaan.
K-välineiden klusteroinnilla on käytöksiä hakukoneissa, markkinasegmentoinnissa, tilastoissa ja jopa tähtitiedessä.
Techopedia selittää K-Means-klusteroinnin
K-kertojen klusterointi on menetelmä klusterointianalyysiin, erityisesti tiedon louhinnan ja tilastojen alalla. Sen tarkoituksena on jakaa havaintojoukko joukkoon klustereita (k), mikä johtaa tietojen jakamiseen Voronoi-soluihin. Sitä voidaan pitää menetelmänä selville, mihin ryhmään tietty esine todella kuuluu.
Sitä käytetään pääasiassa tilastoihin ja sitä voidaan soveltaa melkein mihin tahansa tutkimusalaan. Esimerkiksi markkinoinnissa sitä voidaan käyttää ihmisten erilaisten väestötietojen ryhmittelemiseen yksinkertaisiin ryhmiin, jotka helpottavat markkinoijien kohdistamista. Tähtitieteilijät käyttävät sitä seuloakseen valtavia määriä tähtitieteellisiä tietoja; koska he eivät voi analysoida kutakin kohdetta yksitellen, he tarvitsevat tavan löytää kiinnostavia paikkoja tilastollisesti havainnointia ja tutkimusta varten.
Algoritmi:
- K-pisteet sijoitetaan objektitietotilaan, joka edustaa alustavaa keskoryhmien ryhmää.
- Jokainen objekti tai datapiste osoitetaan lähimmäksi k.
- Kun kaikki esineet on osoitettu, k-keskikohtien sijainnit lasketaan uudelleen.
- Vaiheet 2 ja 3 toistetaan, kunnes keskikohdan asennot eivät enää liiku.
