Sisällysluettelo:
Määritelmä - mitä klusterianalyysi tarkoittaa?
Klusterianalyysi on tilastollinen luokittelumenetelmä, jossa joukko esineitä tai pisteitä, joilla on samanlaiset ominaisuudet, on ryhmitelty klusteihin. Se käsittää joukon erilaisia algoritmeja ja menetelmiä, joita kaikkia käytetään samanlaisten objektien ryhmittelemiseen vastaaviin luokkiin. Klusterianalyysin tavoitteena on organisoida havaittu tieto merkityksellisiin rakenteisiin saadakseen niistä ymmärrystä enemmän.Techopedia selittää klusterianalyysin
Klusterianalyysiä voidaan pitää etsivän tietoanalyysin työkaluna, jonka tarkoituksena on lajitella eri kohteet merkityksellisiin ryhmiin siten, että näiden esineiden assosiointiaste on suurin, jos ne kuuluvat samaan ryhmään, ja vähintään, jos he eivät. Ryhmäanalyysiä käytetään tietojen piilotettujen rakenteiden tai suhteiden löytämiseen ilman tarvetta selittää tai tulkita, mikä tämä suhde on. Pohjimmiltaan klusterianalyysiä käytetään vain datasta löytyneiden rakenteiden löytämiseen selittämättä miksi nämä rakenteet tai suhteet ovat olemassa.
Klusterianalyysiä sovelletaan usein hyvin yksinkertaisiin asioihin, ilman että meitä tiedämme sitä, kuten ruokakaupparyhmien ruokaryhmittelyihin tai ryhmään ihmisiä, jotka syövät yhdessä ravintolassa. Ruokakaupassa elintarvikkeet ryhmitellään tyypin mukaan, kuten juomat, liha ja tuotteet; voimme jo nyt piirtää malleja näiden ryhmittymien suhteen.
