Sisällysluettelo:
Määritelmä - mitä Canonicalization tarkoittaa?
Kanonisointi on prosessi muuntaa tietoja, jotka sisältävät useamman kuin yhden esityksen vakiohyväksyttyyn muotoon. Tällainen muuntaminen varmistaa, että data on kanonisten sääntöjen mukainen. Tässä verrataan erilaisia esityksiä vastaavuuden varmistamiseksi, erillisten tietorakenteiden lukumäärän laskemiseksi, tarkoituksenmukaisen lajittelujärjestyksen asettamiseksi ja algoritmin tehokkuuden parantamiseksi eliminoimalla toistuvat laskelmat.
Kanonisointia käytetään lukuisissa Internet- ja tietokonesovelluksissa kanonisen datan tuottamiseksi ei-kanonisesta tiedosta. Tietojen kanoninen esitys on laajalti käytössä
hakukoneoptimointi (SEO), Web-palvelimet, Unicode ja XML.
Tätä termiä kutsutaan myös nimellä C14N, standardisointi tai normalisointi.
Techopedia selittää kanalisoinnin
SEO: ssa URL-osoitteiden kanonisointi käsittelee web-sisältöä, jolla on useampi kuin yksi mahdollinen URL. Tämä voi luoda eroja hakuissa, koska hakukone ei ehkä tiedä, mikä URL-osoite tulisi näyttää. Canonicalization valitsee parhaan URL-osoitteen useista vaihtoehdoista, viitaten yleensä kotisivuille. Vaikka tietyt URL-osoitteet näyttävät olevan samat, Web-palvelimet tuottavat URL-osoitteille erilaisia tuloksia. Hakukoneet tarkastelevat vain yhtä URL-osoitetta kanonisessa muodossa.
Tietoturva perustuu tiedostonimen kanonisointiin. Joillakin Web-palvelimilla voi olla tietosuojasääntö tiedostojen suorittamiseksi vain tietyssä hakemistossa. Tiedosto suoritetaan sitten vain, jos polun nimessä on määritetty hakemisto. Erityisen huolellista on tarkistaa, onko tiedostonimi ainutlaatuinen esitys. Tällaista haavoittuvuutta kutsutaan hakemiston läpikulkuksi.
Suurimmalla osalla Unicode-standardin merkkejä on vaihtuvapituinen koodaus. Tämä edellyttää kunkin merkkijonon harkintaa ja tekee merkkijonon validoinnista monimutkaisemman. Jos kaikkia merkkikoodauksia ei oteta huomioon ohjelmistototeutuksessa, virheet voivat syntyä. Tämä ongelma voidaan poistaa käyttämällä yhtä koodausta jokaiselle merkille. Paras vaihtoehto, jonka kaikki ohjelmistot voivat käyttää, on tarkistaa, onko merkkijono kanonisoitu. Jouset, joita ei ole kanonisoitu, voidaan hylätä.
Kanoninen XML-dokumentti on XML-asiakirja XML-kanonisessa muodossa. Se määritellään kanonisella XML-määritelmällä. XML: n Canonicalization eliminoi tunnisteiden sisäisen tilan, lajittelee nimiavaruusviitteet ja tarpeeton, ja käyttää tiettyjä merkkikoodauksia. Se poistaa myös XML- ja DOCTYPE-ilmoitukset, sen lisäksi, että suhteelliset URL-osoitteet muunnetaan absoluuttisiksi URL-osoitteiksi.