Sisällysluettelo:
Määritelmä - Mitä Apache Nutch tarkoittaa?
Apache Nutch on verkkoindeksointiohjelmisto, jota voidaan käyttää tietojen keräämiseen verkosta. Sitä käytetään yhdessä muiden Apache-työkalujen, kuten Hadoopin kanssa, tietojen analysointiin.
Techopedia selittää Apache Nutchin
Apache Nutch on avoimen lähdekoodin tuote, jonka on lisensoinut Apache Software Foundation. Tällä kehittäjäyhteisöllä on lisenssejä monille Apache-ohjelmistotyökaluille, jotka voivat lajitella ja analysoida tietoja. Yksi keskeisistä tekniikoista on Apache Hadoop, iso tietoanalyysityökalu, joka on erittäin suosittu yritysyhteisössä.
Niiden työkalujen kuten Apache Hadoop ja tiedostojen tallennus-, analysointi- ja muiden ominaisuuksien lisäksi Nutchin tehtävänä on kerätä ja tallentaa tietoja verkosta web-indeksointialgoritmien avulla.
Käyttäjät voivat hyödyntää yksinkertaisia komentoja Apache Nutchissa kerätäksesi tietoja URL-osoitteiden alle. Käyttäjät käyttävät tyypillisesti Apache Nutchia yhdessä toisen avoimen lähdekoodin työkalun, Apache Solr -nimisen kehyksen kanssa, joka voi toimia Apache Nutchin kanssa kerättyjen tietojen varastona.
