Koti Trends Mikä on apache nutch? - määritelmä techopediasta

Mikä on apache nutch? - määritelmä techopediasta

Sisällysluettelo:

Anonim

Määritelmä - Mitä Apache Nutch tarkoittaa?

Apache Nutch on verkkoindeksointiohjelmisto, jota voidaan käyttää tietojen keräämiseen verkosta. Sitä käytetään yhdessä muiden Apache-työkalujen, kuten Hadoopin kanssa, tietojen analysointiin.

Techopedia selittää Apache Nutchin

Apache Nutch on avoimen lähdekoodin tuote, jonka on lisensoinut Apache Software Foundation. Tällä kehittäjäyhteisöllä on lisenssejä monille Apache-ohjelmistotyökaluille, jotka voivat lajitella ja analysoida tietoja. Yksi keskeisistä tekniikoista on Apache Hadoop, iso tietoanalyysityökalu, joka on erittäin suosittu yritysyhteisössä.

Niiden työkalujen kuten Apache Hadoop ja tiedostojen tallennus-, analysointi- ja muiden ominaisuuksien lisäksi Nutchin tehtävänä on kerätä ja tallentaa tietoja verkosta web-indeksointialgoritmien avulla.

Käyttäjät voivat hyödyntää yksinkertaisia ​​komentoja Apache Nutchissa kerätäksesi tietoja URL-osoitteiden alle. Käyttäjät käyttävät tyypillisesti Apache Nutchia yhdessä toisen avoimen lähdekoodin työkalun, Apache Solr -nimisen kehyksen kanssa, joka voi toimia Apache Nutchin kanssa kerättyjen tietojen varastona.

Mikä on apache nutch? - määritelmä techopediasta