Tutorial Para Iniciantes Apache Nutch

1
Jason Guo 30 jun, 2010 - 14:24 Rastrear e pesquisar usando nutch, um tutorial para iniciantes Um simples tutorial é para nutch 0.9 e acima (ou seja, para o momento, 1.0 e 1.1-dev) rodando em um ambiente Unix. 1 Downloading nutch e Java 1.1 Nutch Escolha o seu espelho preferida aqui: http://www.apache.org/mirrors/ ( http://translate.googleusercontent.com/translate_c?depth=1&hl=pt- BR&rurl=translate.google.com&sl=auto&tl=pt-BR&u=http://www.apache.org /mirrors/&usg=ALkJrhjhpABcAIEr8yGoOtAPBE7_j4CCdQ ) . Depois de escolher o espelho de todo o projeto Apache irá aparecer na lista, vá até nutch e selecione a versão que você preferir, em formato zip ou. Tar.gz 1.2 Java Você vai precisar de Java 5 + para nutch 0.9 ou Java 6 +, se você pretende usar nutch 1.0 +. Java está disponível para download aqui: http://www.java.com/en/download/ ( http://translate.googleusercontent.com/translate_c?depth=1&hl=pt- BR&rurl=translate.google.com&sl=auto&tl=pt-BR&u=http://www.java.com /en/download/&usg=ALkJrhibzR_cTMRl-OJKIQ_O5VND8cH8Gg ) 2 Descompacte nutch ( http://translate.googleusercontent.com/translate_c?depth=1&hl=pt-BR&rurl=translate. sl=auto&tl=pt-BR&u=http://www.xing.net.au/&usg=ALkJrhgWvI-XDF8lXWsaPujdlq33wrZO_A ) //WWW.XING.NET.AU/&USG=ALKJRHGWVI-XDF8LXWSAPUJDLQ33WRZO_A) BLOGS (HTTP://TRANSLATE.GOOGLEUSERCONTENT.COM/TRANSLATE_C?DEPTH=1&HL=PT-BR&RURL=TRANSLATE.GOOGLE.COM&SL=AUTO&TL= //WWW.XING.NET.AU/BLOGS&USG=ALKJRHHIPV685OPNWTVI0GF5JNYBTHNPTG) FALE CONOSCO (HTTP://TRANSLATE.GOOGLEUSERCONTENT.COM/TRANSLATE_C?DEPTH=1&HL=PT-BR&RURL=TRANSLATE.GOOGLE.COM&SL BR&U=HTTP://WWW.XING.NET.AU/CONTACT-US&USG=ALKJRHHRI_-A3HFBS4WC0O2TKRJTELMLMQ) inglês: Crawl and search using nutch, a tutorial for beginners Tradutor Ver: Do: Detectar idioma Para o: português Original Tradução Google Tradutor http://translate.google.com/translate?hl=pt&sl=auto&tl... 1 de 1 06-08-2013 21:56

Transcript of Tutorial Para Iniciantes Apache Nutch

Page 1: Tutorial Para Iniciantes Apache Nutch

Jason Guo 30 jun, 2010 - 14:24

Rastrear e pesquisar usandonutch, um tutorial parainiciantes

Um simples tutorial é para nutch 0.9 e acima (ou seja, para o momento, 1.0 e 1.1-dev)

rodando em um ambiente Unix.

1 Downloading nutch e Java1.1 Nutch

Escolha o seu espelho preferida aqui: http://www.apache.org/mirrors/

(http://translate.googleusercontent.com/translate_c?depth=1&hl=pt-

BR&rurl=translate.google.com&sl=auto&tl=pt-BR&u=http://www.apache.org

/mirrors/&usg=ALkJrhjhpABcAIEr8yGoOtAPBE7_j4CCdQ) . Depois de escolher

o espelho de todo o projeto Apache irá aparecer na lista, vá até nutch e selecione a

versão que você preferir, em formato zip ou. Tar.gz

1.2 Java

Você vai precisar de Java 5 + para nutch 0.9 ou Java 6 +, se você pretende usar nutch

1.0 +. Java está disponível para download aqui: http://www.java.com/en/download/

(http://translate.googleusercontent.com/translate_c?depth=1&hl=pt-

BR&rurl=translate.google.com&sl=auto&tl=pt-BR&u=http://www.java.com

/en/download/&usg=ALkJrhibzR_cTMRl-OJKIQ_O5VND8cH8Gg)

2 Descompacte nutch

(http://translate.googleusercontent.com/translate_c?depth=1&hl=pt-BR&rurl=translate.google.com&

sl=auto&tl=pt-BR&u=http://www.xing.net.au/&usg=ALkJrhgWvI-XDF8lXWsaPujdlq33wrZO_A)

//WWW.XING.NET.AU/&USG=ALKJRHGWVI-XDF8LXWSAPUJDLQ33WRZO_A)

BLOGS (HTTP://TRANSLATE.GOOGLEUSERCONTENT.COM/TRANSLATE_C?DEPTH=1&HL=PT-BR&RURL=TRANSLATE.GOOGLE.COM&SL=AUTO&TL=PT-BR&U=HTTP:

//WWW.XING.NET.AU/BLOGS&USG=ALKJRHHIPV685OPNWTVI0GF5JNYBTHNPTG)

FALE CONOSCO (HTTP://TRANSLATE.GOOGLEUSERCONTENT.COM/TRANSLATE_C?DEPTH=1&HL=PT-BR&RURL=TRANSLATE.GOOGLE.COM&SL=AUTO&

BR&U=HTTP://WWW.XING.NET.AU/CONTACT-US&USG=ALKJRHHRI_-A3HFBS4WC0O2TKRJTELMLMQ)inglês:

Crawl and search using nutch, a tutorial for

beginners

Tradutor Ver:Do: Detectar idioma

Para o: português

OriginalTradução

Google Tradutor http://translate.google.com/translate?hl=pt&sl=auto&tl...

1 de 1 06-08-2013 21:56