原文:nutch hadoop only one slave is crawling
我有一个3个奴隶聚居区,我在一个网站进行爬行。然而,只有1个奴隶在拿东西(尽管其他奴隶还活着 ) 。 这是正常行为,如果...
我有一个3个奴隶聚居区,我在一个网站进行爬行。然而,只有1个奴隶在拿东西(尽管其他奴隶还活着 ) 。 这是正常行为,如果...
难道在双子/冲积聚物指数的指挥中是否有参数显示,哪些是独聚物核心?
我很想知道,是否有一个简单的机制将非英文页排除在索引编制进程之外? 例如,黄玉米种子陶器清单含有多种语言的百基百页,......
I have a project using Lucene3.5 already. Now i need to provide web search function but i don t want to import the whole Nutch project. So i wonder , may be i can only use the crawler part of Nutch ...
我在UEC(Ubuntu企业云层)上有一个多功能集群,我认为,与UEC(Ubuntu企业云层)一道建立营养素是一个好的想法。
I m looking for a web crawler with the ability to grab the page s CSS. I don t need any other fancy crawling abilities. I m trying to make my way through Xapian, Nutch and Heritrix. They all seem to ...