java 发表于 2019-2-22 15:12:14

Nutch爬虫项目

本帖最后由 java 于 2019-2-22 16:45 编辑

Nutch 是一个开源Java实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。包括全文搜索和Web爬虫。
nutch爬虫

配置主机名
hostname master

vi /etc/syscpnfig/network   

vi ~/.bash_profile


ant runtime
会生成 runtime的包




页: [1]
查看完整版本: Nutch爬虫项目