firemail's Archiver
论坛
›
java
› Nutch爬虫项目
java
发表于 2019-2-22 15:12:14
Nutch爬虫项目
本帖最后由 java 于 2019-2-22 16:45 编辑
Nutch 是一个开源Java实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。包括全文搜索和Web爬虫。
nutch爬虫
配置主机名
hostname master
vi /etc/syscpnfig/network
vi ~/.bash_profile
ant runtime
会生成 runtime的包
页:
[1]
查看完整版本:
Nutch爬虫项目