开源爬虫框架Heritrix的初次使用

开源爬虫框架Heritrix的初次使用

1. 使用Heritrix 爬取网络资源1.1. 什么是网络爬虫网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页...