只是到网页爬取一些数据,有哪些开源java爬虫可用、易用、可以自己扩展的?之前没有用过,希望大(shui)神(huo)们指点一二。
查到有很多,
Nutch
Heritrix
JSpider
WebMagic
WebCollector
等等等等。
http://www.oschina.net/project/tag/64/spider?sort=view&lang=19&os=0
查到有很多,
Nutch
Heritrix
JSpider
WebMagic
WebCollector
等等等等。
http://www.oschina.net/project/tag/64/spider?sort=view&lang=19&os=0
![](http://e.hiphotos.baidu.com/zhidao/pic/item/9f2f070828381f30a5a7762ea9014c086f06f0ff.jpg?v=tbs)