1
tikazyq 2019 年 5 月 27 日
需要记录代理 ip 的有效性,如果是使用了 API,先缓存到数据库中。
顺便打个广告,Crawlab 是一个专注于爬虫的集成了爬虫管理、任务调度、任务监控、数据分析等模块的分布式爬虫管理平台,非常适合对爬虫管理、爬虫工程化有要求的开发者及企业 https: //github.com/tikazyq/crawlab |
2
lucays 2019 年 5 月 28 日 via Android
有中间件的,在 middleware 里写,至少按照 response.status 判断是不是 200
|
3
popbayun 2019 年 6 月 5 日
建个代理 IP 池,失效或被 ban 就从池子里剔除掉
|