This topic created in 3886 days ago, the information mentioned may be changed or developed.
想学习用 Python 写一个简单的代理抓取器
抓取几个页面的代理
测试延迟 高于 xxx 的抛弃
然后导出 TXT
2 replies • 2015-11-03 14:07:08 +08:00
 |
|
1
wkdhf233 Nov 3, 2015
读 html ,正则匹配出代理信息,然后遍历 ping 一遍 ping 可以搞个线程池高并发
不过感觉网页上抓的代理,测延迟不如测连通性
|