1
misaka19000 2017 年 5 月 4 日 via Android
这爬虫还把自己给暴露出来。。。神奇
|
2
woshinide300yuan 2017 年 5 月 4 日
这不是明显的该屏蔽的吗 - -
|
3
billlee 2017 年 5 月 4 日 耿直的爬虫
|
4
notes 2017 年 5 月 4 日 via Android
目测新手,用的还是自带的 urllib
|
5
bytenoob 2017 年 5 月 4 日 via Android 脚本小子
|
6
wspsxing 2017 年 5 月 4 日
UA 都不改一下,差评妥妥的。
|
7
ywgx 2017 年 5 月 4 日
留着过年?
|
8
LokiSharp 2017 年 5 月 4 日
估计故意的。。。看看有没有人处理
|
9
richardma 2017 年 5 月 5 日
猖狂的爬虫,23333
|
10
tonychow 2017 年 5 月 5 日
显然爬虫, 都不知道隐藏下 UA
|
11
araraloren 2017 年 5 月 5 日
~~
再明显不过的爬虫了。。 封了 IP 呗 |
12
crackhopper 2017 年 5 月 5 日
666666
|
13
yanzixuan 2017 年 5 月 5 日
连 UA 都不知道改的,估计是新手。另外你们的网站不设置一个 Limiter,限制一下一天的总的访问次数么?
如果对方换 IP,你就限制下 1 分钟 /1 小时之内的访问次数吧。 |
14
tttty 2017 年 5 月 5 日
请问一下,如果遇到爬虫直接封 IP,这样不是会导致共用公网 IP 的用户误伤吗.. 比如校园网、网吧什么的?
|
15
hard2reg 2017 年 5 月 5 日 via iPhone
弱弱的问下,requests 的默认 ua 是啥
|
16
jy02201949 2017 年 5 月 5 日
真是耿直啊,而且还在用 urllib,新手随便抄了网上哪个教程弄的爬虫吧
|
17
anexplore 2017 年 5 月 5 日
使用验证码机制啊
|
24
liuxu 2017 年 5 月 5 日
我虽然是个爬虫,但我行事坦荡,从不遮遮掩掩
|
25
fuxkcsdn 2017 年 5 月 5 日 @hard2reg
>>> import requests >>> requests.get('http://httpbin.org/user-agent').text u'{\n "user-agent": "python-requests/2.12.3"\n}\n' |
26
hsmocc 2017 年 5 月 5 日 via iPhone
封 IP 显然是下策啊,一段时间内访问次数达到一个上限后出验证码吧
|
27
tianxiacangshen OP @hsmocc 这样的话 每一次访问都要查询(次数)+插入数据库,不是很占用资源吗
|
29
dsg001 2017 年 5 月 5 日
这种 UA 直接返回乱码数据呗
|
30
qinbingchen 2017 年 5 月 5 日
难道这是我?
|
31
flyshu 2017 年 5 月 6 日
新手刚看了知乎的入门教程来练手了
|
32
dreamcountry 2017 年 7 月 16 日
我的网站也有大量的这种日志,这些人真是闲的蛋疼
|