如题,能否有人剖析下豆瓣的反爬策略
我的 IP 应该被加入了豆瓣的黑名单。
检测到有异常请求从你的 IP 发出,请 登录 使用豆瓣。
1
knightdf 2017 年 2 月 17 日
这能告诉你?
|
2
gimp 2017 年 2 月 17 日
买海量代理可解决绝大部分反爬问题
|
3
linbiaye 2017 年 2 月 17 日
这是要人吃豆瓣的饭砸豆瓣的锅。
|
4
murmur 2017 年 2 月 17 日
兄弟这不厚道啊
|
5
wangyifei6817 2017 年 2 月 17 日
有法院的同事吗?想请教下现行法律有什么漏洞
|
6
xidianlz 2017 年 2 月 17 日
有福彩中心的同事吗?想请教下下一期中奖号码是多少
|
7
quietcoder 2017 年 2 月 17 日
有监狱的同事吗?想请教一下怎么越狱
|
8
jixiangqd 2017 年 2 月 17 日
|
9
HGladIator 2017 年 2 月 17 日 via iPhone
有钻石矿井的同事吗?想请教一下怎么哪点儿回家
|
10
expkzb 2017 年 2 月 17 日
看标题,楼主应该在豆瓣工作
|
13
yopming 2017 年 2 月 17 日
我觉得楼主是也要建立反爬机制吧
|
14
lhbc 2017 年 2 月 17 日 via iPhone
有银行的同事吗?我想请教下小型机的和审计系统的 root 密码。
|
16
Famio 2017 年 2 月 17 日
我知道有一个人知道,而且这个人开发了收集豆瓣小组里妹子福利图片的 app ……
|
17
ywgx 2017 年 2 月 17 日
入职豆瓣,加白名单自己的 IP
|
18
sunchen 2017 年 2 月 17 日
没什么反爬啊
|
19
lhbc 2017 年 2 月 17 日 via iPhone
@expkzb 如果楼主是豆瓣员工,在公共论坛讨论公司机密。最轻最轻的处罚应该是开除,如果造成信息安全事故,可能还得承担民事或者刑事责任。
如果楼主不是豆瓣员工,那一定是伸手惯犯。 |
21
em70 2017 年 2 月 17 日 via Android
豆瓣防盗链就是按频率的,白天一分钟超过 40 次就出验证码,晚上放宽到 60
|
22
okboom 2017 年 2 月 17 日
代理就能解决,邪恶点用 tor 就可以( ╯□╰ )
|
23
wmttom 2017 年 2 月 17 日 via iPhone
以前做过的豆瓣抓取是,伪装真实浏览器 cookie ,每个 cookie 每分钟请求几十次,高频率容易被封 ip ,保持出验证码的低频多代理。然后出验证码都是英语单词,简单处理下背景,找个 OCR 接口一调,再做下单词纠错,自动提交验证码继续抓。
|
24
xrlin 2017 年 2 月 18 日
我的 ip 也被拉黑了,今天用 pyspider 爬取一些豆瓣的一些信息拿来练习下数据分析つ﹏⊂
|
25
IanPeverell 2017 年 2 月 20 日 via iPhone
可能会根据你的请求频率,短时间内请求数量,以及请求间隔是否有规律
所以我的想法是多代理,设随机不少于一定数值的延迟 |