http://ww2.sinaimg.cn/large/74cae53fgw1er9qef10uvj21iu08641q.jpg
遇到这些数据如何post(校园网爬虫)
1
lk09364 2015 年 4 月 18 日
base64,不是的话分析JS 啊。
|
2
mV2GK 2015 年 4 月 18 日
应该是base64编码后的。。。
|
3
Septembers 2015 年 4 月 18 日
|
4
Comdex 2015 年 4 月 18 日
正方教务系统?
|
5
zts1993 2015 年 4 月 18 日 via Android
ViewState
先抓取页面上的ViewState使用同样的Cookie信息登陆, |
7
insaneDream OP @Comdex 嗯。。。是的
|
8
latteczy 2015 年 4 月 18 日
直接复制,然后post就行
|
9
insaneDream OP @latteczy 试过。。。不行。。。
|
11
donghouhe 2015 年 4 月 19 日 via Android
http头host有没有加?python默认不带host
|
12
pi1ot 2015 年 4 月 19 日
末尾带等号的字母数字多半是BASE64
|
13
lincanbin 2015 年 4 月 19 日 viewstate
asp.net里的,是form校验用的,不是不标准的base64,解码后也只是form的内容,所以没有必要解码。 抓取登录页的input里的这些数据后原样提交。 |
14
lincanbin 2015 年 4 月 19 日
不是标准的base64
|
15
zsx 2015 年 4 月 19 日 ASP.NET的WebForm各种神奇的内容挺多的=_=
我记得我的做法是第一次访问时匹配<input type="hidden" name="__XXXX"的隐藏域取出value,然后保存Cookie里所有数据。以后再抓取时,把页面的特殊参数填好后,直接加上这些保存好的数据作为验证即可。 |
16
Septembers 2015 年 4 月 19 日 via Android
@zsx 我当时折腾的时候被这个差点搞疯,检查参数相当多,还要维护很多状态
|