python爬虫问题
1、glidesky网站的登录data中的_token的值是如何得来的?
2、glidesky IP屏蔽这道题,直接使用代理访问,headers中不包含cookie时,网页返回的不是我们需要的数据,是如下的显示,感觉像是提示需要先登录,才能访问‘http://glidedsky.com/level/crawler-ip-block-1’;但是一使用cookie,就返回403。
<div class="card-body">
<form method="POST" action="http://glidedsky.com/login">
<input type="hidden" name="_token" value="vGOPR6TPhTbPkFBpmfw31k2QLAJv6sfkb2uF5sOs">
问题2优先。