初接触爬虫,按照网上的做法模拟登陆,可是报错显示HTTP Error401,用户名密码是对的,而且用别的网站试的话也能出结果,不知道是不是因为这个是https协议的问题。对这部分不太了解,望各位不吝赐教。
import urllib
import urllib2
import cookielib
filename='cookie.txt'
cookie=cookielib.MozillaCookieJar(filename)
opener=urllib2.build_opener(urllib2.HTTPCookieProcessor(cookie))
data={'identity':'***********','password':'************'}
postdata=urllib.urlencode(data)
#登陆
loginUrl='https://www.space-track.org/auth/login'
result=opener.open(loginUrl,postdata)
#保存cookie
cookie.save(ignore_discard=True,ignore_expires=True)
#利用cookie请求访问另一个网址
gradeUrl='https://beta.space-track.org/basicspacedata/query/class/tle/format/tle/NORAD_CAT_ID/38046/orderby/EPOCH%20desc/limit/1'
result=opener.open(gradeUrl)
print result.read()