2 callmeguaishu callmeguaishu 于 2017.01.04 14:22 提问

python模拟登陆显示HTTP Error401

初接触爬虫,按照网上的做法模拟登陆,可是报错显示HTTP Error401,用户名密码是对的,而且用别的网站试的话也能出结果,不知道是不是因为这个是https协议的问题。对这部分不太了解,望各位不吝赐教。

import urllib
import urllib2
import cookielib

filename='cookie.txt'

cookie=cookielib.MozillaCookieJar(filename)
opener=urllib2.build_opener(urllib2.HTTPCookieProcessor(cookie))
data={'identity':'***********','password':'************'}
postdata=urllib.urlencode(data)
#登陆
loginUrl='https://www.space-track.org/auth/login'
result=opener.open(loginUrl,postdata)
#保存cookie
cookie.save(ignore_discard=True,ignore_expires=True)
#利用cookie请求访问另一个网址
gradeUrl='https://beta.space-track.org/basicspacedata/query/class/tle/format/tle/NORAD_CAT_ID/38046/orderby/EPOCH%20desc/limit/1'
result=opener.open(gradeUrl)
print result.read()

1个回答

oyljerry
oyljerry   Ds   Rxr 2017.01.04 16:03

那你需要用浏览器查看一下提交的header等信息,你的https请求,应该有地方不合法,被拦截处理了

Csdn user default icon
上传中...
上传图片
插入图片
准确详细的回答,更有利于被提问者采纳,从而获得C币。复制、灌水、广告等回答会被删除,是时候展现真正的技术了!
其他相关推荐
转载-Python爬虫之模拟登录总结
转载:http://blog.csdn.net/churximi/article/details/50917322 备注:python 2.7.9,32位 有些网站需要登录后才能爬取所需要的信息,此时可以设计爬虫进行模拟登录,原理是利用浏览器cookie。一、浏览器访问服务器的过程:     (1)浏览器(客户端)向Web服务器发出一个HTTP请求(Http request);     (2)We
模拟登陆网站 之 Python版(内含两种版本的完整的可运行的代码)
之前已经介绍过了网络相关的一些基础知识了: 【整理】关于抓取网页,分析网页内容,模拟登陆网站的逻辑/流程和注意事项 以及,简单的网页内容抓取,用Python是如何实现的: 【教程】抓取网并提取网页中所需要的信息 之 Python版 现在接着来介绍,如何通过Python来实现基本的模拟网站登陆的流程。 不过,此处需要介绍一下此文前提: 假定你已经看完了: 【整理】关于抓取网页,分析网页
Python模拟京东登录(附完整代码)
来源:IMyxuan    链接:https://segmentfault.com/a/1190000011978866分析登录的网络请求  打开https://passport.jd.com/new/login.aspx  打开浏览器的调试面板,然后,输入账号密码 =>> 登录,然后看调试面板上面的Network捕捉到的网络请求,如下图:  根据上面的图片,我们可以知道,在我们点击完登录按钮之后
Python爬虫教程——模拟登录
转自:http://zqdevres.qiniucdn.com/data/20130909104208/index.html 前面 我们介绍了如何获取页面的部分内容 和 模拟浏览器发送请求 在前面的部分中 我们发送的请求使用的都是GET方法 在HTTP请求中 还有一种请求方法也很常用 那就是POST方法 GET方法是从服务器获取响应 POST方法是向服务器发送数据 然后接受响应
详解抓取网站,模拟登陆,抓取动态网页的原理和实现(Python,C#等)
详解抓取网站,模拟登陆,抓取动态网页的原理和实现(Python,C#等) 版本:v1.1 Crifan Li 摘要 本文主要介绍了抓取网站,模拟登陆,抓取动态网页相关的逻辑,原理和如何实现。 主要包括: 抓取网页,模拟登陆等背后的通用的逻辑和原理以提取songtaste网页中标题为例,详解如何抓取网站并提取网页内容以模拟登陆百
scrapy爬虫之模拟登录豆瓣
简介 在之前的博文python爬虫之模拟登陆csdn使用urllib、urllib2、cookielib及BeautifulSoup等基本模块实现了csdn的模拟登录,本文通过scrapy模拟登录豆瓣,来深入了解下scrapy。 豆瓣登录需要输入图片验证码,我们的程序暂时不支持自动识别验证码,需要将图片下载到本地并打开以进行人工识别输入到程序中。 分析豆瓣登录 1.分析豆瓣登录页的样式
Python 网络爬虫--简单的模拟登录
和获取网页上的信息不同,想要进行模拟登录还需要向服务器发送一些信息,如账号、密码等等。 模拟登录一个网站大致分为这么几步: 1.先将登录网站的隐藏信息找到,并将其内容先进行保存(由于我这里登录的网站并没有额外信息,所以这里没有进行信息筛选保存) 2.将信息进行提交 3.获取登录后的信息 先给上源码 # -*- coding: utf-8 -*- import requests d
使用Python的Requests包模拟登陆
前段时间喜欢用python去抓一些页面玩,但都基本上都是用get请求一些页面,再通过正则去过滤。 今天试了一下,模拟登陆个人网站。发现也比较简单。读懂本文需要对http协议和http会话有一定的理解。 注明:因为模拟登陆的是我的个人网站,所以以下代码对个人网站和账号密码做了处理。网站分析爬虫的必备第一步,分析目标网站。这里使用谷歌浏览器的开发者者工具分析。 通过登陆抓取,看到这样一个请求。
Python模拟登录多种实现方式
Python模拟登录多种实现方式 基于Python 3.6 #coding:utf-8 import sys import io import urllib.request import http.cookiejar ################## 第一种登陆方式 ################## ################## 直接使用已知的cookie访问
httpclient模拟登陆CSDN
目录(?)[+] 工具介绍步骤分析如何简单快速使用HttpClient模拟登陆实战题外话 工具介绍 本篇文章主要是讲解如何模拟登陆CSDN,使用的工具是HttpClient+Jsoup 其中HttpClient主要是负责发送请求,而Jsoup主要是解析HTML 你可能对HttpClient的API不太了解,不过没关系,往下看就好了~ Jsou