做个简单的断点续存,不管offset设置成多少,数据都是从0字节开始,代码如下
import requests
offset = 100000
s = requests.session()
s.headers['Range'] = 'bytes=%s-'%(offset)
res = s.get(url)
做个简单的断点续存,不管offset设置成多少,数据都是从0字节开始,代码如下
import requests
offset = 100000
s = requests.session()
s.headers['Range'] = 'bytes=%s-'%(offset)
res = s.get(url)
在http请求中遇到连接超时导致访问中断的情况时,往往不需要自己来写重访问策略,requests模块中有对应的重访问设置,可以通过设置最大重访问次数,当一次访问失败时,会自动进行重新访问,实现方式(简化)如下:
import requests
from requests.adapters import HTTPAdapter
from requests.packages.urllib3.util import Retry
s = requests.Session()
s.mount('https://', HTTPAdapter(max_retries=Retry(total=5)))
resp_get = s.get(url=http_url, data={'key':'value'})
resp_post = s.post(url=http_url, data={'key':'value'})
可以看到,我们设置最大重访问次数为5。但此时会发现,如果我们使用的是get()方法的话则没有问题,但如果使用post()方法的话仍然会报错。通过查资料发现,python的requests模块使用的urllib3,而urllib3默认对post()方法不设置重访问,因此需要我们手动指定才可以,修改如下:
import requests
from requests.adapters import HTTPAdapter
from requests.packages.urllib3.util import Retry
s = requests.Session()
s.mount('https://', HTTPAdapter(max_retries=Retry(total=5, method_whitelist=frozenset(['GET', 'POST'])))) # 设置 post()方法进行重访问
resp_get = s.get(url=http_url, data={'key':'value'})
resp_post = s.post(url=http_url, data={'key':'value'})
这样再使用requests.post()时几乎不会出现超时中断的情况了!