请问下Scrapy加代理后显示got NoneType的错误

先放下报错信息

# 网站隐藏的以下.请求的url肯定是没出问题

2021-03-03 00:31:22 [scrapy.core.scraper] ERROR: Error downloading <GET https://www.xxx.com/>
Traceback (most recent call last):
File "/Library/Frameworks/Python.framework/Versions/3.8/lib/python3.8/site-packages/twisted/internet/defer.py", line 1416, in _inlineCallbacks
result = result.throwExceptionIntoGenerator(g)
File "/Library/Frameworks/Python.framework/Versions/3.8/lib/python3.8/site-packages/twisted/python/failure.py", line 512, in throwExceptionIntoGenerator
return g.throw(self.type, self.value, self.tb)
File "/Library/Frameworks/Python.framework/Versions/3.8/lib/python3.8/site-packages/scrapy/core/downloader/middleware.py", line 45, in process_request
return (yield download_func(request=request, spider=spider))
File "/Library/Frameworks/Python.framework/Versions/3.8/lib/python3.8/site-packages/scrapy/utils/defer.py", line 55, in mustbe_deferred
result = f(*args, **kw)
File "/Library/Frameworks/Python.framework/Versions/3.8/lib/python3.8/site-packages/scrapy/core/downloader/handlers/__init__.py", line 75, in download_request
return handler.download_request(request, spider)
File "/Library/Frameworks/Python.framework/Versions/3.8/lib/python3.8/site-packages/scrapy/core/downloader/handlers/http11.py", line 88, in download_request
return agent.download_request(request)
File "/Library/Frameworks/Python.framework/Versions/3.8/lib/python3.8/site-packages/scrapy/core/downloader/handlers/http11.py", line 342, in download_request
agent = self._get_agent(request, timeout)
File "/Library/Frameworks/Python.framework/Versions/3.8/lib/python3.8/site-packages/scrapy/core/downloader/handlers/http11.py", line 301, in _get_agent
_, _, proxyHost, proxyPort, proxyParams = _parse(proxy)
File "/Library/Frameworks/Python.framework/Versions/3.8/lib/python3.8/site-packages/scrapy/core/downloader/webclient.py", line 36, in _parse
return _parsed_url_args(parsed)
File "/Library/Frameworks/Python.framework/Versions/3.8/lib/python3.8/site-packages/scrapy/core/downloader/webclient.py", line 19, in _parsed_url_args
host = to_bytes(parsed.hostname, encoding="ascii")
File "/Library/Frameworks/Python.framework/Versions/3.8/lib/python3.8/site-packages/scrapy/utils/python.py", line 106, in to_bytes
raise TypeError('to_bytes must receive a str or bytes '
TypeError: to_bytes must receive a str or bytes object, got NoneType
(base) licongjian@licongjiandeMacBook-Pro jingdongPro $

手动添加代理的时候可以获取到数据.后来在redis的集合中拿到代理以后就出现了这个问题

def process_request(self, request, spider):
    proxy = str(self.redis_db.srandmember('proxy')).replace('b', '')
    request.meta['proxy'] = proxy

此为打印的代理信息与request.meta
{'download_timeout': 3.0, 'proxy': "'https://116.115.210.140:4326'"}
'https://116.115.210.140:4326' <class 'str'>

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
Marst·Zhang 2023-06-12 14:50
关注
这是取值问题. redis默认返回的值是bytes类型的.
解决方法: 连接redis时, 添加参数decode_responses=True
例子如下:
redis = redis.Redis(host=RedisConfig.redis_host, port=RedisConfig.redis_port, db=0, decode_responses=True)

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

Scrapy 设置代理报错 to_bytes must receive a str or bytes object, got NoneType
2022-04-01 09:55

lyhyrc的博客需要在ip地址前设置http://
r语言 python 报错 nonetype write_将Privoxy代理用于Tor时，Scrapy会出现NoneType错误 - python...
2020-12-18 11:16

weixin_39990410的博客我正在使用Ubuntu 14.04 LTS。我尝试了Polipo，但即使我将自己添加为allowClient，也一直拒绝进行解决方案，但它始终拒绝Firefox的连接。...但是，当我使用Scrapy时，出现一个似乎没有人犯的错误……？2016-07-...
Scrapy TypeError: Request url must be str or unicode, got NoneType
2021-12-25 19:06

weixin_50912253的博客源代码是这样的然后就报了下面的错误从打印的new_list中看出了可能错误的原因即多获取了一个None 从需要爬取的网页源码中查看可能是因为div class="fpage"造成的然后修改代码将div全部指向我们想要获取的结果...
Scrapy bug：Spider must return request, item, or None, got ‘list‘ in
2022-11-28 12:18

大桃子技术的博客 scrapy
python scrapy request_python——scrapy中Request参数
2021-01-28 18:38

BioArt植物的博客通常在Spider中创建这样的一个请求，在Downloader中执行这样的一个请求。同时也有一个子类...在Spider中通常用法： yield scrapy.Request(url = 'zarten.com')类属性和方法有：urlmethodheadersbodymetaco...
自学Python第十六天-Scrapy框架创建爬虫
2022-07-08 10:22

runsong911的博客自学Python第十六天-Scrapy框架创建爬虫
Python爬虫5.10 — scrapy框架Download Middlewares[下载器中间件]的使用
2020-04-25 09:59

ZhiHuaWei的博客 Python爬虫5.10 — scrapy框架Download Middlewares[下载器中间件]的使用综述Download Middlewares(下载器中间件)process_request(self, request, spider)process_response(self, request, response, spider)中间件...
python scrapy request_Scrapy详解之Request
2020-12-08 10:18

weixin_39724287的博客作者：Zarten简介：互联网一线工作者，尊重原创并欢迎评论留言指出不足之处，也希望多些关注和点赞是给作者最好的鼓励！...通常在Spider中创建这样的一个请求，在Downloader中...在Spider中通常用法： yield scrapy...
python的scrapy爬虫模块间进行传参_scrapy爬虫:scrapy.FormRequest中formdata参数详解
2020-12-14 17:08

weixin_39921689的博客 1. 背景在网页爬取的时候，有时候会使用scrapy.FormRequest向目标网站提交数据(表单提交)。参照scrapy官方文档的标准写法是：# header信息unicornHeader = {'Host': 'www.example.com','Referer': '...
python爬虫库scrapy_Python爬虫框架之Scrapy
2020-12-23 12:27

澪同学的博客 #-*- coding: utf-8 -*-#Scrapy settings for step8_king project##For simplicity, this file contains only settings considered important or#commonly used. You can find more settings consulting the documen...
没有解决我的问题, 去提问

请问下Scrapy加代理后显示got NoneType的错误

1条回答 默认 最新

1条回答默认最新