scrapy shell 爬dytt8.net遇到的问题

本人菜鸟，初学scrapy，今天心血来潮想爬电影天堂的电影信息及下载地址。。。

scrapy项目，item，rules都写好了，想用scrapy shell 测试下css对不对。。
结果怎么 scrapy shell dytt8.net 都报错。。

scrapy shell dytt8.net 报302

scrapy shell http:\www.dytt8.net 报302

scrapy shell https:\www.dytt8.net 报

twisted.web._newclient.ResponseNeverReceived: [<twisted.python.failure.Failure twisted.internet.error.ConnectionLost: Connection to the other side was lost in a non-clean fashion: Connection lost.>]

用scrapy shell 换user_agent也解决不好。。。一天就搞这玩意了。。。
这是什么先进的防爬手段....求大神解救。。

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
threenewbee 2020-08-02 09:12
关注
302是跳转了，可以抓包看看跳转到哪里，一般来说无非是真正的有数据的地方/让你登录/错误页

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

Python爬虫的scrapy的学习（学习于b站尚硅谷）
2023-08-19 20:18

知乎云烟的博客本文是本人在b站上学习尚硅谷的Python爬虫教程小白零基础速通的，关于爬虫部分后记录的笔记。
python爬虫总结，看这篇就够了
2022-10-30 23:37

sean7777777的博客 python爬虫，全部都在这了
Python爬虫_案例分析（二）
2022-06-28 18:04

敷衍zgf的博客 Python爬虫_案例分析（二）
python-scrapy(爬虫框架)
2022-04-10 00:17

yzhSWJ的博客（1）scrapy是什么？ Scrapy是一个为了爬取网站数据，提取结构性数据而编写的应用框架。可以应用在包括数据挖掘，信息处理或存储历史数据等一系列的程序中 # （1） pip install scrapy # (2) 报错1： ...
用scrapy框架写爬虫
2019-09-27 09:15

aら　淼的博客 # （爬虫）yield scrapy.Request -> 引擎 -> 调度器（发送给调度器入队） -> 引擎（调度器出队请求于引擎） # -> 下载器（引擎发送于下载器） -> 引擎（下载器成功（失败）返回引擎）：-> 爬虫...
尚硅谷爬虫note15n
2025-03-07 10:41

IsRay1999的博客不推荐 scrapy shell 网址，然后进行3）4）的链接提取导入链接提取器： from scrapy.linkextractors import LinkExtractor 3）allow = () 语法 link = LinkExtraactor(allow = r' /book/1188_\d+\.html') \d表示...
尚硅谷python爬虫Scrapy基础
2023-08-31 21:42

aliwa.的博客 b站尚硅谷爬虫学习scrapy
scrapy入门小案例--爬取电影天堂最新电影下载地址
2018-03-27 23:38

爱吃鸡的小螃蟹的博客本文开发环境：ubuntu16.04 + scrapy1.5 + python3.5 + pycharm2017.03 scrapy学习也有段时间了，刚开始也是跟着视屏一点点学习，看着挺简单的，到了动手的时候就不知道如何下手。现在通过一个小案例来总结下如何...
python爬虫基础学习
2020-07-05 12:26

Fally J 幻灵的博客 browser-chrome&val=1|83' req = request.Request(login_url,data=parse.urlencode(data).encode('utf-8'),headers=headers) opener.open(req) #访问 def visit_profile(opener): dapeng_url = '...
零、爬虫基础（通用爬虫）
2020-06-18 15:32

阳阳7的博客 context=respone.read().decode('utf-8') with open(r'E:\Project_python\……\douban.json','w',encoding='utf-8') as fp: fp.write(context) 七、简单封装 1、豆瓣、页面、封装 import urllib.request import ...
没有解决我的问题, 去提问

scrapy shell 爬dytt8.net遇到的问题

1条回答 默认 最新

1条回答默认最新