为啥爬虫爬到的内容不对

问题遇到的现象和发生背景

爬虫爬内容的时候，想爬一个电视剧全集的下载地址，可是只爬到一集的地址

问题相关代码，请勿粘贴截图

import re
import requests

#先爬主页面的内容
url = 'https://www.dy2018.com/'
resp1 = requests.get(url,verify=False) #verify = False叫做去掉安全验证
resp1.encoding = 'gbk'


#编写第一份正则提取全部子页面所需的内容
obj1 = re.compile('欧美电视剧.*?<ul>(?P<url_main>.*?)</ul>',re.S)
result1 = obj1.finditer(resp1.text) #提取到主页面内容



obj2 = re.compile("<li><a href='(?P<url_child>.*?)' ", re.S)  #编写第二份正则,为提取子页面url
result2 = obj2.finditer(result1.__next__().group('url_main').strip()) #提取主页面中子页面的url
obj3 = re.compile("◎译　　名(?P<name>.*?)<br />"
                  '.*?<td style="WORD-WRAP: break-word" bgcolor="#fdfddf"><a href="(?P<download>.*?)">', re.S) 
#编写第三份正则，提取子页面中的电视剧名字和下载地址

for i in result2:
    url_child = url + i.group("url_child").strip("/") #获取子页面url
    resp2 = requests.get(url_child)#获取子页面源代码
    resp2.encoding = "gbk" #改编码
    result3 = obj3.finditer(resp2.text) #获取到子页面的电视剧名字和下载地址


    for it in result3:
        print(it.group('name'))
        print(it.group('download'))

我想要达到的结果

想要把一个电视剧的全部下载地址爬下来

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
honestman_ 2022-08-19 18:17
关注
先把你的代码格式搞好再说问题

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

爬虫系统 Python实现后端
2023-08-19 14:44

我开发了一个强大的Python后端爬虫系统，该系统具备以下主要功能：网易新闻爬取：系统可以自动爬取网易新闻上的新闻内容，并将其保存到数据库中。用户可以通过系统提供的接口或界面，快速获取最新的新闻信息。 ...
以Node.js基于express以及爬虫实现的视频资源后端.zip
2024-03-25 17:19

遵守规则：为避免对网站造成过大负担或触发反爬虫机制，爬虫需要遵守网站的robots.txt协议，限制访问频率和深度，并模拟人类访问行为，如设置User-Agent。反爬虫应对：由于爬虫的存在，一些网站采取了反爬虫措施...
慢病爬虫数据管理后端.zip
2024-01-19 17:02

遵守规则：为避免对网站造成过大负担或触发反爬虫机制，爬虫需要遵守网站的robots.txt协议，限制访问频率和深度，并模拟人类访问行为，如设置User-Agent。反爬虫应对：由于爬虫的存在，一些网站采取了反爬虫措施...
Python爬虫与Web后端的深度关联
2025-07-22 20:32

虎王科技的博客是的，Python爬虫和Web后端有关系，主要体现在数据交互和技术互补上。在实际项目中，开发者可能同时掌握这两项技能，例如构建一个数据聚合平台时，后端处理用户请求，爬虫负责从外部网站抓取数据。但要注意，它们...
基于Python的美食内容爬虫课程设计源码
2024-10-01 01:17

这个基于Python的美食内容爬虫课程设计项目是一个综合性较强的编程实践，通过前端技术构建用户界面，并利用Python后端技术实现数据的自动搜集与处理，为开发者提供了一个从理论到实践、从前端到后端的完整学习案例。
基于Django后端与Vue前端的电商比价系统爬虫设计源码
2024-10-01 01:29

这款基于Django后端与Vue前端的电商比价系统爬虫设计，不仅为用户提供了实时、高效的价格比对服务，而且其技术架构和系统设计也为电商行业提供了一个优秀的解决方案参考。随着电商行业的不断发展，此类比价系统将...
爬虫（2）-Flask后端 -接口
2021-12-29 15:47

nightelves11的博客爬虫（2）-Flask后端 -接口存完数据之后，就是通过Python代码将其显示在页面上，并被前端调用，加载到前端界面。这边采用flask框架。大体形式可以参照廖雪峰 Python中 web框架里的flask。代码中先是查询了...
爬虫是后端吗_前端有架构吗？
2020-10-24 21:42

weixin_39707201的博客」问你的人的身份，可能是你的 boss 或上司，可能是后端同事，也可能是前端同行；问你的人的目的，可能是刁难，可能是嘲讽，也可能是请教。前端开发众所周知，做前端开发所依赖的核心技术就是 HTML、CSS 和 JS，就像...
python后端和爬虫_【后端开发】python的爬虫是什么意思
2021-02-10 03:20

瑞士鲁迅的博客 Python爬虫即使用Python程序开发的网络爬虫(网页蜘蛛，网络机器人)，是一种按照一定的规则，自动地抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。其实通俗的讲就是...
历史比价小程序，含前后端，后端为python flask编写包含爬虫内容
2022-06-03 22:21

总的来说，这个历史比价小程序的开发涵盖了从数据抓取到后端逻辑处理，再到前端展示的全过程，对于想要学习全栈开发的初学者或者希望提升技能的开发者来说，是一个很好的实践项目。通过分析和运行该项目的源代码，...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 8月20日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 8月19日

为啥爬虫爬到的内容不对

问题遇到的现象和发生背景

问题相关代码，请勿粘贴截图

我想要达到的结果

2条回答 默认 最新

问题事件

2条回答默认最新