python爬虫代码运行输出结果不完整

在pycharm中写的一个小爬虫，最后前面代码运行没有问题，都没有报错，但在最后输出结果时，只能输出电影名（即代码尾部的“movie”），对应的下载链接（尾部的“href”）就是无法输出到屏幕上。为了更直观的体现出来，我在后面增加了“测试”二字，这样更方便看出问题所在。


import requests
import re

url = 'https://www.dy2018.com/'
resp = requests.get(url)
resp.encoding = 'gbk'

#1.提取2021必看热片部分的HTML代码
obj1 = re.compile(r"2021必看热片.*?<ul>(?P<html>.*?)</ul>", re.S)    
result1 = obj1.search(resp.text)     
html = result1.group("html")         # 拿到上面匹配到的href的值，并存储到html

#2.提取a标签中herf的值
obj2 = re.compile(r"<li><a href='(?P<href>.*?)' title=")
result2 = obj2.finditer(html)       #html中的href太多，所以使用finditer

#3.提取下载链接
obj3 = re.compile(r'<div id="Zoom">.*?◎片　　名(?P<movie>.*?)<br />.*?'
                  r'<td style="WORD-WRAP: break-word" bgcolor="#fdfddf"><a href="'
                  r'(?P<download>.*?)magnet:' , re.S)

for item in result2:
    #print(item.group('href'))      #验证代码可以获取到href的值
    #拼接出子页面源代码
    child_url = url.strip('/') + item.group('href')
    child_resp = requests.get(child_url)
    child_resp.encoding = 'gbk'

    result3 = obj3.search(child_resp.text)
    print(child_resp.text)
    '''
    movie = result3.group("movie")
    download = result3.group("download")
    print(movie , download , "测试")
    '''


print("======电影天堂提取完毕======")

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
老衲要还俗娶婆娘 2021-11-20 10:33
关注
不知道你解决了没，我就简单说一下我的解决方法。

obj3 = re.compile(r'<div id="Zoom">.*?◎片　　名(?P<movie>.*?)<br />.*?' r'<td style="WORD-WRAP: break-word" bgcolor="#fdfddf"><a href="(?P<download>.*?)">magnet:', re.S)

你原本的正则表达式，应该就是取出这个链接。我对正则表达式不是太熟悉，就按照我会的改了一下，能提取出来
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python爬虫代码运行输出结果不完整 pycharm python 爬虫
2021-11-20 01:32

回答 1 已采纳不知道你解决了没，我就简单说一下我的解决方法。 obj3 = re.compile(r'<div id="Zoom">.*?◎片　　名(?P<movie>.*?)<br
写完python爬虫后运行不出结果 python 有问必答爬虫
2022-02-15 05:15

回答 3 已采纳数据是动态从接口获取的，在网页中没有办法直接获取，除非用 selenium模块结合浏览器爬取动态数据 # -*- coding:utf-8 -*- import pandas as pd impor
Python爬虫代码运行出错 python
2022-07-01 13:07

回答 2 已采纳 http错误没有正确处理
简单的python爬虫，代码完整
2018-06-21 10:24

本资源提供了一个完整的Python2.7版本的简单网络爬虫代码，旨在帮助学习者理解和实践爬虫的基本原理。首先，我们要了解Python爬虫的基本构成。一个基础的Python爬虫通常包括以下部分： 1. **URL管理器**：负责...
python爬虫代码运行不报错，但是保存到CSV的数据为空，是哪里出了问题 python
2022-08-09 16:38

回答 8 已采纳 respone.text获取的json数据格式有问题,用 json.loads(respone.text)解析出错另外写csv文件的代码要放到for循环外面,所有数据获取之后再一起写入 cit
python爬虫运行没有结果的问题 python 爬虫
2023-02-24 21:28

回答 3 已采纳给你起个头，其它比较容易，一次请求了5000个，多了好像不行，试了9000个都可以，可以分两次 url="http://vip.stock.finance.sina.com.cn/fund_cent
python爬虫爬取到的内容无法输出到txt文档中 python
2022-08-12 12:20

回答 3 已采纳不如换用requests库和bs4库吧。 from bs4 import BeautifulSoup as bs import requests as r url = 'https://fanqie
python爬虫大作业报告+代码
2021-12-30 17:42

所学Python技术设计并实现一个功能完整的系统，并撰写总结报告。要求：（1）实现时需要至少使用图形界面、多线程、文件操作、数据库编程、网页爬虫、统计分析并绘图（或数据挖掘）六项技术，缺一不可。少一项则...
python爬虫运行成功但是数据没有输出 python 爬虫
2023-02-24 11:31

回答 8 已采纳选择a标签的时候错误了，应该是 title_tags = tag.select('a')，这样选择每一个a标签，因为 article_tags = soup.select('.docsum-cont
python爬虫初学，运行不报错但是没有结果？ python 有问必答
2021-04-01 16:51

回答 4 已采纳代码问题：1.request少写了s。 2. fillUnivList(ulist,html)函数没有return。 3.printUnivList(ulist,num)缺少异常处理。 4
python爬虫爬取网页代码遇到了一些问题 python 爬虫
2022-08-17 17:07

回答 3 已采纳因为元素里的你要的内容是通过 ajax 请求动态加载的，可以浏览器抓包去看下，你想要的这条数据到底是哪个请求返回的，找到真正的请求，然后模拟发送就行了
python爬虫代码运行之后不报错也没有结果_看完！一小时带你入门Python爬虫
2020-12-14 13:03

weixin_39615643的博客一、什么叫爬虫爬虫，又名“网络爬虫”，就是能够自动访问互联网并将网站内容下载下来的程序。它也是搜索引擎的基础，像百度和GOOGLE都是凭借强大的网络爬虫，来检索海量的互联网信息的然后存储到云端，为网友提供...
pycharm下爬虫不输出结果不报错 pycharm python
2021-06-30 16:58

回答 4 已采纳可能原因如下：doc内容为空，或者items内容为空，所以for循环没输出。
python爬虫代码运行_怎么运行python爬虫程序
2020-12-16 15:31

weixin_39761696的博客 python爬虫程序运行有两种方式：1、在python交互式命令行下直接输入python代码回车运行；2、在命令行中使用“python 文件名.py”。python运行有两种方式，一种是在python交互式命令行下运行；另一种是使用文本编辑器...
Python爬虫代码示例
2022-02-16 15:24

j狗哥的博客 Python爬虫代码示例
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 12月4日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 11月26日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 11月20日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 11月20日

悬赏问题

¥15 metadata提取的PDF元数据，如何转换为一个Excel
¥15 关于arduino编程toCharArray()函数的使用
¥100 vc++混合CEF采用CLR方式编译报错
¥15 coze 的插件输入飞书多维表格 app_token 后一直显示错误，如何解决？
¥15 vite+vue3+plyr播放本地public文件夹下视频无法加载
¥15 c#逐行读取txt文本，但是每一行里面数据之间空格数量不同
¥50 如何openEuler 22.03上安装配置drbd
¥20 ING91680C BLE5.3 芯片怎么实现串口收发数据
¥15 无线连接树莓派，无法执行update，如何解决？（相关搜索：软件下载）
¥15 Windows11, backspace, enter, space键失灵

python爬虫代码运行输出结果不完整

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新