for循环后,字典内输出内容没有改变

问题:输出的字典内容没有新增,
每一页的内容都应该保存在字典里,
但字典内容输入一直为第一页的内容.
求帮助!!

import requests
import re
class Dytt_pa(object):
    def __init__(self):
        self.file_dict = {}
    def get_page(self,url='https://www.dytt8.net/html/gndy/dyzz/list_23_1.html'): # 定义缺省url为xxx
        """获取电影列表网页源码"""
        headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/76.0.3809.62 Safari/537.36"}
        req = requests.get(url,headers=headers)
        req.encoding = 'GBK'
        return req.text
    def get_film_link(self):
        """将迅雷下载地址与电影名保存到字典中"""
        file_list = re.findall(r'<a href="(.*)" class="ulink">(.*)</a>',self.get_page()) # 得到25个(半个电影link和电影名)的list
        for film_link,film_name in file_list:
            page_heard = "https://www.dytt8.net"
            film_link = page_heard + film_link # list中的完整的电影link
            film_download_text = self.get_page(film_link) # 电影详情页源码
            xun_lei = re.search(r'<td style=".*" bgcolor=".*"><a href="(.*)">ftp',film_download_text).group(1) # 正则出迅雷下载地址
            self.file_dict[film_name] = xun_lei
    def start(self):
        num = int(input("请输入你要下载几页:"))
        for numa in range(1,num+1):
            print("正在下载第%d页,请稍后"%numa)
            self.get_page(url='https://www.dytt8.net/html/gndy/dyzz/list_23_%d.html'%numa)
            self.get_film_link()
            print("已下载完第%d页."%numa)
        for a, b in self.file_dict.items():
            print("%s|%s" % (a, b))


if __name__ == '__main__':
    woyaoxiadiany = Dytt_pa()
    woyaoxiadiany.start()

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

3条回答

毕小宝博客专家认证 2019-08-29 09:14

关注

由于网络原因，这个脚本没有执行成功，看了一下代码，感觉有疑问的地方：
self.get_page 这个页面爬取操作返回的页面文本内容并没有存储，而是在get_film_link里面又重新请求了一次，此时 URL 可能就是默认的第一页，所以没有其他页的内容。
建议修改逻辑如下：

def __init__(self):
        self.file_dict = {}
        self.pageContent = ''

    def get_page(self,url='https://www.dytt8.net/html/gndy/dyzz/list_23_1.html'): # 定义缺省url为xxx
        """获取电影列表网页源码"""
        headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/76.0.3809.62 Safari/537.36"}
        req = requests.get(url,headers=headers)
        req.encoding = 'GBK'
        self.pageContent = req.text

    def get_film_link(self):
        """将迅雷下载地址与电影名保存到字典中"""
        file_list = re.findall(r'<a href="(.*)" class="ulink">(.*)</a>',self.pageContent) # 得到25个(半个电影link和电影名)的list
        for film_link,film_name in file_list:
            page_heard = "https://www.dytt8.net"
            film_link = page_heard + film_link # list中的完整的电影link
            film_download_text = self.get_page(film_link) # 电影详情页源码
            xun_lei = re.search(r'<td style=".*" bgcolor=".*"><a href="(.*)">ftp',film_download_text).group(1) # 正则出迅雷下载地址
            self.file_dict[film_name] = xun_lei

用一个变量保存每一页的记录，在解析时直接取该变量的值。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

查看更多回答(2条)

报告相同问题？

关注问题

for循环后,字典内输出内容没有改变 python
2019-08-29 07:55

回答 3 已采纳由于网络原因，这个脚本没有执行成功，看了一下代码，感觉有疑问的地方： self.get_page 这个页面爬取操作返回的页面文本内容并没有存储，而是在get_film_link里面又重新请求了一次，
python for循环怎么控制字典从第二个键开始？ python
2022-02-13 17:43

回答 3 已采纳 agent = {'number': '1001', 'agent_name': ['one', 'two', 'three'], 'agent_city': [
python 字典怎么根据关键输出整个字典内容？ python 开发语言
2021-10-31 19:16

回答 1 已采纳 text = '7782&李四&主管&销售部&6000' m = {'no': '工号','name': '姓名','job': '岗位','department': '部门' ,'salary':
python3for循环输出字符串_Python基础3_基本数据类型,字符串,for循环
2020-12-05 23:13

weixin_39756445的博客 python基本数据类型1. int　整数, 主要用来进行数学运算2. str　字符串. 可以保存少量数据并进行相应的操作3.bool　判断真假. True False4. list　存储大量元素用 [ ] 表示5. tuple　元祖. 不可以发生改变用()...
python循环将字典插入列表，前面字典值会被改变 python 有问必答
2021-10-18 16:09

回答 2 已采纳每次循环之前重新让字典为空就好了 n = 2 i = 0 data =[] mydict = {} while n>0: mydict = {} mydict['a'] =
python 循环创建多个字典 python
2021-12-04 16:57

回答 1 已采纳 a = ['oc2P70Ph14EBiLrX3jI-c138f4tg', 'oc2P70Gt9duc-1Km4WE4FbxUsHpU', 'oc2P70MfrRM5lYRVI1d1fthWh3qM'
for循环遍历时字典内容未追加 (对应黑马python从入门到精通第302集) python
2022-04-20 16:55

回答 1 已采纳如果按你的描述，在else后要加 stu_dict["name"] = find_name
python字典换行输出_python字典更新
2020-11-30 09:06

weixin_39856208的博客 python字典类似于java中的map集合，KV类型的数据结构。以下为书中解释字典与列表类似，但是更加通用。在列表中，索引必须是整数；但在字典中，它们可以是（几乎）任何类型。字典包含了一个索引的集合，被称为键...
Python循环赋值给字典赋值出现问题，小白求讲解 python 有问必答
2021-09-29 13:20

回答 2 已采纳 dic1.setdefault(key,dic1.get(key,0)+1)===>改为下面的，因为setdefault是当key不存在时才会设置内容，所以同一个省的设置过一次之后，再有同省份值
for循环去除字典内元素，一直int str报错 python
2023-04-19 08:50

回答 3 已采纳 fruit_price ={"苹果":8.5,"橘子":5.8,"香蕉":4.9,"榴莲":30,"菠萝":5.2} new_fruit_price=fruit_price.copy() #先得到一个
python如何按字典序输出； python
2022-04-06 13:43

回答 1 已采纳 a = {1,2,3,4,5} b = {6,7,8,9,10} vote = {4,7,9,1,2,2,6,2,2,1,6,9,7,4,5,5,7,9,5,5,4} c = a|b yi = vo
python遍历字典与for循环运用方法
2020-08-30 07:04

LuiChun的博客 #遍历字典（前面的为key 后面的为value） c = {"luichun":"大哥","外号":"霸气外露","毕业学校":"清华大学"} print(c.items()) # 返回的是一个键值对列表输出 C:\Users\Administrator>C:\Users\Administrator\...
python将文档中的内容转化为字典输出？ python
2022-01-19 15:40

回答 2 已采纳大概思路就是，按逗号分割后，取第一个：作为分割位置把文本数据贴出来，大家好测试。 data_str = '''url:http://www.csdn.net,name:test,age:20
python字典排序的方法
2021-01-20 06:25

python字典怎么排序？定义一个字典类型 mydict = {2: ‘小路’, 3: ‘黎明’, 1: ‘郭富城’, 4:’周董’} 可分别打印 key和value 看一下数据按KEY排序，使用了 lambda和 reverse= False（正序） key和value都...
python for循环换行_python for循环换行_day08-循环之for循环
2021-01-28 16:37

三脚猫功夫猴的博客 for循环-前言'''1、什么是for循环循环就是重复做某件事，for循环是python提供第二种循环机制2、为何要有for循环理论上for循环能做的事情，while循环都可以做之所以要有for循环，是因为for循环在循环取值(遍历取值)比...
没有解决我的问题, 去提问

悬赏问题

¥15 求解 yolo算法问题
¥15 虚拟机打包apk出现错误
¥30 最小化遗憾贪心算法上界
¥15 用visual studi code完成html页面
¥15 聚类分析或者python进行数据分析
¥15 三菱伺服电机按启动按钮有使能但不动作
¥15 js，页面2返回页面1时定位进入的设备
¥50 导入文件到网吧的电脑并且在重启之后不会被恢复
¥15 （希望可以解决问题）ma和mb文件无法正常打开，打开后是空白，但是有正常内存占用，但可以在打开Maya应用程序后打开场景ma和mb格式。
¥20 ML307A在使用AT命令连接EMQX平台的MQTT时被拒绝

码龄粉丝数原力等级 --

for循环后,字典内输出内容没有改变

3条回答

码龄粉丝数原力等级 --

悬赏问题