python爬虫一个小问题

下载出现问题，应该是name|+"zip"这里
可是不知道怎么办啊


```python
import wget
import requests   # 数据请求模块注意版本
import parsel  # 数据解析模块
# noinspection PyUnresolvedReferences
import csv

import csv
from lxml import etree
import csv
import time
from requests import Response






for page in range(2,3):
    print(f'正在采集第{page}页的内容')#提示行
    time.sleep(2)#间隔时间


        # 第一步网址
    url = f'http://www.zhongkao.com/zyk/czlxt/ceyw/index_{page}.shtml'#http://www.zhongkao.com/zyk/czlxt/ceyw/
                    # 第二步伪装
    headers = {
            'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.198 Safari/537.36'
        }#易出昌号前后加引号，不要有空格
    response = requests.get(url=url,headers=headers)
    response.encoding = 'utf-8'
    #print(response)
    selector = parsel.Selector(response.text)#类型转换注意大写转换为selector对象
    #print(selector)
    lis = selector.css('.text_list1 li')
    #print(lis)
    for li in lis:
        wangzhi = li.css('.title a::attr(href)').get()
        response = requests.get(url=wangzhi, headers=headers)
        response.encoding = 'gb2312'
        selector = parsel.Selector(response.text)  # 类型转换注意大写转换为selector对象
        #print(selector)
        pic = selector.css('td a:nth-child(2)::attr(href)').get()
        name = selector.css(' td span::text').get()
        n= name +".zip"
        wget.download(pic, out=n)

```

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

5条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
小小小小人水豚 2023-02-17 09:36
关注
你的原代码拷贝过来执行的话，name返回的是None，也就是说你的选择器没有找到你期望的内容，调试代码修改如下：

注意看打印输出的内容：

所以检查下css选择器的代码是否正确吧

有帮助的话，请点采纳～

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(4条)

报告相同问题？

关注问题

python爬虫有一些小问题 pycharm python 爬虫
2023-03-12 01:58

回答 4 已采纳。。。。你要明白，源文件和查看元素的区别在浏览器里，使用查看元素方式得到的是已经经过浏览器渲染之后的数据而查看源文件，则是真正这个页面返回的数据那么问题来了，你在查看元素时有，但抓取时没有，那么
一个python requests 爬虫遇到乱码的问题 python 爬虫
2022-01-24 15:24

回答 2 已采纳 jsonData='{"\u6d4b\u8bd5": 12345, "\u5185\u5bb9": ["\u6211\u4e5f\u4e0d\u77e5\u9053\u6211\u8981\u5199
一个Python爬虫问题 python
2021-07-05 22:22

回答 6 已采纳请求头里加上hexin-v，
Python爬虫是指使用Python编程语言编写的程序，用于从互联网上获取数据爬虫程序通过模拟浏览器的行为
2024-02-21 00:37

Python爬虫是指使用Python编程语言编写的程序，用于从互联网上获取数据。爬虫程序通过模拟浏览器的行为，自动访问网页并提取所需的数据，如文本、图片、视频等
python爬虫解析html的一个问题 python
2019-04-18 22:45

回答 2 已采纳看上去这些内容是网页本来就有的，爬虫代码没有问题。你可以用正则表达式自己再过滤下。这段内容前面似乎有很多连续的换行，可以作为特征。
python爬虫问题 python 爬虫
2022-10-09 11:41

回答 2 已采纳
python爬虫位置问题 python 爬虫
2023-03-08 13:31

回答 2 已采纳该回答引用GPTᴼᴾᴱᴺᴬᴵ如果您想要提取 div class="detail-context"标签下所有的 tr 标签，并进一步提取每个 tr 中的 td 标签内的内容，可以使用以下代码： impo
Python 爬虫基础网络爬虫、数据采集、Python编程、数据处理
2023-08-12 18:32

资源描述：这个资源是关于Python爬虫基础的教程，旨在帮助初学者掌握如何使用Python编程语言构建简单的网络爬虫，从网页中抓取数据，并进行基本的数据处理和存储。内容概要：教程涵盖了Python爬虫的基本概念、...
怎么通过Python爬虫来制造一个语料 python 有问必答深度学习爬虫
2021-12-02 11:15

回答 2 已采纳你只能通过爬虫去爬取别人发上网的语料，每个自然语言的模块语料格式都不相同，一般官方都会提供
python爬虫html获取不全 html python 爬虫
2022-06-24 19:43

回答 1 已采纳其实有的，但是这个网站应该是为了懒加载把url用base64密了一下，然后再动态加载，其实我下面发的这个就是url 是base64后的url 解码后就是https://s1.aigei.com/
关于使用python实现的网页爬虫程序卡死的问题 python 有问必答爬虫
2021-08-07 13:04

回答 3 已采纳你可以用time模块进行计时，每过10分钟先用os.system()重新打开程序，然后调用sys.exit()关闭旧进程如果有用，希望采纳哦~
Python 爬虫编程从入门到实践
2024-03-11 13:42

爬虫 Python编程从入门到实践
用python做爬虫遇到的问题 python 爬虫
2021-09-11 14:26

回答 2 已采纳
python爬虫学习文档，包含爬虫基础，加密算法，并发编程，逆向等
2024-01-18 10:28

js逆向pic python并发编程pic 加密算法pic 安卓逆向pic 爬虫基础 js逆向.md js逆向案例.md python并发编程.md 加密算法.md 安卓逆向.md
python爬虫实战教学
2021-06-09 13:08

本课程是Tom老师精心准备的关于python爬虫的课程，通过本课程的学习，同学们能够使用python制作自己的爬虫，能够获取互联网上的数据。希望同学们好好学习网络爬虫，通过爬虫获取自己想要的数据并且进行大数据分析
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 2月25日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 2月17日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 2月17日

悬赏问题

¥15 drone 推送镜像时候 purge: true 推送完毕后没有删除对应的镜像,手动拷贝到服务器执行结果正确在样才能让指令自动执行成功删除对应镜像，如何解决？
¥15 求daily translation（DT）偏差订正方法的代码
¥15 js调用html页面需要隐藏某个按钮
¥15 ads仿真结果在圆图上是怎么读数的
¥20 Cotex M3的调试和程序执行方式是什么样的？
¥20 java项目连接sqlserver时报ssl相关错误
¥15 一道python难题3
¥15 牛顿斯科特系数表表示
¥15 arduino 步进电机
¥20 程序进入HardFault_Handler

python爬虫一个小问题

5条回答 默认 最新

问题事件

悬赏问题

5条回答默认最新