python爬虫初阶问题

import requests
from lxml import etree
with open(" 豆瓣音乐top.txt", "a", encoding="utf-8") as f:
    for i in range(10):
        url = "https://music.douban.com/top250?start={}".format(i * 25)
        headers = {"User_Agent": "Mozilla/5.0(compatible; MSIE 5.5; Windows 10)"}
        data = requests.get(url, headers=headers).text
        s = etree.HTML(data)
        musics = s.xpath('//*[@id="content"]/div/div[0]/div/table')

        for music in musics:
            music_name = music.xpath('./tr/td[2]/div/a/text()')[0].strip()
            music_author = music.xpath('./tr/td[2]/div/p[1]/text()')[0].strip()
            f.write("歌名:{}\n".format(music_name))
            f.write("作者:{}\n".format(music_author))
            f.write("\n")

运行报错
AttributeError: 'NoneType' object has no attribute 'xpath'
怎么解决

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

CSDN专家-天际的海浪 2021-07-13 00:06

关注

你的问题有两个，
一是headers中"User-Agent"里的“-”减号写成 “_”下划线,
二是 musics = s.('//*[@id="content"]/div/div[0]/div/table')中div[0]要改成div[1]

你题目的解答代码如下：（如有帮助，望采纳！谢谢! 点击我这个回答右上方的【采纳】按钮）

import requests
from lxml import etree
with open(" 豆瓣音乐top.txt", "a", encoding="utf-8") as f:
    for i in range(10):
        url = "https://music.douban.com/top250?start={}".format(i * 25)
        headers = {"User-Agent": "Mozilla/5.0(compatible; MSIE 5.5; Windows 10)"}
        data = requests.get(url, headers=headers).text
        s = etree.HTML(data)
        musics = s.xpath('//*[@id="content"]/div/div[1]/div/table')
        for music in musics:
            music_name = music.xpath('./tr/td[2]/div/a/text()')[0].strip()
            music_author = music.xpath('./tr/td[2]/div/p[1]/text()')[0].strip()
            f.write("歌名:{}\n".format(music_name))
            f.write("作者:{}\n".format(music_author))
            f.write("\n")
            print(music_name,music_author)

本回答被题主选为最佳回答 , 对您是否有帮助呢?

查看更多回答(1条)

报告相同问题？

关注问题

python入门爬虫架构代码设计，新手入门通俗易懂
2023-12-14 18:01

本教程将基于描述中的内容，深入讲解如何设计一个初阶的Python爬虫架构，以帮助新手快速入门。首先，我们需要了解爬虫的基本工作流程。一个典型的爬虫主要包括以下几个部分： 1. **HTML下载器(html_downloader.py...
Python爬虫提纲
2023-02-11 13:53

Java-feng的博客 Python爬虫零基础到进阶（课程说明）
Python爬虫入门：7个实用案例带你从零开始（附完整源码）
2025-06-16 17:07

Python_trys的博客作为数据采集的利器，Python爬虫技术越来越受到开发者关注。本文将带你从零开始学习Python爬虫，通过7个由浅入深的实战案例，掌握requests、BeautifulSoup、Scrapy等核心库的使用技巧。requests.get()发起HTTP GET...
【Python爬虫与数据分析】NumPy初阶——数组创建与访问
2023-07-11 22:57

AllinTome的博客 NumPy数组和Python列表的区别： NumPy数组中的所有元素都是相同类型的 NumPy数组效率远高于Python列表 NumPy数组提供了全面的数学函数可以直接对多维数组进行运算二、NumPy数据类型 Python 原生的数据类型相对较少...
python爬虫常用基础程序
2023-04-26 16:37

快乐星球没有乐的博客第1个爬虫程序：main.py第2个爬虫程序：第3个爬虫程序：第4个爬虫程序：第5个爬虫程序：main5.py。
【Python爬虫与数据分析】初阶语法
2023-06-26 15:03

AllinTome的博客目录一、数据类型二、输入输出三、算术运算四、逻辑与条件判断五、循环控制六、函数一、数据类型 Python的数据类型分为常量、数值变量、字符串变量、布尔变量（True、False）常量可以直接参与运算与赋值，...
Python学习路线图_pro 初阶中阶高阶
2022-06-06 18:42

学习Python的路线图可以分为初阶、中阶和高阶三个阶段。 **初阶：预备知识与基础语法** 初学者首先需要了解预备知识，包括计算机基础知识、编程基本概念以及Python的基本语法。在Python中，学习注释、变量、语句、...
Python爬虫案例（多线程+消息队列初阶）
2024-01-24 20:46

€On my way•£的博客基于python的爬虫案例，对网页指定数据进行爬取，多线程、消息队列、正则表达式、python爬虫常见库
python 基于aiohttp的异步爬虫实战详解
2022-09-14 20:13

程序员王炸的博客接下来我们会详细介绍aiohttp库的用法和爬取实战。aiohttp 是一个支持异步请求的库，它和 asyncio 配合使用，可以使我们非常方便地实现异步请求...以上就是借助协程async和异步aiohttp两个主要模块完成异步爬虫的内容，
python基础1
2022-08-03 19:37

list_class = ['基础语法课程', '爬虫分析初阶', '爬虫分析进阶', '自动化办公'] ``` 字典的创建如下： ```python student = {'name': '张三', 'age': 20, 'grade': 85} ``` Python的`for`和`while`循环是控制重复...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 7月13日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 7月12日

python爬虫初阶问题

2条回答 默认 最新

问题事件

2条回答默认最新