python爬虫，etree模块有问题

问题遇到的现象和发生背景

python爬虫xpath

问题相关代码，请勿粘贴截图


import requests

from lxml import etree

url =  "https://movie.douban.com/chart"
head = {"User-Agent": "Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:90.0) Gecko/20100101 Firefox/90.0"}
response = requests.get(url,headers=head).text
tree = etree.HtML(response)
li_list = tree.xpath('//div[@class="pl2"]/a')
fp=open('a.txt','w',encoding='utf-8')
#li遍历li_list
for li in li_list:
    print(li+'\n')
    #把文件写入文件
    fp.write(li+'\n')
fp.close()

运行结果及报错内容


Traceback (most recent call last):
  File "C:/Users/HY/PycharmProjects/pachong/main.py", line 8, in <module>
    tree = etree.HtML(response)
AttributeError: module 'lxml.etree' has no attribute 'HtML'

我的解答思路和尝试过的方法


from lxml import html
selector =  html.etree.HTML(text)

我想要达到的结果

etree没有html部分，有点懵逼

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
天际的海浪 2022-07-02 00:26
关注
你HtML 中T写成小写了, HTML应该是全大写

另外 li 是 Element元素不能与字符串拼接. 需要用li.text获取元素中的文本
print(li+'\n')
fp.write(li+'\n')
应该改成
print(li.text+'\n')
fp.write(li.text+'\n')

你题目的解答代码如下：

import requests from lxml import etree url = "https://movie.douban.com/chart" head = {"User-Agent": "Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:90.0) Gecko/20100101 Firefox/90.0"} response = requests.get(url,headers=head).text tree = etree.HTML(response) #HTML应该是全大写 li_list = tree.xpath('//div[@class="pl2"]/a') fp=open('a.txt','w',encoding='utf-8') #li遍历li_list for li in li_list: print(li.text+'\n') #li是 Element元素不能与字符串拼接. 需要用li.text获取元素中的文本 #把文件写入文件 fp.write(li.text+'\n') #li是 Element元素不能与字符串拼接. 需要用li.text获取元素中的文本 fp.close()

如有帮助，请点击我的回答下方的【采纳该答案】按钮帮忙采纳下，谢谢!
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 1
无用
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python进行爬虫小记
2023-01-15 19:09

Python爬虫技术是一种用于自动化网页数据抓取的编程方法，尤其适合初学者快速入门。Python在爬虫领域具有显著优势，因为其拥有丰富的第三方库，如requests、lxml和parsel等，使得编写爬虫代码变得简洁高效。此外，...
python爬虫网页解析模块及测试案例详解
2024-07-13 16:59

Appreciate(欣赏)的博客【代码】python爬虫网页解析模块及测试案例详解。
Python爬虫某度文档的示例代码.txt
2024-12-14 11:45

在Python编程语言中，爬虫技术被广泛应用于互联网数据的抓取与处理。爬虫通过对网页进行解析，提取特定数据，并将结果进行存储。本次解析的文件内容为一个Python爬虫的示例代码，该代码演示了如何使用Python爬取某度...
【Python网络爬虫案例】python爬虫之爬取豆瓣电影信息
2024-08-04 17:55

左手の明天的博客豆瓣是一个电影资讯网站，用户可以在网站上查找电影信息、评论电影等。我们希望通过爬虫程序获取豆瓣电影的名称、评分和简介等信息，以便进行数据分析或制作推荐系统。
Python xml.etree.ElementTree 模块深度解析
2025-03-03 08:45

tekin的博客模块为 Python 开发者提供了一种简单而强大的方式来处理 XML 数据。通过将 XML 文档表示为元素树，我们可以方便地进行解析、创建和修改操作。该模块支持基本的元素查找和遍历，还提供了简单的 XPath 支持。然而，在...
python爬虫代码开发- 爬图发表情网站爬取案例
2024-05-31 09:42

我们将深入探讨Python爬虫的基本原理，以及如何使用BeautifulSoup（bs4）和XML解析库来实现这一目标。首先，Python爬虫的基础是网络请求和HTML解析。网络请求库如requests能帮助我们发送HTTP请求，获取网页内容。...
python 爬虫框架有哪些？
2024-11-25 08:54

@Python大数据分析的博客 requests 库提供了丰富的功能和灵活性，支持多种请求类型（如 GET、POST、PUT、DELETE 等），...Python中有非常多用于网络数据采集的库，功能非常强大，有的用于抓取网页，有的用于解析网页，这里介绍6个最常用的库。
Python爬虫之协程
2024-01-23 20:08

Az_plus的博客与python中常用的with open操作类似，并且支持异步操作，且与。关键字后面可以定义可等待对象，例如协程对象，Future，Task对象。：接受一个任务集合作为参数，并等待所有任务完成。：接受一个任务集合作为参数，并...
Python有哪些常见的、好用的爬虫框架？
2024-09-09 21:14

@Python大数据分析的博客 Python有非常多的爬虫框架，主要分为三大类。一种是请求库，比如requests、urllib、httpx等，负责向目标网站发送HTTP请求并获取响应数据。Scrapy也属于这个大类，不过Scrapy功能更加完善，可以提供异步网络请求、...
源码：python爬虫爬取网易歌单并以GUI图形化界面显示出来
2021-06-19 16:41

1. **Python爬虫**： Python是爬虫开发的常用语言，因其丰富的库和简洁的语法而备受青睐。在这个项目中，开发者可能使用了如`requests`库来发送HTTP请求获取网页内容，`BeautifulSoup`或`lxml`等解析库来解析HTML或...
【Python爬虫(99)】Python爬虫面试全攻略：从基础到进阶，你准备好了吗？
2025-02-27 13:58

奔跑吧邓邓子的博客本文聚焦 Python 爬虫领域面试相关内容。开篇阐述爬虫技术面试常见考点，如 Python 基础、网络知识、爬虫核心知识等。通过典型面试题，从技术原理、项目经验、代码实现等方面给出解答思路与示例代码。最后分享面试...
python requests模块实习某短视频软件视频爬取
2022-05-26 19:09

总的来说，“python requests模块实习某短视频软件视频爬取”这个课题涵盖了Python网络请求、网页解析、数据提取、反爬策略等多个重要知识点，是学习Python爬虫和网络编程的绝佳实践。通过此项目，学生不仅可以巩固...
6个强大且流行的Python爬虫库，强烈推荐！
2024-09-13 16:01

Python分享馆的博客如果你也想自学Python，可以关注我。我会把踩过的坑分享给你，让你不要踩坑，提高学习速度，还整理出了一套系统的学习路线，这...希望这篇文章对你有帮助，也希望能帮到大家，因为你我都是热爱python的编程语言爱好者。
python爬虫视频教程
2018-03-08 14:38

Python爬虫技术是数据获取和网络自动化的重要工具，尤其在大数据时代，它的价值不言而喻。本视频教程由知名IT讲师崔庆才主讲，专注于讲解基于Python3的爬虫开发，旨在帮助初学者快速入门并提升爬虫技能。在Python3...
Python语言gif图片爬虫.txt
2025-04-10 09:17

1. Python语言基础：Python是一种高级编程语言，其具有易于学习、代码可读性强等特性。在本例中，Python被用于实现网络爬虫，这需要其具备处理网络请求、解析HTML、操作文件等能力。 2. requests库使用：requests库...
python爬虫涉及关键知识点汇总（图片截图）-查漏补缺
2024-01-01 11:21

Python爬虫是编程领域中一个十分实用的技能，主要用于自动化地从互联网上抓取大量数据。对于初学者来说，理解并掌握爬虫的关键知识点至关重要。本文将深入探讨Python爬虫涉及的重要概念和技术，帮助你更好地理解和...
Python爬虫工程师的技术栈
2024-06-20 07:25

极客代码的博客本文的第一部分详细介绍了Python爬虫工程师的技术栈，包括爬虫框架、数据存储、并发处理、异常处理和数据分析等方面。爬虫框架是Python爬虫工程师的核心工具，它提供了数据采集的模板和自动化处理机制。数据存储是...
python语言huochepiao爬虫程序代码QZQ.txt
2024-12-31 23:25

在介绍Python语言编写的火车票爬虫...这段代码展示了一个基本的Python爬虫程序框架，用于抓取火车票信息并存储到Excel表格中。通过模拟浏览器请求、解析网页内容、数据存储等步骤，该程序实现了对指定URL的数据爬取。
Python爬虫全面知识体系
2024-04-17 07:47

极客代码的博客编程基础夯实：奠定Python爬虫开发基石2. 网络协议与HTTP请求的实践探索3. 页面内容解析与数据抽取的艺术4. 动态网页抓取与交互模拟5. 并发与异步编程提升爬虫性能6. 数据持久化与存储策略规划7. 反爬虫策略应对与...
Python24个常用模块，编程学习必备知识库！
2025-10-17 17:02

东眠的鱼的博客编程学习必备知识库
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 7月10日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 7月2日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 7月2日

python爬虫，etree模块有问题

问题遇到的现象和发生背景

问题相关代码，请勿粘贴截图

运行结果及报错内容

我的解答思路和尝试过的方法

我想要达到的结果

1条回答 默认 最新

问题事件

1条回答默认最新