关于#BeautifulSoup#的.text的问题，请问如何解决？

问题遇到的现象和发生背景

import requests
from bs4 import BeautifulSoup
url = 'https://www.shicimingju.com/book/sanguoyanyi.html'
headers = {"user-agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.198 Safari/537.36"}
url = "https://www.shicimingju.com/book/sanguoyanyi.html"
response = requests.get(url=url,headers=headers).content.decode('utf-8')
soup = BeautifulSoup(response,'lxml')
print("正在请求章节内容")
gettitle = soup.select("#main>#main_left>.book-mulu a").text
print(title)

运行结果及报错内容

C:\Users\Administrator\AppData\Local\Programs\Python\Python310\python.exe E:/编程/python/作品/实验/pycharm项目/爬虫/爬取三国演义.py
Traceback (most recent call last):
  File "E:\编程\python\作品\实验\pycharm项目\爬虫\爬取三国演义.py", line 7, in <module>
    soup = BeautifulSoup(response,'lxml').select("#main>#main_left>.book-mulu a").text
  File "C:\Users\Administrator\AppData\Local\Programs\Python\Python310\lib\site-packages\bs4\element.py", line 2253, in __getattr__
    raise AttributeError(
AttributeError: ResultSet object has no attribute 'text'. You're probably treating a list of elements like a single element. Did you call find_all() when you meant to call find()?

Process finished with exit code 1

问题应该出在倒数第二行末尾的.text上，但上网找了很多办法都没有用。听说可能是对象没有实例化，但我实例化了呀。

爬取三国演义

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

天际的海浪 2022-08-12 19:18

关注

soup.select("#main>#main_left>.book-mulu a")返回的是一个列表, 要加[0]访问列表的第一元素的.text
另外.book-mulu 不是#main_left 的直接子元素 #main_left>.book-mulu 中 >要改成空格 #main_left .book-mulu

gettitle = soup.select("#main>#main_left .book-mulu a")[0].text

要输出所有章节内容是

li = soup.select("#main>#main_left .book-mulu a")
for v in li:
    print(v.text)

你题目的解答代码如下：

import requests
from bs4 import BeautifulSoup
url = 'https://www.shicimingju.com/book/sanguoyanyi.html'
headers = {"user-agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.198 Safari/537.36"}
url = "https://www.shicimingju.com/book/sanguoyanyi.html"
response = requests.get(url=url,headers=headers).content.decode('utf-8')
soup = BeautifulSoup(response,'lxml')
print("正在请求章节内容")
gettitle = soup.select("#main>#main_left .book-mulu a")[0].text
print(gettitle)

print("循环输出章节内容")
li = soup.select("#main>#main_left .book-mulu a")
for v in li:
    print(v.text)

如有帮助，请点击我的回答下方的【采纳该答案】按钮帮忙采纳下，谢谢!

本回答被题主选为最佳回答 , 对您是否有帮助呢?

编辑记录

报告相同问题？

关注问题

关于#BeautifulSoup#的.text的问题，请问如何解决？ python 爬虫
2022-08-11 16:59

回答 1 已采纳 soup.select("#main>#main_left>.book-mulu a")返回的是一个列表, 要加[0]访问列表的第一元素的.text另外.book-mulu 不是#main
关于#BeautifulSoup#的问题，如何解决？(语言-python) python
2022-11-27 09:23

回答 1 已采纳帮你找了个相似的问题, 你可以看下: https://ask.csdn.net/questions/7538372你也可以参考下这篇文章：python使用beautifulsoup 获取标签,经典笔记
关于#beautifulsoup#的问题，如何解决？ python
2022-04-15 10:38

回答 1 已采纳 pip install beautifulsoup4中间不要有空格
网络爬虫及BeautifulSoup的用法详解
2020-12-21 22:01

网络爬虫及BeautifulSoup的用法详解微信关注公众号：夜寒信息致力于为每一位用户免费提供更优质技术帮助与资源供给，感谢支持！ BeautifulSoup库是解析、遍历、维护“标签书”的功能库。将html，xml等...
使用BeautifulSoup里的.text python 爬虫
2022-08-12 15:33

回答 2 已采纳 bs考虑到一个文档可能有很多个相同的标签，采用下标访问解决方法： gettitle = soup.select("#main>#main_left>.book-mulu a")[0].ge
关于#python#的问题，如何解决？ python 爬虫
2023-03-07 17:40

回答 3 已采纳 “Devil组”引证GPT后的撰写：这个错误是由于文件写入时使用的默认编码为 'gbk'，而 p.text 中含有无法被 'gbk' 编码的字符。可以将文件的编码格式改为 'utf-8'，这样就可以处
关于#网站#的问题，如何解决？ python 有问必答
2021-09-30 21:52

回答 3 已采纳 1.网址错误，应该分别是：lj = "https://www.chenbie.com"url = " 404
章节三：BeautifulSoup
2022-06-21 11:02

退役小学生呀的博客章节三：BeautifulSoup 目录章节三：BeautifulSoup1. BeautifulSoup是什么2. BeautifulSoup怎么用2.1 解析数据2.2 提取数据3. 对象的变化过程4. 本关总结5. 习题练习5.1 习题一5.2 习题二5.3 习题三上一关，我们学习...
tag中提取json提取不出来求解 #python#beautifulsoup python
2020-08-12 14:47

回答 3 已采纳试下下面查找json内容： bs.find(type="text/json").string
请问beautifulsoup里面怎么拼接网址呀？ python 爬虫
2022-01-12 23:15

回答 2 已采纳 import requests from bs4 import BeautifulSoup import time url = "https://www.umei.cc/p/gaoqing/" res
关于#python#的问题：请问怎么用beautifulsoup来解析爬取书名之类的信息呢 python 有问必答
2021-10-06 01:48

回答 2 已采纳你把完整的代码用代码段以文本的形式发一下看看你检查下这个网页中的内容是不是通过js代码读取外部json数据来动态更新的。requests只能获取网页的静态源代码，动态更新的内容取不到。对于动态更新
beautifulsoup以及正则表达式re之间的一些知识！
2020-12-22 13:47

demo = r.text soup = BeautifulSoup(demo, "html.parser") print(demo) print('查找：ID属性为固定值得东西！') print(soup.find_all(href="http://www.icourse163.org/course/BIT-268001")) print('\n') print(s
beautifulSoup4爬虫问题，python简单代码请教一下 python 有问必答爬虫
2022-01-15 17:29

回答 1 已采纳就是获取 soup.find_all("script", type="text/javascript") 返回的结果，取第3个元素的文本。
章节四：BeautifulSoup实践
2022-06-22 09:31

退役小学生呀的博客章节四：BeautifulSoup实践目录章节四：BeautifulSoup实践1. 复习2. 项目：解密吴氏私厨3. 分析过程4. 代码实现(一)4.1 获取与解析4.2 提取最小父级标签4.3 一组菜名、URL、食材4.4 写循环，存列表5. 代码实现(二)6...
BeautifulSoup是什么？如何使用？
2023-01-25 17:18

百态老人的博客 Leonard Richardson有自己的网站，在他的网站上还有他的文章，这些文章主要是关于编程、Web开发和其他技术相关的内容。最后遍历这些标签，使用get()方法获取src属性的值，即图片的链接。最后，我们使用select_one()...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 8月20日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 8月12日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
赞助了问题酬金10元 8月12日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 8月12日
展开全部

悬赏问题

¥15 linux驱动，linux应用，多线程
¥20 我要一个分身加定位两个功能的安卓app
¥15 基于FOC驱动器，如何实现卡丁车下坡无阻力的遛坡的效果
¥15 IAR程序莫名变量多重定义
¥15 (标签-UDP|关键词-client)
¥15 关于库卡officelite无法与虚拟机通讯的问题
¥15 目标检测项目无法读取视频
¥15 GEO datasets中基因芯片数据仅仅提供了normalized signal如何进行差异分析
¥100 求采集电商背景音乐的方法
¥15 数学建模竞赛求指导帮助