乘风的鸟 2022-08-11 16:59 采纳率: 55.6%
浏览 54
已结题

关于#BeautifulSoup#的.text的问题,请问如何解决?

问题遇到的现象和发生背景
import requests
from bs4 import BeautifulSoup
url = 'https://www.shicimingju.com/book/sanguoyanyi.html'
headers = {"user-agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.198 Safari/537.36"}
url = "https://www.shicimingju.com/book/sanguoyanyi.html"
response = requests.get(url=url,headers=headers).content.decode('utf-8')
soup = BeautifulSoup(response,'lxml')
print("正在请求章节内容")
gettitle = soup.select("#main>#main_left>.book-mulu a").text
print(title)

运行结果及报错内容
C:\Users\Administrator\AppData\Local\Programs\Python\Python310\python.exe E:/编程/python/作品/实验/pycharm项目/爬虫/爬取三国演义.py
Traceback (most recent call last):
  File "E:\编程\python\作品\实验\pycharm项目\爬虫\爬取三国演义.py", line 7, in <module>
    soup = BeautifulSoup(response,'lxml').select("#main>#main_left>.book-mulu a").text
  File "C:\Users\Administrator\AppData\Local\Programs\Python\Python310\lib\site-packages\bs4\element.py", line 2253, in __getattr__
    raise AttributeError(
AttributeError: ResultSet object has no attribute 'text'. You're probably treating a list of elements like a single element. Did you call find_all() when you meant to call find()?

Process finished with exit code 1
问题应该出在倒数第二行末尾的.text上,但上网找了很多办法都没有用。听说可能是对象没有实例化,但我实例化了呀。
爬取三国演义
  • 写回答

1条回答 默认 最新

  • 天际的海浪 2022-08-12 19:18
    关注

    soup.select("#main>#main_left>.book-mulu a")返回的是一个列表, 要加[0]访问列表的第一元素的.text
    另外.book-mulu 不是#main_left 的直接子元素 #main_left>.book-mulu>要改成空格 #main_left .book-mulu

    gettitle = soup.select("#main>#main_left .book-mulu a")[0].text
    

    要输出所有章节内容是

    li = soup.select("#main>#main_left .book-mulu a")
    for v in li:
        print(v.text)
    

    你题目的解答代码如下:

    import requests
    from bs4 import BeautifulSoup
    url = 'https://www.shicimingju.com/book/sanguoyanyi.html'
    headers = {"user-agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.198 Safari/537.36"}
    url = "https://www.shicimingju.com/book/sanguoyanyi.html"
    response = requests.get(url=url,headers=headers).content.decode('utf-8')
    soup = BeautifulSoup(response,'lxml')
    print("正在请求章节内容")
    gettitle = soup.select("#main>#main_left .book-mulu a")[0].text
    print(gettitle)
    
    print("循环输出章节内容")
    li = soup.select("#main>#main_left .book-mulu a")
    for v in li:
        print(v.text)
    
    

    img

    如有帮助,请点击我的回答下方的【采纳该答案】按钮帮忙采纳下,谢谢!

    img

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论 编辑记录

报告相同问题?

问题事件

  • 系统已结题 8月20日
  • 已采纳回答 8月12日
  • 赞助了问题酬金10元 8月12日
  • 修改了问题 8月12日
  • 展开全部

悬赏问题

  • ¥20 java在应用程序里获取不到扬声器设备
  • ¥15 echarts动画效果的问题,请帮我添加一个动画。不要机器人回答。
  • ¥60 许可证msc licensing软件报错显示已有相同版本软件,但是下一步显示无法读取日志目录。
  • ¥15 Attention is all you need 的代码运行
  • ¥15 一个服务器已经有一个系统了如果用usb再装一个系统,原来的系统会被覆盖掉吗
  • ¥15 使用esm_msa1_t12_100M_UR50S蛋白质语言模型进行零样本预测时,终端显示出了sequence handled的进度条,但是并不出结果就自动终止回到命令提示行了是怎么回事:
  • ¥15 前置放大电路与功率放大电路相连放大倍数出现问题
  • ¥80 部署运行web自动化项目
  • ¥15 腾讯云如何建立同一个项目中物模型之间的联系
  • ¥30 VMware 云桌面水印如何添加