乘风的鸟 2022-08-11 16:59 采纳率: 55.6%
浏览 54
已结题

关于#BeautifulSoup#的.text的问题,请问如何解决?

问题遇到的现象和发生背景
import requests
from bs4 import BeautifulSoup
url = 'https://www.shicimingju.com/book/sanguoyanyi.html'
headers = {"user-agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.198 Safari/537.36"}
url = "https://www.shicimingju.com/book/sanguoyanyi.html"
response = requests.get(url=url,headers=headers).content.decode('utf-8')
soup = BeautifulSoup(response,'lxml')
print("正在请求章节内容")
gettitle = soup.select("#main>#main_left>.book-mulu a").text
print(title)

运行结果及报错内容
C:\Users\Administrator\AppData\Local\Programs\Python\Python310\python.exe E:/编程/python/作品/实验/pycharm项目/爬虫/爬取三国演义.py
Traceback (most recent call last):
  File "E:\编程\python\作品\实验\pycharm项目\爬虫\爬取三国演义.py", line 7, in <module>
    soup = BeautifulSoup(response,'lxml').select("#main>#main_left>.book-mulu a").text
  File "C:\Users\Administrator\AppData\Local\Programs\Python\Python310\lib\site-packages\bs4\element.py", line 2253, in __getattr__
    raise AttributeError(
AttributeError: ResultSet object has no attribute 'text'. You're probably treating a list of elements like a single element. Did you call find_all() when you meant to call find()?

Process finished with exit code 1
问题应该出在倒数第二行末尾的.text上,但上网找了很多办法都没有用。听说可能是对象没有实例化,但我实例化了呀。
爬取三国演义
  • 写回答

1条回答 默认 最新

  • 天际的海浪 2022-08-12 19:18
    关注

    soup.select("#main>#main_left>.book-mulu a")返回的是一个列表, 要加[0]访问列表的第一元素的.text
    另外.book-mulu 不是#main_left 的直接子元素 #main_left>.book-mulu>要改成空格 #main_left .book-mulu

    gettitle = soup.select("#main>#main_left .book-mulu a")[0].text
    

    要输出所有章节内容是

    li = soup.select("#main>#main_left .book-mulu a")
    for v in li:
        print(v.text)
    

    你题目的解答代码如下:

    import requests
    from bs4 import BeautifulSoup
    url = 'https://www.shicimingju.com/book/sanguoyanyi.html'
    headers = {"user-agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.198 Safari/537.36"}
    url = "https://www.shicimingju.com/book/sanguoyanyi.html"
    response = requests.get(url=url,headers=headers).content.decode('utf-8')
    soup = BeautifulSoup(response,'lxml')
    print("正在请求章节内容")
    gettitle = soup.select("#main>#main_left .book-mulu a")[0].text
    print(gettitle)
    
    print("循环输出章节内容")
    li = soup.select("#main>#main_left .book-mulu a")
    for v in li:
        print(v.text)
    
    

    img

    如有帮助,请点击我的回答下方的【采纳该答案】按钮帮忙采纳下,谢谢!

    img

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论 编辑记录

报告相同问题?

问题事件

  • 系统已结题 8月20日
  • 已采纳回答 8月12日
  • 赞助了问题酬金10元 8月12日
  • 修改了问题 8月12日
  • 展开全部

悬赏问题

  • ¥15 linux驱动,linux应用,多线程
  • ¥20 我要一个分身加定位两个功能的安卓app
  • ¥15 基于FOC驱动器,如何实现卡丁车下坡无阻力的遛坡的效果
  • ¥15 IAR程序莫名变量多重定义
  • ¥15 (标签-UDP|关键词-client)
  • ¥15 关于库卡officelite无法与虚拟机通讯的问题
  • ¥15 目标检测项目无法读取视频
  • ¥15 GEO datasets中基因芯片数据仅仅提供了normalized signal如何进行差异分析
  • ¥100 求采集电商背景音乐的方法
  • ¥15 数学建模竞赛求指导帮助