乘风的鸟 2022-08-12 15:33 采纳率: 55.6%
浏览 43
已结题

使用BeautifulSoup里的.text

使用BeautifulSoup里的.text报错
问题相关代码,请勿粘贴截图 
import requests
from bs4 import BeautifulSoup
url = 'https://www.shicimingju.com/book/sanguoyanyi.html'
headers = {"user-agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.198 Safari/537.36"}
url = "https://www.shicimingju.com/book/sanguoyanyi.html"
response = requests.get(url=url,headers=headers)
soup = BeautifulSoup(response.content,'lxml')
print("正在请求章节内容")
gettitle = soup.select("#main>#main_left>.book-mulu a").get_text()
for title in gettitle:
    print(title)
C:\Users\Administrator\AppData\Local\Programs\Python\Python310\python.exe E:/编程/python/作品/实验/pycharm项目/爬虫/爬取三国演义.py
正在请求章节内容
Traceback (most recent call last):
  File "E:\编程\python\作品\实验\pycharm项目\爬虫\爬取三国演义.py", line 9, in <module>
    gettitle = soup.select("#main>#main_left>.book-mulu a").get_text()
  File "C:\Users\Administrator\AppData\Local\Programs\Python\Python310\lib\site-packages\bs4\element.py", line 2253, in __getattr__
    raise AttributeError(
AttributeError: ResultSet object has no attribute 'get_text'. You're probably treating a list of elements like a single element. Did you call find_all() when you meant to call find()?


网上几乎没有这样的例子,也没办法得到解决方式
爬取三国演义
  • 写回答

2条回答 默认 最新

  • ポテトエルフ 2022-08-12 15:53
    关注

    bs考虑到一个文档可能有很多个相同的标签,采用下标访问
    解决方法:

    gettitle = soup.select("#main>#main_left>.book-mulu a")[0].get_text()  # 0表示第一个匹配到的元素
    
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

问题事件

  • 系统已结题 8月20日
  • 已采纳回答 8月12日
  • 创建了问题 8月12日

悬赏问题

  • ¥15 帮我调试idea基于spring boot项目
  • ¥15 es 7.17.20版本生成时间戳
  • ¥15 wpf dategrid表头排序图标自定义
  • ¥15 分析下图所示同步时序逻辑电路的逻辑功能。
  • ¥15 halcon联合c#遇到了问题不能解决
  • ¥15 xshell无法连接提示ssh服务器拒绝密码
  • ¥15 AT89C52单片机C语言关于串口通信的位操作
  • ¥20 需要步骤截图(标签-服务器|关键词-map)
  • ¥50 gki vendor hook
  • ¥15 灰狼算法和蚁群算法如何结合