python爬虫find_all什么都找不到

为什么find_all(string="¥")什么都找不到，换什么字都找不到

from bs4 import BeautifulSoup
import requests

url = "https://buff.163.com/goods/35973"

result = requests.get(url)
doc = BeautifulSoup(result.text, "html.parser")
prices = doc.find_all(string="¥")

print(prices)

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
阿里嘎多学长 2025-02-22 15:16
关注
阿里嘎多学长整理AIGC生成，因移动端显示问题导致当前答案未能完全显示，请使用PC端查看更加详细的解答过程

解答

你使用 find_all 方法来查找 HTML 中的字符串，但是却什么都找不到。这可能是因为 HTML 中的字符串包含了特殊字符或编码。

在 Python 中，字符串默认使用 Unicode 编码，如果 HTML 中的字符串使用了其他编码，可能会导致 find_all 方法无法正确地匹配。

在你的情况中，你可以尝试使用 encode 方法将字符串转换为 UTF-8 编码，然后再使用 find_all 方法：

from bs4 import BeautifulSoup import requests url = "https://example.com" response = requests.get(url) soup = BeautifulSoup(response.content, 'html.parser') string = "¥" encoded_string = string.encode('utf-8').decode('unicode_escape') results = soup.find_all(string=encoded_string)

在上面的代码中，我们使用 encode 方法将字符串转换为 UTF-8 编码，然后使用 decode 方法将编码后的字符串转换回 Unicode 编码。这样可以确保 find_all 方法正确地匹配 HTML 中的字符串。

如果你仍然无法找到结果，可以尝试使用 find_all 方法的其他参数，例如 text 参数，可以指定查找的文本内容：

results = soup.find_all(text=string)

这将查找 HTML 中的所有文本内容包含 string 字符串的元素。
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

Python爬虫源码文件_pachong_python爬虫_python_website_
2021-09-30 09:36

在本压缩包中，"Python爬虫源码文件_pachong_python爬虫_python_website_" 提供了相关的Python爬虫源代码，旨在帮助用户了解和学习如何编写爬虫来抓取网站数据。首先，我们要理解Python爬虫的基本结构。一个简单的...
python爬虫开发_python_
2021-09-28 20:29

Python是一种广泛应用于Web开发、数据分析、人工智能等多个领域的高级编程语言，尤其在爬虫开发方面，Python因其简洁的语法和丰富的库支持而备受青睐。本文将深入探讨Python爬虫开发的相关知识点，包括基础概念、...
爬虫长沙公交_python3_公交站点_python_python爬虫_
2021-10-02 05:33

在Python编程语言中，开发一个爬虫来获取长沙公交站点信息是常见的数据抓取任务，尤其对于数据分析和地理信息系统的研究非常有用。在这个项目中，我们主要利用`requests`库来发送HTTP请求，获取网页上的公交线路和...
第三章：数据解析_Python爬虫教程_源码
2021-10-04 00:06

在Python编程领域，爬虫是一种常见...通过学习以上知识点，你可以有效地解析和处理Python爬虫抓取到的数据，无论是简单的HTML页面还是复杂的XML文档，都能游刃有余。记得在实践中不断探索和优化，提升自己的爬虫技能。
Python编程基础-第14章-网络爬虫
2024-06-15 07:45

通过本章节的学习，我们了解了网络爬虫的基本概念及其工作流程，并学习了如何使用Python语言进行网页的抓取和解析。同时，我们也探讨了网页的基础知识以及如何使用Python发送HTTP请求。最后，我们还讨论了一些常见的...
王者荣耀皮肤图片爬虫_爬虫_python_王者荣耀_
2021-10-01 09:20

在本项目中，我们主要探讨的是使用Python爬虫技术来获取王者荣耀游戏中的英雄皮肤图片。这个项目对于初学者来说是一个很好的实践案例，可以深入理解网络爬虫的基本原理和Python编程技巧。下面将详细阐述相关知识点。...
linkesterm_python爬虫_
2021-10-02 17:56

1. **使用`BeautifulSoup`查找链接**：通过`find_all('a')`可以找到所有`<a>`标签，然后提取`href`属性，获取链接。 2. **正则表达式匹配**：也可以使用`re`库配合正则表达式来匹配URL。 3. **使用`requests`的链接...
tieba_崩坏_贴吧html_python爬虫_
2021-10-03 10:40

最后，关于标签“python爬虫”，我们需要注意Python爬虫在实际应用中需要遵守网站的Robots协议，尊重网站的数据版权，不进行非法数据采集，以免触犯法律。同时，了解并掌握相关的网络爬虫框架（如Scrapy）和反爬虫...
利用BeautifulSoup的find_all()函数查找某个标签且该标签某属性不出现
2020-08-20 12:06

阿智智的博客直到今天，读书籍《Web Scraping with Python》第二版1的85页代码时，发现： downloadList = bs.findAll(src=True) 受启发，可以用到本文场景中。当时书上也没讲解src=True的含义。优雅的解决方案在BeautifulSoup...
python爬虫_爬取百度图片.zip
2023-10-14 12:07

Python爬虫是编程领域中一个热门的话题，尤其在数据挖掘和网络信息收集方面。这篇文档将深入探讨如何使用Python来爬取百度图片，这涉及到网络请求、HTML解析、图像下载等多个核心知识点。首先，要爬取百度图片，...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 2月22日

python爬虫find_all什么都找不到

2条回答 默认 最新

解答

问题事件

2条回答默认最新