如何用pyton从谷歌搜索结果中提取总结果数？

import httpx
import asyncio
async def main(keyword: str):
    async with httpx.AsyncClient() as client:
        response = await client.get(f"https://www.google.com/search?q={keyword}")
    return response.content.decode("latin1")

怎么样才能用Python从谷歌搜索结果中提取出总的结果数？
我用Python的httpx库获取到的内容里边没有包含这个结果数。是不是必须使用js 渲染才可以提取呢？谢谢

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

5条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
专家-赤兔[在线] 全栈领域优质创作者 2024-04-11 13:35
关注
引自免费微信小程序：皆我百晓生

要从Google搜索结果页面提取总结果数，你需要解析HTML内容，通常使用BeautifulSoup这样的库来完成。然而，Google使用JavaScript动态加载搜索结果，并且在原始HTML中并不直接显示总数。因此，直接通过HTTP请求获取的HTML可能不会包含结果总数。

如果你想获取准确的搜索结果数量，你可能需要使用Selenium这样的工具，它能模拟浏览器行为，包括执行JavaScript。下面是一个基本示例，展示如何使用Python、Selenium和ChromeDriver来获取Google搜索结果的数量：

首先，确保已经安装了selenium库：

pip install selenium

然后下载并配置ChromeDriver（根据你的Chrome版本选择相应的驱动程序）：https://sites.google.com/a/chromium.org/chromedriver/downloads

接下来是使用Selenium获取搜索结果数量的代码：

from selenium import webdriver from selenium.webdriver.chrome.options import Options from selenium.webdriver.common.by import By from selenium.webdriver.support.ui import WebDriverWait from selenium.webdriver.support import expected_conditions as EC def get_search_result_count(keyword: str, driver_path: str) -> int: # 设置无头模式并指定ChromeDriver路径 chrome_options = Options() chrome_options.add_argument('--headless') # 隐藏浏览器窗口 driver = webdriver.Chrome(driver_path, options=chrome_options) try: # 访问Google搜索页面 driver.get(f'https://www.google.com/search?q={keyword}') # 等待结果计数器元素加载 result_count_element = WebDriverWait(driver, 10).until( EC.presence_of_element_located((By.XPATH, '//div[@id="result-stats"]')) ) # 提取结果数量文本 result_text = result_count_element.text # 解析并返回结果数量 count_str = result_text.split(' ')[-1] return int(count_str.replace(',', '')) finally: # 关闭浏览器 driver.quit() # 使用函数获取搜索结果数量 search_keyword = "your search term" driver_path = "/path/to/chromedriver" # 替换为你的ChromeDriver实际路径 result_count = get_search_result_count(search_keyword, driver_path) print(f"Total search results for '{search_keyword}': {result_count}")

在这个示例中，我们首先创建一个无头的Chrome浏览器实例，然后访问Google搜索页面。接着，我们等待包含结果数量的元素加载完成，然后提取文本并解析出整数结果。注意，这只是一个基础示例，实际使用时可能需要处理更多边缘情况和异常。

另外，频繁地自动抓取Google搜索结果可能会违反其服务条款，所以在实际应用中请谨慎操作。
解决无用
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python 编程猜数字 python
2021-06-28 20:42

回答 3 已采纳 import random v=random.randint(1,100) count=0 his=[] while 1: vi=input("输入猜测值：") count+
pyton类中函数返回值在另一个python文件的调用 python
2022-01-21 20:48

回答 1 已采纳比如你这个文件保存为 test1.py 你的另外一个文件中就可以这样 from test1 import Project p1 = Project() print(p1.tijiao())
电脑正在运行pyton程序时，如果电脑进入睡眠状态？ python
2021-04-04 15:13

回答 1 已采纳接着上次的跑。
使用Selenium爬取动态网页信息【网络通信编程】
2021-12-17 16:31

ww丶121的博客目录一、Selenium简介1.原理2.安装二、网页自动化测试1.打开浏览器并访问百度2.... 比如获取12306票务信息，招聘网站职位信息，财经网站股票价格信息等等，然后用程序进行分析处理。 Selenium 的自动化原理是
求解答，关于词云无法运行，如何解决？(语言-python) python
2022-04-29 21:03

回答 3 已采纳 python中带的字体没有这个，更换成simsun.ttc字体一般位于C:\WINDOWS\Fonts文件夹下。可以查看Python程序中指定的字体是否存在。
pyton 不会做不会做 python
2021-12-11 13:20

回答 1 已采纳 # -*- coding: utf-8 -*- import collections import jieba #分词 def cut_word(text): # 分词：cut_all=
通过pyton 效率的监测游戏画面 python 游戏程序
2022-10-23 09:44

回答 3 已采纳嗯，提供参考链接，期望对你有所帮助：https://blog.csdn.net/ACL_lihan/article/details/104011405【通过Python - Keras来实现实时检测屏
Python语法--Mooc七月
2020-03-30 10:20

「已注销」的博客遇到问题时，随手拿起Python写个工具什么是写代码&Python的基本类型返回什么是代码，什么是写代码代码：现实世界事物在计算机世界中的映射写代码：将现实世界中的事物用计算机语言来描述数字整型与浮点型 ...
刚刚学pyton，请教一个小问题 python
2023-04-19 09:41

回答 4 已采纳第五行最后有不合法的符号，检查一下是不是写了中文符号，或者是不是第5行最后没写冒号：
pyton 实在不会怎么做呀 python
2021-12-11 00:55

回答 1 已采纳 flag = 1 def nsjs(njz): sk_num = 0.0 temp = njz if temp > 200000: sk = (temp
pyton 关于while与break的循环出了bug python
2023-04-19 10:40

回答 2 已采纳第5行替换成第2行的内容，不要break。第6行删掉。
Python快速编程入门#学习笔记02# |第十章：Python计算生态与常用库（附.小猴子接香蕉、双人乒乓球小游戏源码）
2021-08-27 17:47

Naiva的博客学习目标了解 Python计算生态及各应用领域的常用库了解 Python生态库的构建与发布了解 jieba、wordcloud、...Python计算生态涵盖以下多个领域，为各个领域的Python使用者提供了极大便利。应用领域说明
【pyton】tqdm进度条显示问题 python 有问必答
2021-10-31 11:47

回答 2 已采纳可以设置一些参数来调整进度条显示，参考一下这里： python进度条库tqdm详解 - 知乎 tqdm模块是python进度条库, 主要分为
第7课： bs4 库的 BeautifulSoup 基础学习
2020-11-20 23:21

宋哈哈呀的博客这里写目录标题BeautifulSoup 的使用：利用bs4 的 BeautifulSoup 抓取和赛选信息？bs4 的 Beautiful Soup 详细解释： BeautifulSoup 的使用：利用bs4 的 BeautifulSoup 抓取和赛选信息？当我们成功得到网站的反馈...
第一部分使用入门第1章问答环节（可略，总之很万能）
2021-01-15 17:41

一心月的博客人们为何使用Python 软件质量 Python注重可读性、一致性和软件质量。支持软件开发的高级重用机制，例如面向对象（object-oriented,OO）以及函数式编程（function programming） import this The Zen of Python, by ...
bitbake手册
2023-12-09 09:54

power1952的博客了解执行环境中使用的配置文件和类文件的一个好方法是运行以下 BitBake 命令 $ bitbake -e > mybb.log 查看mybb.log的顶部，可以显示在执行环境中使用的许多配置文件和类文件。您需要了解 BitBake 如何解析花括号...
python datetime模块离线安装_Python ImportError：没有名为datetime的模块(Python ImportError: No module named datetim...
2020-12-03 13:18

weixin_39900468的博客 Python ImportError：没有名为datetime的模块(Python ImportError: No module ...ImportError：没有名为datetime的模块我在git控制台中尝试以下代码。>>> from datetime.datetime import strptime我尝试重...
python-对猫眼网的top100的爬取
2018-12-02 13:40

skr爱码士的博客 python我从今年过年开始自学，断断续续的，最近参加了一个爬虫训练营，我发现爬虫对开始学习python是非常合适的，只不过首先得具备一些HTML的知识储备，毕竟爬虫是需要解析网页的。...比如request中的g...
笔记，后期整理
2019-09-29 12:48

weixin_30278237的博客权限文件硬链接数或目录子目录数所有者所属组大小名字 root @localhost: ~ # 当前用户本机家目录（/root）管理员 pentest @localhost: ~（/home/pentest） $ 普通用户家目录：用户默认...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
修改了问题 4月11日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 4月11日

悬赏问题

¥15 目详情-五一模拟赛详情页
¥15 有了解d3和topogram.js库的吗？有偿请教
¥100 任意维数的K均值聚类
¥15 stamps做sbas-insar，时序沉降图怎么画
¥15 买了个传感器，根据商家发的代码和步骤使用但是代码报错了不会改，有没有人可以看看
¥15 关于#Java#的问题，如何解决？
¥15 加热介质是液体，换热器壳侧导热系数和总的导热系数怎么算
¥100 嵌入式系统基于PIC16F882和热敏电阻的数字温度计
¥15 cmd cl 0x000007b
¥20 BAPI_PR_CHANGE how to add account assignment information for service line

如何用pyton从谷歌搜索结果中提取总结果数？

5条回答 默认 最新

问题事件

悬赏问题

5条回答默认最新