Python3.8 Playwright获取当前页面text问题

问题遇到的现象和发生背景

最近了解到微软playwright，去尝试了一下，对比selenium少了手动写代码的过程
但是遇到了一个无法解决的问题，官方文档是英文，大部分工作都是截图与录屏，
我需要解决的是，在自动打开页面之后能像requests.get(url,headers=headers).text的过程，方便后续介入Bs4

问题相关代码，请勿粘贴截图

def run(playwright: Playwright) -> None:
    browser = playwright.chromium.launch(headless=False)
    context = browser.new_context()
    page = context.new_page()
    page.goto("https://www.baidu.com/")
    page.click("input[name=\"wd\"]")
    page.fill("input[name=\"wd\"]", "爱企查")
    with page.expect_navigation():
        page.press("input[name=\"wd\"]", "Enter")
    with page.expect_navigation():
        with page.expect_popup() as popup_info:
            page.click("text=人人都用的企业信息查询平台-爱企查-免费查-专..")
        page1 = popup_info.value
    page1.click("img[alt=\"关闭\"]")
   
    print(page1.text)   # 这里想获取当前页面信息，完成目标
    context.close()
    browser.close()

# with sync_playwright() as playwright:
    # browser = playwright.chromium.launch(headless=False)
    # context = browser.new_context()
    # create a new page inside context.
if __name__ == '__main__':
    with sync_playwright() as playwright:
        run(playwright)

运行结果及报错内容


Traceback (most recent call last):
  File "D:/playwright/pwtest_1.py", line 42, in <module>
    run(playwright)
  File "D:/playwright/pwtest_1.py", line 32, in run
    print(page1.text)
AttributeError: 'Page' object has no attribute 'text'

我的解答思路和尝试过的方法

尝试过使用:
page1.value;
page1.context;
无法获取当前页面text

我想要达到的结果

希望能够获取到当前页面的text，后续尝试使用beautifulsoup进行2次处理，谢谢！
注: 目标页面仅用于测试

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
chen1tian 2022-02-18 17:19
关注
提取html用page.content()
提取文本用page.text_content(selector)

解决 3
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python3.7使用playwright出现问题 python
2023-04-21 09:38

回答 1 已采纳重新安装Playwright：尝试卸载并重新安装最新版本的Playwright。确保你的系统已安装所需的依赖项：Chromium需要一些依赖项才能在系统上运行。可以查看Playwright官方文档以了
XPATH在python selenium中的定位当前节点的子点的问题 html5 python selenium
2020-09-18 10:38

回答 1 已采纳 https://blog.csdn.net/sun_977759/article/details/100989829
如何使用python爬取canvas中的内容呢？ css javascript python
2022-04-29 10:30

回答 1 已采纳需要在浏览器上临时显示后端实时处理的图像，需要将图像数据转成json字符串传输给js绘图。后端python处理： import cv2 as cvfrom encodings import base
深入探索Python Playwright自动化UI测试框架源码
2024-03-25 19:36

项目概述：深入探索基于Python的Playwright UI自动化测试框架本项目致力于深入研究Playwright这一前沿的自动化UI测试框架，采用Python语言进行深入剖析与实践。项目包含35个文件，其中主要包括： - Python脚本...
python中如何将从obs-websocket获得的截图转化为opencv可以操作的图片。 opencv python websocket
2022-09-17 23:48

回答 6 已采纳 python中base64串的长度为4的整数倍，因此长度不为4整数倍的base64串需要用"='补全代码稍微修改了下，你再试试 import obsws_python as obs import nu
playwright打开浏览器很慢 c# python
2022-05-11 10:21

回答 1 已采纳已解决，可能浏览器问题，用自己安装的chrome路径就可以了。
PlayWright怎么判断网页是否有多个元素？ python
2023-03-09 15:19

回答 2 已采纳可以通过PlayWright的querySelectorAll()方法获取所有符合条件的元素，然后判断元素的数量即可。具体实现如下： # 导入PlayWright库 import asyncio f
Python+Playwright自动化测试-环境准备与搭建
2024-08-13 17:20

写代码的啊楠的博客介绍一下Playwright这款自动化神器的相关知识，现在网上的资料太少了。接下来也可能介绍的不全面或者不系统，能力有限望大家理解。免费。
python用selenium打开网址显示whitelabel error page python
2020-12-05 11:08

回答 1 已采纳红框位置这句话元素定位找不到位置，所以程序报错，改成下方我写的这句就可以成功了，成功后的效果见下图
python运行scrapy框架出现报错 NameError: name 'imp' is not defined python
2022-04-28 23:20

回答 7 已采纳如果你不记得改了什么的话，重装吧。毕竟你改了啥，怎么改回去就只有神才知道了。环境里面的.py文件改了的话基本没什么方法，除了重装。按报错来看，playwright, pyee,twisted,win3
playwright 如何针对网页的DIV弹层进行滚动并点击？ python 有问必答爬虫
2022-11-26 17:54

回答 2 已采纳直接requests请求分页获取数据好了（需要附带secret-key请求头） import requests import json #分页模板网址，query为关键字 pageurl='https
linux python3.8源码安装_在linux里安装python3.8.3版本
2021-03-13 07:36

Eileen Tung的博客由于旧版本的linux里安装的是3.5版本，现在官方...下面就来记录一下升级python3.8.3版本的过程。第一步是先安装依赖包：sudo apt install zlib-devel bzip2-devel openssl-devel ncurses-devel sqlite-devel readl...
pycharm导入第三方库错误 python 有问必答
2021-05-14 09:56

回答 4 已采纳报错：No module named 'pandas 解决方式,命令行里安装：pip install pandas
python安装playwright
2022-02-17 17:53

七分辣度的博客 playwright安装： python为3.7以上版本如果没安装python或版本过低，可以去官网下载 python官网链接安装playwright及Chromium、Firefox和WebKit的浏览器二进制文件 pip安装 pip install --upgrade pip pip install...
Playwright for Python：安装及初步使用
2023-09-01 11:19

florachy的博客 Playwright 是一个使用单一 API 自动化 Chromium、Firefox 和 WebKit 浏览器的 Python 库。Playwright 提供的自动化功能始终更新，功能强大、可靠且快速。
离线部署python环境及playwright
2024-01-07 11:53

Mr_yimu的博客离线安装python及playwright
Python playwright自动化入门
2022-06-21 15:46

小牛牛先生的博客简介 Playwright是微软开源的一个UI自动化测试工具。添加了默认等待时间增加脚本稳定性，并提供录制、网络请求支持、...安装环境要求：在Python中要使用Playwright直接用pip命令安装即可，pip命令如下：这些命令下载
【Python】使用 playwright 进行站内死链检查
2024-08-15 11:32

jwensh的博客为什么要用浏览器访问方式来获取页面链接？：能够通过自动化进行检查，为何本次使用了。
Python + Playwright（17）：pytest-playwright 插件的使用
2024-06-04 17:54

blues_C的博客 pytest-playwright是一个集成了pytest和Playwright的插件，它允许我们使用pytest测试框架来编写和执行自动化测试脚本，同时利用Playwright的强大功能来控制浏览器进行网页交互和自动化操作，还允许我们通过 Pytest ...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 12月29日

悬赏问题

¥15 x264库中预测模式字IPM、运动向量差MVD、量化后的DCT系数的位置
¥15 curl 命令调用正常，程序调用报 java.net.ConnectException: connection refused
¥20 关于web前端如何播放二次加密m3u8视频的问题
¥15 使用百度地图api 位置函数报错？
¥15 metamask如何添加TRON自定义网络
¥66 关于川崎机器人调速问题
¥15 winFrom界面无法打开
¥30 crossover21 ARM64版本安装软件问题
¥15 mymetaobjecthandler没有进入
¥15 mmo能不能做客户端怪物