关于网页切换后的获取信息的问题

我用python爬取一些公开的文件，公开文件有提供的下载，这里有2种形式：一种是点击下载附件后切换到pdf文件（新建一个标签），并没有下载，第二种是点击下载附件后直接下载，不切换到pdf文件。其实这两种通过webdriver定位到附件下载click()后都能直接下载（用的chromedriver），但是我还是想针对第一种情况切换到第二个标签（switch_to.windows[1]）,然后获取标签title或current_url，但是切换后运行driver.title或driver.current_url均提示超时300秒。我想可能是因为pdf文件太大，根本加载不上，也就没法获得相应内容了。那么此时我能对第二个标签做些什么呢，哪怕获取一点点信息也行啊，我就是想判断一下第二个标签是个PDF文档而已。谢谢！

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN专家-文盲老顾 2021-11-08 10:46
关注
获得到文件链接地址后，可以用 head 方式请求，这样用时很少，根据响应头可以得到文件信息和文件类型，用 content-type 和文件名来确定文件类型即可，content-length 则是文件大小，另外，可以直接用二进制方式保存，可以直接下载文件，自行设定超时限制即可

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

使用python requests session模拟登录后无法取得网页的问题 http python 有问必答
2021-08-16 09:06

回答 1 已采纳 import requests url_1 = 'http://www.daweilai211.com/Account/Login' headers = { 'user-agent': '
关于使用python实现的网页爬虫程序卡死的问题 python 有问必答爬虫
2021-08-07 13:04

回答 3 已采纳你可以用time模块进行计时，每过10分钟先用os.system()重新打开程序，然后调用sys.exit()关闭旧进程如果有用，希望采纳哦~
python selenium 循环打开关闭网页问题 python selenium 有问必答
2021-04-06 22:52

回答 3 已采纳 import time from selenium import webdriver for i in range(5): wb = webdriver.Ie() #浏览器窗口关闭后要重新创
Python爬虫——Selenium在获取网页数据方面的使用
2023-09-07 16:57

带带琪宝的博客 Selenium 可以实现，它本身是一款自动化测试工具，可以打开浏览器，像人一样操作浏览器，人们可以从 Selenium 中直接提取到网页上的各种信息，因为网页信息对于 Selenium 来说是透明的，其本质就是运行一个浏览器。...
在Python中怎么获取HTML表单提交后的数据 flask python
2022-04-22 06:25

回答 1 已采纳这要写一个完整的后端接口接受数据，可以使用fastapi或者flask快速搭建
python爬虫爬取网页信息问题 python
2019-05-14 08:32

回答 1 已采纳将字符串中空格去掉。
python 用request模块获取网页的时候 css html5 python
2019-04-21 21:06

回答 4 已采纳个人经验以浏览器里面的头信息为上限，宁多勿少
python打开网页后点击网页按钮_单击网页按钮的Python脚本
2020-11-30 13:03

weixin_39976951的博客然后用户切换到web页面并单击一个按钮，该按钮获取一个编辑表单以添加一些附加信息我希望在请求收到状态代码200后，它会立即切换到网页并自动单击按钮，而不是用户每次都手动执行。我研究过硒的使用，但它看起来有点...
能否实现绕开反爬获取网页元素并发送给python chrome python selenium
2021-08-06 16:51

回答 2 已采纳 python监听个服务，比如HTTP啥的然后其他程序获取到数据通过HTTP发生给python，python就可以继续处理了
python爬虫html获取不全 html python 爬虫
2022-06-24 19:43

回答 1 已采纳其实有的，但是这个网站应该是为了懒加载把url用base64密了一下，然后再动态加载，其实我下面发的这个就是url 是base64后的url 解码后就是https://s1.aigei.com/
python中如何自动跳转到一个网页 python 有问必答
2022-05-11 08:42

回答 3 已采纳 url换成对应地址 import webbrowser url= "http://www.baidu.com" webbrowser.open(url)
python 获取浏览器句柄下的网页控件_python webdriver操作浏览器句柄
2021-01-28 23:19

萧璇的博客 self.driver.find_element_by_id("su").click()#点击切换浏览器句柄，根据当前句柄切换句柄，缺点是得知道目标的title是啥 self.driver.switch_to.window(handle) 获得页面元素属性信息的方法 newsElement = self....
Python利用requests爬取网页遇到的payload问题 python 有问必答爬虫
2021-08-13 14:31

回答 5 已采纳网站多少
python实现爬取网页将特定信息存入excel
2021-05-17 16:36

NULL_1969的博客 python爬虫爬取网页将特定信息存入excel 背景 1、最近遇到一个需要进行数据分析的项目，主要是将网页上需要的信息，进行归拢，分析。当信息量少的时候，采用复制粘贴-excel分析还比较快捷方便，当如果数据上升到几百...
python selenium 跳转网页_selenium关于页面跳转
2020-12-04 01:19

weixin_39602571的博客 selenium一种自动化测试...准备工作按照对应平台下载对应版本谷歌浏览器驱动linux下载好linux版本对应驱动后Ubuntu安装　chromedriver:将下载的文件移动到软件应该呆的目录去:sudo mv chromedriver /usr/local/bin...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 11月7日

悬赏问题

¥15 目详情-五一模拟赛详情页
¥15 有了解d3和topogram.js库的吗？有偿请教
¥100 任意维数的K均值聚类
¥15 stamps做sbas-insar，时序沉降图怎么画
¥15 买了个传感器，根据商家发的代码和步骤使用但是代码报错了不会改，有没有人可以看看
¥15 关于#Java#的问题，如何解决？
¥15 加热介质是液体，换热器壳侧导热系数和总的导热系数怎么算
¥100 嵌入式系统基于PIC16F882和热敏电阻的数字温度计
¥15 cmd cl 0x000007b
¥20 BAPI_PR_CHANGE how to add account assignment information for service line

关于网页切换后的获取信息的问题

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新