能否实现绕开反爬获取网页元素并发送给python

网页反爬机制比较厉害，尝试selenium＋mitmproxy也破不了。网页是socket发送信息的。
逻辑很简单，我的目标是直接获取网页加载完毕后某个时点的页面信息然后发送到python中处理。

现在通过chrome的 web scraper插件，可以获取到相关信息，但是爬到的数据只能下载到电脑中再进行处理。有没有办法能直接发送至python中？
此外，通过mitmproxy可以获取到socket发送的信息，但是解析太困难了，有没有办法通过mitmproxy或其他工具直接获取页面elements，就是最表明的东西，不需要深层次的socket信息。

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
咕泡-三木 2021-08-06 17:24
关注
python监听个服务，比如HTTP啥的
然后其他程序获取到数据通过HTTP发生给python，python就可以继续处理了

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

能否实现绕开反爬获取网页元素并发送给python chrome python selenium
2021-08-06 16:51

回答 2 已采纳 python监听个服务，比如HTTP啥的然后其他程序获取到数据通过HTTP发生给python，python就可以继续处理了
手机可以在不使用浏览器的情况下实现浏览网站吗？其他
2022-03-29 15:01

回答 2 已采纳你在"我的电脑"的地址栏输入网址后回车,其实也是打开的网页浏览器,相当于你把网址保存成了一个快捷方式,然后双击打开这个快捷方式一个效果,它并不能在资源管理器中直接浏览网页。手机上也有类似的操作,但不同
越界和排序逻辑问题（洛谷P1059） python
2022-09-18 10:04

回答 2 已采纳不用那么麻烦，你可以将列表转为集合set()这样就可以去重了，然后将集合转为列表，并进行排序。越界很可能是因为你用了remove() n = int(input()) num_list = input
python并发访问list_python并发 1：使用 futures 处理并发
2020-12-21 10:19

weixin_39634067的博客作为Python程序员，平时很少使用并发编程，...现在这一篇还是《流畅的python》读书笔记，译者在这里把future 翻译为“期物”，我觉得不太合适，既然future不能找到一个合适的词汇，暂时还是直接使用 future 吧。co...
如何同时实现【用户刷新页面后不需要重新登录】与【游客无法通过控制台来绕开登录系统】？ html javascript php 有问必答
2021-11-20 12:43

回答 1 已采纳通常在本地记录用户信息，不管是 localStorage还是cookie，用户信息都应该分两部分，1部分，用户的身份，比如id，比如用户名，比如手机号之类的，总之是唯一值的那种，另1部分，则是对这个部
CSS设置时，位置POSITON被禁止，如何绕开禁止设置？ css javascript
2023-02-13 20:44

回答 2 已采纳回答不易求求您采纳点赞哦感激不尽您可以通过更改位置属性的值来解决这个问题。默认的位置属性是 "static"，但它不支持设置 "right" 属性。因此，您需要将位置属性设置为 "relat
当第一个完成时如何安全绕开其他goroutine的结果
2015-11-04 16:15

回答 1 已采纳 My recommendation would be to make ch a buffered channel with one space per query: ch := make(chan
Python 并发系列 2 —— 各种并发方案的选择
2019-12-12 16:33

dfsj66011的博客二、异步 Python：不同形式的并发翻译自：Async Python: The Different Forms of Concurrency 随着 Python 3 的出现，我们听到了很多关于“异步（async）”和“并发（concurrency）”的讨论，人们可能会简单地...
link中能绕开事件直接调用它对应的函数么？请问怎么调用？不想调用事件。
2015-04-24 09:41

回答 1 已采纳 http://www.cnblogs.com/icyJ/p/Reflection.html
在谷歌浏览器上登录一个网址，怎么才能跳过输入用户名和密码这步 windows 有问必答
2022-04-04 23:00

回答 6 已采纳可以选择自动登录不用手点，或者保存cookies下此打开用，在考虑cookies失效的情况下，自动登录这个方法性价比最高。比如定位到用户名输入框，一般是html的input标签，用selenium
两台家庭无线路由器分别使用两个网段，使用副路由器网段的PC能Ping通使用主路由器网段的PC，反过来不行？开发语言
2020-03-31 11:52

回答 2 已采纳两台路由器都开了dhcp吗？
python处理并发_Python通过future处理并发问题
2020-12-21 02:28

weixin_39778393的博客如：Executor.submit()方法的参数是一个可调用的对象，调用这个方法后会为传入的可调用对象排定时间，并返回一个 future 客户端代码不能应该改变future的状态，并发框架在future表示的延迟计算结束后会改变期物的...
如何绕过网页（不通过浏览器）直接进行提交等操作 ajax javascript
2009-08-22 13:19

回答 3 已采纳你可以参考一下[url]http://laohuang.iteye.com/blog/55613[/url] 以及HttpClint的文档[url]http://hc.apache.org/http
python并发_Python并发（一）
2020-11-28 16:32

weixin_39797758的博客假设我们要从一个网站用Python程序下载5张图片，最传统的思路就是写个for循环挨个挨个下载，但是这样做有个缺点，就是除了第一张，每张图片都必须等待前一张图片下载完毕后，才可以开始下载。由于网络有很高的延迟，...
python处理并发,Python 使用期物处理并发
2021-04-27 04:13

特大号先生的博客示例：网络下载的三种风格为了高效处理网络 I/O，需要使用并发，因为网络有很高的延迟，所以为了不浪费 CPU 周期去等待，最好在收到网络响应之前做些其他的事。为了通过代码说明这一点，我写了三个示例程序，从网上...
Python 使用future处理并发
2021-01-23 21:53

蜉蝣之羽，衣裳楚楚的博客 Python标准库的两个Future 1. concurrent.futures.Future 2.asyncio.Future 这两个类作用相同，都表示可能已经完成或尚未完成的延迟计算。 future封装待完成的操作，可以放入队列，完成的状态可以查询，得到结果后...
来点干货：Python并发编程探究（面试挂在这了55555）
2021-02-22 23:10

QinZheng7575的博客使用threading模块来进行新线程的创建，如果默认情况下的话，是会守护子线程的，也就是，哪怕主线程已经结束了，子线程没有退出，python的解释器就不会退出： import time from threading import Thread def ...
python并发系列之一：使用 “futures” 处理并发
2020-12-30 14:18

49.99%的博客本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理想要学习Python？有问题得不到第一时间解决？来看看这里，满足你的需求，资料都已经上传至...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 8月16日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 8月8日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 8月6日

悬赏问题

¥20 机器学习能否像多层线性模型一样处理嵌套数据
¥20 西门子S7-Graph,S7-300，梯形图
¥50 用易语言http 访问不了网页
¥50 safari浏览器fetch提交数据后数据丢失问题
¥15 matlab不知道怎么改，求解答！！
¥15 永磁直线电机的电流环pi调不出来
¥15 用stata实现聚类的代码
¥15 请问paddlehub能支持移动端开发吗？在Android studio上该如何部署？
¥20 docker里部署springboot项目，访问不到扬声器
¥15 netty整合springboot之后自动重连失效

能否实现绕开反爬获取网页元素并发送给python

2条回答 默认 最新

问题事件

悬赏问题

2条回答默认最新